导读:透明求真,是我们做数据产品的产品经理的基本价值观。移动时代,在流量快速变现的利益驱动下,“刷刷刷”的造假行为越发猖獗,流量造假形式和技术手段也越发高级。无论什么形式的作弊,最后损失最大的永远都是为流量买单的“广告主“。移动营销时代,流量作弊的方式有哪些?广告主应该如何识别是否遭受了虚假流量的坑害?又该如何杜绝和应对虚假流量,减小损失?《RTBChina》特约反作弊专家AdMaster首席产品官邬剑,现身经验解读移动虚假流量的辨别和杜绝。
上一篇和大家分享的文章『你的广告预算如何被白白吞噬?』,不少业内朋友反馈说写得太温柔,不够『暴力』。与负面现象的博弈,需要有人经常跳出来,谈谈这些负能量的危害,说说皇帝的新衣,这样行业才能健康发展。这篇内容的力度将从“暴力”入手,将我在AdMaster过去五年时间里,沉淀的很多移动数据反作弊的实战经验,扒一扒抖一抖,希望能够促进行业的良性发展,透明公平。
为什么可以刷刷刷 ?
我们一直简单地以为传统 PC 时代,IP、Cookie、User-Agent 很容易刷,到了移动领域,设备信息很难刷。事实却并非如此,不仅移动的设备信息容易且批量地刷,而且被识别出来的难度更高,更像真的一样。
移动流量作弊形式的主要形式:
刷广告数据:
首先就是刷广告曝光和广告的点击了。之前文章已经提到过,移动应用内作弊可以让一个被控制用户每小时创造 700 次不可见曝光,每天可以控制成千上万的中毒肉鸡刷曝光或者点击。
刷广告数据只是基础
如今 Android 生态下的数亿手机,不比当年的 Windows XP 时代好。在用户不知情下,预装或者下载了乱七八糟的应用的情况比比皆是,中个小病毒或木马,被各种流氓软件留些后门已是常态,顺理成章地为黑色产业链做贡献。移动广告的销售更加的程序化,按 CPM 与 CPC 的销售是主流。在这样的大环境下,按 CPM 与 CPC 购买的流量质量风险如何?可想而知。
刷下载,激活与留存:
除了积分墙、搜索优化冲榜等这种 APP 广告主自发的刷下载行为之外,不少广告主还是花了大价钱在不同的广告平台、应用市场、明星 APP(HeroAPP)上做转化为导向的推广的。
既然 KPI 是下载量、激活量,那『刷子』们当然有非常多的办法去冲 KPI。即使要求高的留存,也是可以实现的哦!
留存轻松『刷刷刷』
现在的行情还是很『规范』透明的,为了刷传统的分析统计工具数据表现,实现 App下载成本在 0.2~0.8元;设备激活大概 0.3~1元;设备激活+留存,一般需要1~1.5元。
而且有一些平台已经开放注册使用了,从此刷量也已不再是难事,人人都可是刷子,真是『与民同乐』。
APP 刷量,你也可以!
虚假流量如何刷出来?
刷量的基本原理非常简单,就是不断变更设备信息,实现模拟行为,批量造成想要的流量。
设备伪装,主要通过篡改设备ID号 或者 使用模拟器等进行,并伪造虚假的网络环境。现在已经可以实现移动设备 ID (MAC、IMEI、IDFA、Android ID)不重复、IP 地址离散、机型变换、时间分散。包括:手机不 Root、不越狱也可以伪装。当然这一领域主要是集中在 Android 系统上,iOS 系统伪装成本高很多。
一系列的黑产工具可以实现以下功能:
初级手段:找一些人工在程序辅助下重复安装,或者控制一些木马注入的设备实现刷量。
在刷安装、激活、留存,甚至是过任务中
中级手段,有技术含量,常见的手段有:
API Hook,通过篡改公用的 API 执行结果,使原本不可篡改的设备 ID 以及设备型号等信息。实现轻松一台设备伪装成无法轻易识别的多个设备。
自动化点击脚本,模拟用户行为操作。一个专业的刷榜机构,可以完成任何 APP 上所有的用户行为。
这些都是常使用的刷量手段,十有八九,你现在的流量中就有可能中招。
高级手段,技术高能,门槛很高:
定制开发模拟器,不需要移动设备也可以伪装成批量的设备。低硬件成本,扩展性高。但技术门槛非常高,需要对 iOS 或者 Android 操作系统硬件层有一定建树。
反编译监测 SDK 的代码,了解统计逻辑,目前最典型的受害者为诸多开源的 SDK。这基本上,想要什么数据表现,任意生成即可。
如何应对移动流量作弊现象?
在AdMaster做移动归因与反作弊产品的这几年,团队花了大量的时间通吃黑白两道 。我们曾花钱买假流量,用我们的归因产品ConversionMaster去测试这些假流量是否能通过我们的 AdShield™反作弊系统。知己知彼,不断验证才能实现反作弊的最高追求。
由于涉及到很多反作弊的保密机制,就简单粗略介绍一下方法论。
首先,硬件指纹识别,几乎是所有移动分析与监测工具必须攻坚与持续投入的。单一 ID 容易被刷,但是指纹ID,往往是通过多个 ID 与因素混合而成,越复杂,混合得因素越多,越难彻底刷机,从而可以识别单一设备。市面上每一家的方法和策略不同,所以效果不一样。虽然形式简单,但是需要投入大量数据验证有效性以及可行性。
其次,行为+设备分析。通过经验,长期数据分析经验,构建设备属性、IP属性、设备黑名单库,像一个过滤引擎,将不符合正常逻辑的设备与行为进行过滤。
最后高级手段,通过异常行为模型训练。通过积累多样的设备以及行为特征,构建对应的设备健康度评分。从而能将健康度评分,较为异常的部分过滤。需要通过机器学习等方式,打磨出有效的概率模型进行支持。
反作弊是一项任重而道远的行业责任,后续我将陆续和大家分享AdMaster在反作弊方面的技术经验和观点。也希望能联合更多行业合作伙伴,共同对抗这一行业难题和挑战。