[编译] 我曾经以为公司保证算法优异却不提供任何细节就的时代已经过去。如AppNexus或DataXu这些公司用于优化数字媒体的算法都是透明的。然而,我仍然能听到有些人推销包治百病的“黑盒子”算法。
虽然很想让这个辩论告一段落,却又不是那么容易。例如,研究这一块时,我发现,一个数据科学家所认为的最佳算法的正确解决方案,另外三人会声称是错误的并提出一些不同的方案。
为了抛砖引玉,以下我给出了几个被认为是常识的不同角度看法。我不是数据科学家,但你不需要是数据科学家来理解你买的东西。这是为你们写的:试图理解大数据意义的媒体买家和客户方的营销人员,以及希望将复杂分解得更为简单的媒体销售代表。
样本大小基础知识
对于初学者来说,重要的是要明白,任何算法必须对给定的变量组合有足够的数据来决定它的价值。例如,你不会采用只有一个人的调查来预测全国大选,因为这个样本量太小了。在一场至少有两位总统候选人的竞争中,如果你假设有1亿8千万登记选民,并希望3%的误差幅度和95%的置信水平,根据这个样本量计算你需要1,067个样本。这个样本量是足够的,因为更有优势的候选人可以赢得51%的青睐,而另一位赢得46%的青睐,还有一些未知。在3%的错误幅度下,即使这个调查做了数百次,有51%青睐的候选人会有95%的机会获得介于48%和54%之间的选票。假定95%的置信水平,误差幅度像如下钟形曲线图这样移动:
好吧,也许数学不是你喜欢的科目,但不要被吓倒。要理解上面的图,只要注意这些曲线在较低的错误幅度时重合度较高。这就意味着你的数字的准确性可能更高。
但是,如果有500个有效候选人,并且没有谁拥有更为明显的青睐?最有优势候选人仅有0.8%青睐,最低是0.02% 。有这么多条线,甚至上面2%的曲线也很难确定各候选人差距有多大。因此,你可能需要增加样本量。
下面就是将这个故事转换为数字展示或视频广告程序的情况(移动则有些不同) 。
五百个竞争者或36亿数值组合
在一个典型的RTB广告活动中, 运行在一个随机的新闻网站上的50,000次展示产生0.1%的转换率,目标是达到0.08%的转换率。这相当于共50个转换。不过,如果你再深入研究,你发现50次转换中的48个发生在早上7点到10点之间。在这48个中,35个发生在星期一。在这35个中,27个来自于Windows 7操作系统(OS )的机器。你可以看到这是如何迅速地展开,并且增加更多的变量就可以展开得更深。
这里的关键总结是,作为一个单独的变量,这种随机的新闻网站并不一定是一个很好的网站。但它可以很好,在某些时候,或某些日子,与某些其他变量一起应用。
在决定媒体购买的时候,你需要考虑多少变量和结果?下面是来自于我的真实案例的保守数字。
一日 24小时
一周 7天
浏览器 6
设备 3
操作系统 4
网站 10,000
广告尺寸 3
人群分类数据 10
广告创意 1
总的独特组合 3,628,800,000
对的:超过30亿个独特的组合可考虑 – 这还是保守的。在实际操作中更多见的可能是面对50,000个网站, 20个人群分组数据,等等,这将使数字大得多。
我作为一个广告专业毕业生,没有受过统计的正统培训,于是咨询了两位专业的统计人员。他们建议了以下的一些技巧,以确保我使用他们行业内的最佳实践。
有两种方法来看这个问题:我们可以“向前预测”样本的大小,如前面的总统大选为例,或“向后看”,因为这是我们已经有数据的一种情况,假设媒体购买已经启动。当向前预测,由于这么多的独特组合,很可能数以百万计的组合将聚成一团,提升0.001%的效果。让我们回到那个样本大小的计算器,当有2.14亿网民,为实现0.001%的误差幅度,你的样本大小需要将超过2.09亿。在知道什么有效、什么无效之前,这可是很多“样本”。但是,这真的感觉不对。因此,让我们“向后看”。
要向后看,我们得确定,每个独特组合值需要多少“观察”或展示,以获得统计上有效可信的决策。根据一大堆令人昏昏欲睡的网上聊天论坛的讨论,有一些情况只需要10个观察值即可,而有些则需要30或40个观察值才被视为合理。即使10观察或展示是足够的,你每次正在进行的广告投放活动有362亿的展示?这肯定是行不通的,所以也许是时候放弃所谓理解每一个独特、详细组合。
算法只要比人力使用Excel好就行
是的,完美的算法理论上应该探讨变量的每个组合。但上面的例子证明了这太不可能,而且没有算法是完美的。相反,我们并不需要一个只着眼于一个单一变量的算法。一个人可以用Excel中的“排序”功能做到这一点。回到我们随机的新闻网站,比如说该算法每次着眼于仅仅两个变量,如网站和数据段,浏览器和一天的小时数,或网站和星期几。我们可以认为某些变量比其他变量更重要,但我们这是在讨论在盒子里的魔法。当然这可以一次计算任意两个变量。
要做到这一点,我们需要这些变量值每个配对的总数。将网站数量减至1000来进一步证明这一点,我很想告诉你我知道算这个的公式,但我用了三分钟在Excel中将每列相乘,得出了59,284个独特的配对。
你会记得有些统计人员建议每个组合10个观察值或展示就足够了。你会优化掉10个展示吗?甚至100个?既然我们想更现实,但仍然保守,我们用每个组合1000个展示。现在,我们需要得到59,284,000个展示以保证每对数据都是好的。用一个更现实的级别如每个组合5000次,则需要超过2.95亿个展示。你们中有多少人正在用这种类型的购买 - 与一家供应商,在一个广告投放活动中?
频次
与盯着上述所有媒体变量相比,可能调整我们的观点到关注用户上更容易。该算法是要针对用户优化而不是媒体变量如网站,一天中的时间,等等。要做到这一点,我们需要看一下频率。回到 “观察值”的概念,研究表明10实际上是一个可行的数字。我们已经看过成千上万的活动,看到每月8-12次展示的频率是需要的,然后结果会降低效率。 好吧,是时候了:现在是常识性的直觉检查时间。
如果你需要给每个用户大约10个展示,然后才能知道是否要优化对该用户的购买,你已经给了该用户进行转化足够的展示次数,如果转化会发生的话。现在再针对该用户优化已没有意义,你已经知道结果了。
总结
现在你可能会问算法的目的到底是什么。这篇文章的目的不是要对任何特定算法挑刺,而是对盲目认为任何数字媒体算法都有魔术般的效果的说法提些其它看法。
如果你正在与一个供应商执行5万美元购买,在决定交给说他们有一个算法的人之前,考虑一些时间,做做数学题。一个好的算法应该是透明的。供应商应该告诉你他们何时可以提高效果,何时不能,因为确实没有足够的数据。
他们应该愿意提供数据给你,如果你想查看数据或自己做决定。如果我看起来像乔治·克鲁尼并想找个约会,我不会用一个袋子套在我的头上出门。那些对他们的产品有自信的公司,会展示其产品并不带保留地回答你的问题。
Via:AdExchanger.com