从央视到谷歌:聊一聊竞价广告的机制设计
关于竞价广告,很多人有两个极端的看法——第一观点会认为竞价广告非常简单,不就是央视每年黄金广告位招标么,谁出价高广告位给谁;
第二个极端会认为竞价广告过于复杂,涉及到到博弈论、机制设计、拍卖理论、CTR预估等普通人根本弄不明白高深理论,因此很多人对此望而却步.........
然而真相到底是神马?哪一个观点是对的?一直致力于用简单语言剖析互联网商业底层逻辑的卫夕会告诉你:
真相就像《小马过河》的结局一样:河水既不像黄牛说的那么浅,也不像松鼠说的那么深——竞价广告的基本逻辑当然会涉及到很多复杂理论,但看完这篇文章大部分人可以轻松理解其核心原理的来龙去脉。
一、从央视标王到谷歌的竞价广告系统
关于竞价广告,很多人认为百度是国内推出第一个竞价广告的公司,事实上,从更广泛的意义上,央视的黄金广告竞标更早地向大家普及了“竞价广告”这个概念,早在1994年,央视就开始了以竞价的方式拍卖广告位,诞生了秦池、爱多VCD等知名标王。
一个典型的拍卖场景是这样的——拍卖师先标明广告位,同时表明底价,然后开始等待竞价者向上竞价,“100万!”、“120万!”、“200万!”,“200万一次,200万两次,成交!”
这样的场景我们在众多影视作品中再熟悉不过,然而并非所有的拍卖都是以这种方式进行,这仅仅是众多拍卖机制中的一种,这种不断提升价格的拍卖方式被称之为“英国式拍卖”。
和英国式拍卖类似,还有荷兰式拍卖,荷兰式拍卖的形式正好相反,拍卖师先出一个非常高的价格,然后不断往下试探,直到有竞拍者愿意接受这个成交价格。
那么问题来了——传统的广告可以通过这种方式竞价,那么在线的广告是不是也可以用同样的方法进行竞价呢?答案是否定的,原因在于在线广告的拍卖与传统广告拍卖有几点重要的区别,而这些区别会对竞价机制的设计产生重要影响——
第一,不管是英国式拍卖还是荷兰式拍卖,每个人的出价都是公开的,而在线广告主可能很多并不愿意公开自己的出价,因此公开竞价就变得不适合。
第二,央视的拍卖是单次行为,而在线广告是多次重复博弈,即这个广告位被抢了,广告主还可以抢下个广告位,广告主可以不断调整自己的出价。
第三,在线广告存在多个标的物(每一次广告请求可能都是多个竞价标的物)、海量实时计算的特征。
那么在线广告应该采取什么样的竞价机制呢?其实有很多选择,我们一个个来看:
第一个可能的选项是“密封第一价格”竞价,这其实也是我们熟悉的一种竞价方式,很多工程招标都采取这种方式,它的机制是每个竞价者不公布自己的出价,把它密封在信封里交给卖主,拍卖主让最高出价者赢得竞拍,并且支付最高出价者的出价。
有人说,这种方式看起来很完美啊,符合广告主不公开报价的需求,而且也被很多实践证明过,然而这种竞价方式广告主的出价策略取决于别人怎么出,反而和自己的真实估值关系不大,而这应用到在线广告拍卖就会存在问题。
在线广告一个特征就是重复博弈,神马意思呢?比如线下的工程招标是一次性的,竞拍者会更加倾向于谨慎对待自己的出价,因为他只有一次机会,然而在线广告是多次的,即广告主有多次机会不断试探别人的出价,从而实现自己的最优策略。
我举一个例子——谷歌的关键词“跑步”下面的广告位,耐克认为一次点击值10块钱,阿迪认为值6块钱,这时候如果他们采取“密封第一价格”拍卖,而谷歌广告系统给出的底价是2块,那么阿迪和耐克都会试探着出价。
阿迪从2块开始出,耐克出2.1,阿迪出2.2,耐克出2.3,双方有一个不断加价的过程,一直加到6块的时候,阿迪停止出价了,因为它认为这个广告为最多值6块,阿迪退出了。
这时候只剩耐克了,耐克也不傻,既然没人和我竞争,那么我为啥要出6块呢,于是赶紧调到2块,这时候阿迪又会进场,周而复始的循环开始了。
细心的你会看到这种方式有一个明显的缺陷——不稳定,背后的根源在于这种拍卖方式从博弈论的角度不存在纳什均衡(这一点已被经济学家从数学的角度证明),即它永远存在一个你追我赶的状态,原因是这种拍卖方式出价取决于对手的出价。
同时从更深层次上,这种机制在重复博弈的机制下至少有两个缺陷:
第一,不符合帕累托最优,即一个好的拍卖机制应该是把标的物卖给对它估值最高的竞价者,在这个案例中,评价最高的是耐克,然而有一半的几率被阿迪所抢走了。
第二,它也不符合卖方利益的最大化,耐克阿迪评价都远超2块,但出价却从2块开始出。
由此可以看出这种竞价方式用在在线广告拍卖上不合理,那么有木有一种更好的竞价方式呢,答案是有!接下我们就一起来看一看:
二、获得诺贝尔奖的一次改动
经济学家威廉·维克里试图解决这个问题,他在1961年发表的《反投机、拍卖与竞争性密封投标》,这篇经典论文中系统性地论述了“第二密封价格”的拍卖方式。(“卫夕聊广告”公众号后台回复关键词“竞价”获取论文)
威廉·维克里左一它对“第一密封价格”做了一个小的改动,具体为——竞价者依然密封出价,依然是出价最高者赢得拍卖,但是胜出者只需要支付第二名出价的钱,即如果耐克出价10块,阿迪出价6块,依然是耐克胜出,但耐克只需要支付第二名阿迪的出价——6块。
这是一个违反直觉的小小改动——第一名居然只需要支付第二名的出价,然而不要小看这个小小的改动,正是因为系统地论述了这个改动,让威廉·维克里获得了1996年的诺贝尔经济学奖,“密封第二价格”拍卖在经济学里也因此被称之为“维克里拍卖”,那么这个神奇的小改动到底隐藏着神马秘密呢?
答案是它正好系统地解决了“第一密封价格”存在的重大缺陷。有人立马会问:为什么这样改一下就能克服这个缺陷呢?
简单地说,在“密封第二价格”的竞价机制中,每个人都存在一个固定的最优策略——出价等于自己的估值,还是以上的价格策略,耐克估值为10块,阿迪的出价多少不知道,这时候耐克的最优策略是神马?答案是10块。为什么?
我们考虑两个种情况:
第一,阿迪出价如果超过10块,那么耐克无论如何也赢不了,因为耐克不可能出价高于自己的估值,高过自己就亏了。
第二,阿迪低于10块,那么耐克应该出到自己能出到的最大价格以增加自己的获胜概率,而这个最大价值就是10块,即耐克没有下调出价的动力,因为它没有最终支付价格的控制力。
神马意思?假如耐克出8块,这时候如果阿迪出6块,耐克赢得竞拍而且只需要支付6块,和它出10块没有区别,但如果阿迪出9块它就会失去竞价,因此耐克没有动力把出价调到8块这种有可能导致竞价失败的出价,唯一的最优策略就是出价10块。
用博弈论的话说,“密封第二价格”存在一个唯一的纳什均衡,即每个人都出自己对于商品的真实估值是最优策略,因此该机制是一个鼓励竞拍者讲真话的机制,同时具有相当的稳定性,即广告主没有频繁调整自己出价的动力。
在这种机制下,永远是对广告位评价最高的广告主胜出,同时保证了平台的收入,没有广告主出价比自己评价更低的出价。事实上,谷歌、百度、新浪微博等广告平台都是采取这种竞价方式。
好,有人会说,这种竞价方式就是完美的竞价方式吗?其实不一定,“密封第二竞价”机制至少存在一个缺陷,那就是它的反作弊特性不强,假如存在互相勾结的同谋,在这种竞价机制下,同谋更加容易实现。神马意思?
依然拿耐克阿迪来打比喻,耐克的心理出价是10块,阿迪是6块,这时候他们勾结,阿迪出1块,耐克出10块,最终耐克只需要花1块钱就能买走这个广告位,受伤的是广告平台。聪明的人立马会说——难道“第一密封价格”不会出现这种情况吗?比如耐克和阿迪商量好,耐克出1块,阿迪出0.5元,还是耐克以1块钱的价格买走这个广告位啊!
哈哈,这么说也没错,但“第一密封价格”更容易出现背叛同谋的情况,尽管商量好耐克出1块,阿迪出0.5毛,但阿迪是有动力去违反同谋的,只要阿迪出2块,它就能赢得拍卖,这时候耐克就傻眼了。
但在“第二密封价格”的情况下,耐克出10块,阿迪出1块,这个同盟的就非常有力,因为阿迪无论如何背叛,它也不可能赢得拍卖(它的出价不可能超过6块),因此它没有背叛的动力,因此同谋就更容易达成,作弊的概率就会变大。
好,既然有这个缺陷,那么现在在线广告谷歌、百度为什么还要使用它呢?一个重要的原因是,不同于线下的单一拍卖,在线广告是大规模重复博弈,大规模意味着参与竞价的广告主数量众多,客观上增加了勾结作弊的难度,从某种意义上掩盖了这种机制的缺陷。
三、VCG,一种多广告位的拍卖机制
以上我们讨论了竞价机制的基本原理,所有的例子都是一个广告位的情况,而在现实的广告系统中,一次请求的广告为往往是多个,比如搜索引擎就有多个广告位,我们应该如何设置竞价机制呢?
谷歌、百度就把“密封第二价格”拍卖进行了一个扩展,即如果有多个广告位,第一名按第二名加一个最小竞价单位扣费(如0.01元)、第二名按第三名扣费,第三按第四名扣费,以此类推,这种竞价方式被称作为“广义第二价格拍卖”(Generalized Second Price auction),简称GSP。
GSP广义第二价格拍卖这种方式最大限度地保留了“密封第二价格”的优势,即它能形成稳定的均衡,但它也有一个缺点,它并非全体竞价者福利最大化的竞价方式。
于是,三位经济学家Vickrey、Clarke、Groves分别在三篇论文中提出了一个多物品的拍卖机制,简称“VCG拍卖”,这种复杂的竞价机制从整个竞价者的整体利益出发,它依然是价高者得,但扣费却是计算价高者参与给其他竞拍者带来的总损失,即先算出没有价高者参与时的总福利,然后算价高者参与之后的其他人的总福利,这个福利之差就是其他参与者的损失。
简而言之,你参与竞价,你因此给其他竞价者造成了损失,你需要为这个系统的整体福利的减小而付出成本,以保证整体福利的最大化。
这个竞价方式计算起来相对复杂,我用一个简单的例子来阐述——假如现在有两个广告位,即搜索“跑步”这个关键词的第一位和第二位,第一位能带来20个点击,第二位能带来10个点击。
有三个广告主来竞价,分别是耐克每点击付6块、阿迪的4块和锐步的2块。按照价高者得的原则,耐克赢得第一个广告位,阿迪赢得第二个广告位,锐步竞价失败。
这时候问题来了:应该扣耐克多少钱?按照VCG竞价法则:
先算出没有耐克参与竞价时候阿迪和锐步的收益,即阿迪赢得第一个广告位,锐步赢得第二个广告位,收益为4*20+10*2=100
然后算出有耐克参与竞价阿迪和锐步的收益,即阿迪赢得第二个广告位,锐步出局,收益为4*10+2*0=40。
二者福利之差为100-40=60
那么耐克应该为每个点击付的钱为60/20=3块。
Facebook广告系统采取的就是这种竞价方式,这种竞价方式最大化了竞价参与者的福利,但我们可以看到,拍卖方的利益并非是最大化的,上面的案例中耐克的扣费3块比GSP竞价规则下按第二位收取的4块要少,可以说,Facebook是牺牲了短期利益,从更长远的角度进行考虑,因为竞价广告不是一个短期的行为,Facebook相信保证广告主的总体利益而言符合自己的长远利益。
那么谷歌为什么不也采取同样的VCG竞价方式呢,一方面是因为尽管VCG可以最大化竞价者福利,但它非常难向广告主解释,会面临极大的教育成本;谷歌首席经济学家Hal Varian曾经就明确表示谷歌在2002年不愿意从GSP转到VCG其中一个原因就是用户教育成本太高。
另一方面也因为从GSP直接转向VCG会面临收入下滑的风险,经济学家们已经证明VCG的收入不会比GSP高。
这篇文章主要介绍了竞价广告机制设计中的来龙去脉,事实上,竞价机制选择只是竞价广告中的一个小的方面,关于竞价广告的其他方面,我会在后续的其他文章中陆续向大家介绍.
大家应该也注意到了,卫夕的文章一直致力于不仅仅告诉你“是什么”,更重要的是告诉你“为什么”,知识本身很重要,表达知识的方式也很重要,关注“卫夕聊广告”,更轻松地理解互联网商业的底层逻辑。
作者卫夕,一名兴趣极其广泛的广告产品经理,“卫夕聊广告,不止聊广告”,只写深度长文,每周一篇长文深度剖析广告及互联网的常识、逻辑或思维。合作、交流请简信联系作者。