理论教育 付费搜索广告中关键字优化模型研究

付费搜索广告中关键字优化模型研究

时间:2023-05-30 理论教育 版权反馈
【摘要】:付费搜索广告是一种基于绩效收费的广告方式,公司对于事实出现的点击数进行付费,而非曝光数。这也正是付费搜索广告在近年来飞速发展主要原因。在付费搜索广告的购买决策中,有四个步骤需要注意: ①选择哪些关键词?研究资料组包含某连锁酒店付费关键词搜索广告的每日信息。事实上,付费搜索广告的平均转换率是极低的。本文旨在构建针对特定关键词绩效评估的模型,以每预订成本收费为标准,以点击为大前提。

付费搜索广告中关键字优化模型研究

作者信息: Oliver J. Rutz,耶鲁大学管理学院营销系助理教授,纽黑文市前程大街135号,CT06520,邮箱oliver.rutz@yale.edu.

论文是笔者的翻译稿。

资料来源: Rutz,Oliver J. and Bucklin,Randolph E.,A Model of Individual Keyword Performance in Paid Search Advertising,2007, 6. Available at SSRN: http: //ssrn.com/abstract =1024765 or ht-tp: //dx.doi.org/10.2139/ssrn.1024765

摘要: 在网络搜索引擎的付费广告竞拍中,广告主为具体的关键词竞价,如在搜索结果页面中出现在赞助区的文本链接广告“洛杉矶国际机场出租车”。当此链接被用户点击时,由广告主付费。然而,大多参与竞价的关键词往往只促成微乎其微的销售转换率,即使经过几个月仍是如此。这种极低转换率导致在评估特定关键词的盈利绩效时变得很困难,从而使得广告主探寻其他有效的评估途径,如对关键字进行组合,或是使用更加便于计算的试探方法,如计算点击率。针对特定关键词销售转换率的稀缺性,笔者提出研究模型,其中,转换率通过分层贝叶斯二元离散选择模型来估计,这使得转换的同时基于词语层面的协变量以及关键词间的缩减。

模型应用于包含每天曝光、点击和预定的关键词付费搜索数据。结果证明协变量与其异质性显著提高了转换率的预算。对比研究证明,基于模型提出方法的竞价管理者在关键词销售盈利的预算方面远远优于现今存在的管理策略。

关键词: 互联网 广告 付费搜索 贝叶斯分析方法

引 言

付费搜索广告在公司与消费者之间建立起直接的联系,当消费者在网络上搜索他们所需的产品或服务,他们会使用关键词进行搜索(关键词可由多个词语组成),如“洛杉矶酒店”。通过付费搜索,酒店经营者可以让顾客直接注意到他们的酒店。公司购买特定的关键词,这样,他们的文本链接广告就会出现在搜索结果页面的赞助板块(见图1),这个文本链接广告就称为曝光。在通常情况下,广告主们的兴趣都集中在同一个关键词,如“洛杉矶酒店”几乎吸引了洛杉矶所有的酒店。

图1 谷歌搜索结果网页示例

在广告主看来,付费广告不同于传统意义上的广告,他们不能够凭借固定金额去占有网页上的一席之地,也就是说不能够拥有网络不动产,这与展示广告是大为不同的。在付费搜索购买中,广告主为广告的点击进行竞价,自动拍卖的计算方式决定了广告的布局与位置,如排在第一位还是第三位。付费搜索广告是一种基于绩效收费的广告方式,公司对于事实出现的点击数进行付费,而非曝光数。这也正是付费搜索广告在近年来飞速发展主要原因。现在网络广告主要分为两种形式,付费搜索与展示广告。展示广告将广告以横幅的形式悬挂在网页上,以前这一直都是网络广告最为主要的形式,直到2005年,付费搜索广告超越了展示广告的地位。最大的搜索引擎谷歌凭借付费搜索广告创造了40多亿美元的净收益(商业周刊,2006)。

尽管付费搜索广告正在飞速成长,但对于这种广告模式却少之又少,尤其是在营销领域。在付费搜索广告的购买决策中,有四个步骤需要注意: ①选择哪些关键词? ②每个关键词竞价多少? ③如何设计文本广告? ④如何设计登录页面? 已进行的研究主要针对第二个步骤,即关键词的竞价,而事实上,所进行的研究属于博弈范畴,实证研究又非常有限(Edelman,et al.,2007; Chen and He, 2006)。就我们所知,没有任何一个研究是针对文本链接广告和登录页面的设计。当然,就另一方面而言,链接广告和登录页面的设计不会与传统广告和网页设计有很大不同,因而先前的研究可以应用。

现在留下第一个问题等待解决: 如何选择关键词? 当下大多管理实践使用试探法或基于整体层面评估公司绩效,也即是对关键词进行组合,并对组合关键词进行管理。由于付费搜索机制在关键词层面进行操作,这就引发一个问题,如何在体层面对组合关键词进行选择决策。对于关键词的绩效评估往往都很困难,因为数据资源稀缺,如很少可以追踪导致实际购买的关键词的转换率。即使在相当长的一段时期内,这个问题依然存在。

研究资料组包含某连锁酒店付费关键词搜索广告的每日信息。在绩效评估中运用的传统方法为计算每个关键词的边际收益,对消费者基于广告每预订成本收费(CPR)与收益进行对比。如果结果乐观,那么这个关键词是有益的,公司应将其保留; 反之,在竞价投标中,应将此关键词剔除。当然,公司也可以考虑对竞价策略进行调整。但由于搜索引擎不会为广告主提供实际招标竞标的数据,因此,这项研究的数据主要基于广告主和竞价者的可用数据。对于竞价行为和拍卖问题,我们以后再进行研究。

看上去基于每预订成本对特定关键词的绩效进行评估是比较简单明确的:

每预订成本收费(CPR)=

多数关键词每天都有相应的曝光与点击,但却往往没有实质性的收入。事实上,付费搜索广告的平均转换率是极低的。2004年4月,301个关键词中只有84个(27%)产生了预定(见图2)。不管是每天,每周还是每月,大多数关键词都不能够盈利。而零转换率妨碍了我们计算每预订成本收费。当然,长时期内关键词的转换率不可能为零,但是即使不为零,转换率也非常低,并且需要相当长的时间才能够达到。而与此同时,公司却仍在为不能产生伴随收益的关键词与点击继续付费。

本文旨在构建针对特定关键词绩效评估的模型,以每预订成本收费为标准,以点击为大前提。这给我们提供了关键词每点击成本收费的数据,此外,我们还需要关键词的转换率以计算每预订成本收费。为了获得基于模型的估算,我们将转换率定义为点击条件下的二元选择决策(如用户对付费搜索广告进行点击并且到达公司的登录页面)。

我们运用收缩程序去推断那些几乎不能产生销售额的关键词转换率(同时也帮助估算其他关键词的转换率)。通过特定关键词与其他关键词之间的相似性关联性,我们可以为每一个关键词进行估算。普遍应用的选择模型与可靠的统计方法解决了数据稀缺的问题。估算出的一套转换率使得基于每预订成本收费的关键词的绩效评估成为可能,清除了付费搜索广告内在数据稀缺的问题。

根据模型我们发现,点击率(CTR)和关键词特征对于转换率的估算有着重要作用。结果显示转换率与基本关键词和其他文本链接广告相关的因素有关。并且,要对特定关键词的绩效建模,我们必须考虑到关键词的异质性。

图2 数据稀缺性

我们通过保留样本对模型的预测能力进行评估,根据模型产生的关键词要比由非模型管理策略产生的关键词绩效好。采取非模型策略的管理者要么在关键词的品类管理上下工夫,要么就关注已计算的绩效管理模式如点击率。品类管理的方法既不能准确地评估特定关键词的绩效,也不能够对已选择的关键词进行优化。如果只关注点击率或是曝光率这样便于计算的数据,是十分有害的。这种方式的弊端是,管理者往往得武断地选择一个临界值,如使所有关键词的CTR≥1%。而且,也不能保证这种方法是否会把利润估算最大化。我们的预期分配分为四个步骤: 第一,提出关于付费搜索中特定关键词管理的相关问题; 第二,发现关键词对于转换率有预期作用; 第三,展示针对关键词绩效的建模过程需注意关键词的异质性及特质; 第四,证实非模型得出的关键词劣于基于模型方法提出的关键词。

虽然这个研究主要关注特定关键词选择层面的绩效,我们仍希望能够推进管理决策者在其他方面完善关键词绩效的评估,如关键词选择,竞价策略以及广告和登录页面的设计。此文章不对以上方式进行研究,例如,如何对给定关键词进行最优竞价? 当然,在研究中,我们将对关键词的位置予以分析。

本文布局大致为: 给出付费搜索的简介,并对网络广告的相关文献进行概括; 展示资料组,模型及研究结果; 解释研究结果,提出如何提高特定关键词管理的绩效; 最后得出结论,并说明研究方式的局限因素,提出对于搜索引擎和营销领域后续研究的想法。

背景和文献

在营销领域,关于付费搜索广告的文献并不多,首先,我们对于这个主题进行简单的综述。

付费搜索广告

从公司和用户的层面来看,付费搜索如何生效呢? 试想一下:一个用户在网络上搜索“洛杉矶国际机场酒店”,一公司已将其选择为关键词并且制作了文本广告链接,在搜索结果的网页上,将会显示赞助与非赞助的广告,包括公司广告在内(这依竞价而定)。从公司角度而言,当“洛杉矶国际机场酒店”作为关键词被搜索,搜索结果即发生一次曝光,假设用户喜欢公司的文本广告,那么他会进行点击,随后转到公司的登录页面,然而此时,这个关键词又引致了一次点击。最后,用户决定是否对酒店进行预订? 如果预订,那么关键词就成功地促成一次预订(见图3)。

公司为什么愿意为这种服务付费呢? 广告在网页的位置又如何决定与其他同样选择“洛杉矶国际酒店”作为关键词的公司的关系呢? 这两个问题彼此关联,不能够脱离一个而单独解决另一个。搜索引擎的付费搜索收益模型与传统的广告模型不同,广告既不为“网页不动产”而付费,也不会仅仅为曝光次数而付费。在付费广告模式中,广告主为关键词进行竞价,为实际出现的点击率付费。网页中文本广告的位置和点击付费由不同的拍卖方式决定。因此,付费搜索广告是一种基于广告效用而付费的模式: 广告主为点击付费,而非曝光。

图3 公司角度与顾客角度的付费搜索广告

那么拍卖模式又是怎样的呢? 以谷歌为例。作为付费搜索广告的领头羊,谷歌将竞价与点击率的专有估算相结合,并估算广告将带来的期望收益。对谷歌持有最高期望收益的公司将被给予最好的广告位置,其他广告得到的相应位置依期望收益的高低排列。而另一种拍卖机制如雅虎,直到2007年1月,完全利用第二价格拍卖法去决定广告的位置。最高竞价者获得最好的位置,其他广告商得到的相应位置依竞价高低排列。据商业周刊报道,2006年,谷歌的广告收益比雅虎多出30%。MSN在2005年秋天采用谷歌的竞价模式,雅虎也表示将转换其拍卖模式,更多地以点击率作为标准。

搜索引擎为广告主提供了相关的软件让他们可以在较短的时间内改变其付费竞价策略。一天内,关键词的选择与竞价可以随时变化。如谷歌的关键词竞价广告允许广告主将关键词进行组合,同时,对组合关键词进行管理,也即是关键词组合广告。付费广告策略通常根据这些组合来管理。

就我们所知,在营销领域中,没有针对付费搜索广告所发表的文献。迄今为止,研究主要关注搜索引擎的绩效。Telang等人主要研究搜索引擎的访问量,而Bradlow和Schmittlein(2000),Spiteri (2000),Jansen和Molina(2005)则主要研究搜索引擎中的信息搜寻。近期,付费搜索广告的拍卖机制逐渐成为博弈论经济领域研究的新话题(Edelman and Ostrovsky,2007; Edelman,etal.,2007)。关于付费搜索也从信息信号理论的角度来入手,作为一种产品差异化的博弈。Paid search advertising is also investigated from an information signaling viewpoint as a product differentiation game ( Chen and He,2006) .

Edelman和Ostrovsky(2007)研究了竞价者在拍卖行为中运用的策略,据他们估计,Overtrue软件如果没有运用他们所谓的竞价策略的话,则收益要比现在高。作者们提出一个特定的替代机制,第二价格拍卖法。这种拍卖方式将减少竞拍者在活动中的策略行为,增加搜索引擎的收益,同时,提高整个市场的效率

在他们的研究之后,Edelman等人(2007)对付费搜索广告中的一种新型拍卖机制——二阶价格拍卖(GSP)进行了研究。但GSP又不是真正意义上的第二价格拍卖(维克瑞-克拉克-格罗夫斯机制,VCG)。尽管GSP与VCG看起来非常相似,但是其特质却有显著不同,GSP的均衡能力远远不够简单明确。笔者发现那些天真的买主往往以多出实际需要的价钱购买,而较为精明的买家在真正的第二价格拍卖中则用少于实际需要的价钱中标。

Chen and He(2006)对产品分化的博弈进行研究。用户起初并不知道他们的需求,也不了解卖家的产品,但是通过搜索他们可以了解产品。当一个产品与关键词的关联度越高,卖家就愿意出更高的价钱对广告位置进行竞价,这样不仅能够促成有效搜索,而且也大大提高了总效益。

网络广告

在营销调研中,网络广告常常被等同于横幅广告。横幅广告的收益分析模型以绩效评估方式为主,其中,主要手段为计算点击率(Hoffman and Novak,2000; Dahlen,2001)。然而,与付费搜索广告相比,用户倾向于点击搜索结果,而非横幅广告。20世纪90年代,点击率直线下降,由1996年的7%下降到2002年的0.3% (Double Click,2003)。Dreze和Hussherr(2003)发现点击率低的原因正是用户不喜欢并有意回避点击横幅广告,这就说明横幅广告还停留在引起注意前期的水平上。那么,点击率也就不能够成为评估广告绩效的有效手段,而此时采用品牌认知与品牌回想更为合适。付费搜索广告与横幅广告在这点上大相径庭,在搜索中,用户更加积极主动地搜寻他们所需的产品服务,并且对广告更加关注。

基于以上研究,Danaher和Mullarkey(2003)发现用户涉入度对横幅广告的理解和效用有重要作用。对于目标导向型用户来说,他们比网上冲浪的用户更加积极地搜寻所需产品与服务,很少对横幅广告作出品牌认知与品牌回想,他们往往能成功地避开无用的广告。Cho和Choen(2004)深入调查了这种现象的原因,主要包括:①广告杂乱感知; ②已有负面经历; ③目标障碍感知。其中,目标障碍感知是用户回避广告的最主要原因。他们建议广告主采取以目标客户为中心的定制化广告去降低客户的目标障碍感知。Moore等人(2005)也调查得出广告与网页的和谐配合对于用户的积极态度有着重要作用。

付费搜索广告的快速增长是因为它解决了横幅广告的许多问题,如广告商只在用户点击链接广告后才被收取费用,因此点击率成为衡量广告绩效的有效手段; 搜索广告关注用户的实际需求,整体广告环境的一致性解决了用户的目标障碍问题; 用户在搜索中会对感兴趣的链接进行点击,提高了广告的效用。

数据来源

付费搜索广告与传统广告的数据有显著不同,在付费搜索广告中,广告主为将在搜索结果网页中赞助区域出现的广告付费。这个广告通常包含标题,相应数量的词句,以及通往该公司网站的链接。这些词语大致描述公司基本情况,网站内容以及所提供的服务产品。放置广告的网页被搜索每显示一次,就称为一次曝光,如果用户对广告链接进行点击转到公司网站的登录页面,就称为一次点击。公司对每次点击进行付费,用户对公司网站的每次访问被当做一次转换记录为数据(见图3)。

我们选取谷歌一个季度为一个连锁酒店提供广告服务的数据作为研究代表,从2004年4月开始持续3个月。数据分为两组,一组为标准数据,即谷歌为广告主提供的数据,包括特定关键词的每日相关信息每个关键词所花费的成本(单位: 美元),特定成本下提供的一般广告位置(如排在第二还是第三位),还有曝光数和点击率。另一组为第三方数据,为我们提供关键词所引致的酒店预订量,以帮助我们对公司的财务业绩进行调查研究。

在2004年4月,公司对405个关键词竞价,其中,只有301个关键词产生了点击率。我们将研究重心放在301个关键词上,因为不产生点击的关键词无须付费,公司不因此而损失成本,更为重要的是,谷歌在付费搜索广告的新规则(2005年底实施)规定将停止在一定时间段内不产生任何点击的关键词。谷歌公司通过公司的预期收益来赚取利润,也即依靠竞价和预期点击率。广告在网页的位置并不仅仅决定于竞价的高低,而是决定于公司的预期收益。谷歌对关键词设置了最低门槛(不对外公布)。如果某关键词在一定时期内没有达到最低点击率,那么谷歌将其转换为试用关键词,若长时间内仍没有提升,该关键词将被废除(Goodman,2005)。这一机制已被许多其他搜索引擎所采用,如MSN已采用了相似机制而雅虎正在朝这个机制作出改变。

我们通过引入关键词的语义特征来完善数据,包含了与连锁酒店特质相关联的关键词,如城市和度假目的地在内的等。301个关键词将依据不同的语义特征被“分解”开来:

(1)品牌: 关键词中是否包括公司品牌名称? 99个符合。

(2)美国: 关键词中是否包括地域美国? 223个符合。

(3)州名: 关键词中是否包括州名? 52个符合。

(4)城市名: 关键词中是否包括城市名? 210个符合。

(5)酒店: 关键词中是否包含“酒店”或其他酒店相关词汇如“旅馆”、“房间”等? 222个符合。

除品牌与酒店呈高度负相关( -0.83)外,关键词的不同特质间都呈低度相关。当关键词中不存在酒店名称时,就需要与酒店相关的词语,如“洛杉矶酒店”。

基于关键词特质在许多方面与人口统计资料相似,我们把关键词数据称为词汇统计资料,并且相信这将有益于对关键词绩效的评估研究。这种词汇统计资料同时将适用于其他行业的数据研究。

我们采用2004年4月的数据作为样本估计。2004年4月,301个具有点击率的关键词产生2281023次曝光,14302次点击,518次预定(见表1),即平均点击率0.6%,平均转换率3.6%,获得的平均位置为第六位。公司为此付出的竞价为510674美元,其中,每点击成本收费为0.36美元,每预定成本收费为9.86美元(见表1)。随后我们将5—6月的数据作为保留样本进行比较,证明与4月的数据大致相同。

表1 样本数据

由于数据的稀缺性,研究者通常使用整体分析方法对付费搜索进行研究。在301个关键词中,有12个关键词在整个研究期间没有产生任何预定,而以每日、每周或每月进行分析的话,大多数关键词都不能促成预定。2004年4月,有84个关键词促成预定。尽管我们没有收益或边际利润的数据,我们知道酒店每晚大约需要75美元到100美元。假设消费者每次旅行在酒店住宿1.5晚,且边际收益率为30%,那么每次预订成本不能超过40美元。在301个关键词中,只有4个关键词是超出40美元的。

那么公司应该如何选择关键词? 那207个不能产生任何转换的关键词效用何在? 即使是84个可以促成预定的关键词,其中,也存在转换率极低的词语。并且,当置信区间较大的时候,我们能够依赖这些估算的转换率吗? 看起来,依赖已观察到的转换率真的不是有效策略。有关专家曾提出依据点击率对关键词进行管理优化,但是如何设立使利润最大化的分界点呢? 这就需要边际成本收益分析法,而转换数据稀缺又导致它不能顺利进行。我们通过关键词收缩分析方法建模,来解决这个问题,以从收益分析的角度对关键词进行绩效研究。

模 型

我们将转换率定义为点击条件下的二元选择决策。用户对广告链接进行点击后转到公司的登录页面,我们对用户此时是否进行预订进行研究。我们并没有掌握用户的信息,如点击流数据,这使得我们不能从用户的决议层面来建立模型。我们的研究是建立在关键词层面的研究,关注不同的关键词基于可观察协变量是否产生不同转换率。

这里,二元Logit模型用来研究用户点击访问公司登录页面后的预订概率,转换率的估算建立在点击的条件下。特定关键词的每日点击作为机会选择,每日预订则为成功选择。根据模型,关键词的转换概率(PConvw,t)公式为:

vw,t代表关键词的潜在价值。

在Logit模型的标准应用中,数据在特定时间内包含一个选择结果。由于不能掌握点击流数据,我们无法对一次点击与一次预订建立联系。因而,我们对每天的点击数与预订数进行记录作为每天的数据。概率函数的计算方式为:

(2)

关键词的潜在价值是什么在影响关键词的潜在价值(vw,t)呢? 我们通过解决两个实质问题来研究。

(1)不同关键词的转换率是否有规律可循? 换言之,是否能通过转换率来预测用户使用的是哪个关键词搜索?

(2)对竞价指标的数据分析是否有益于转换率的估算? 我们是否能够通过纳入关键字相关的协变量(如位置)提高预测能力?

迄今为止,没有针对如何根据关键词的潜在价值对转换率进行估算的研究,这在付费搜索中是一个值得注意的实证问题。我们的研究将为管理者基于关键词建立模型预测转换率提供契机与方法。

根据Logit模型,我们可以对关键词绩效进行四种情况的研究(见图4),通过收缩过程,可以解决数据稀缺的问题,用相似的关键词对那些零转换或转换率极低的关键词进行转换预测。研究包括两个收缩步骤——同质收缩与异质收缩。同质收缩即收缩到一般均值(最大似然模型),假设关键词转换不可预测,一次点击就仅作为一次点击进行计算。最大似然模型应用于同质收缩的估算过程。异质收缩(或随机效应/系数)是指用事前分布对事后均数进行估算的过程。也就是说每个特定的关键词都可以对应不同的潜在价值与转换率(贝叶斯模型和HB模型)。我们通过贝叶斯方法(Bayesian)来实施异质收缩过程,并基于蒙特卡洛马尔科夫链方法(MCMC)进行参数估计

首先来解决第一个问题,关键词转换是否可以预测? 我们提出两个模型进行验证。模型I,假设关键词转换不可预测; 模型II,转换率基于不同关键词有规律可循。

模型Ⅰ: 最大似然零模型(MLNull)。首先,假设一次点击就仅作为一次点击进行计算,或者说,转换率独立于关键词存在。这个模型不支持基于转化率对特定关键词的绩效进行评价,因为模型假设所有关键词的转换率是相同的,若结果有不同,则只能被看做是未被观测因素或抽样误差导致的。

图4 实证问题,模型策略

ML零模型:

(3)  vw,t0w,t

β0是普通(均质)截距项;

εw,t是关键词w在t时的Logit误差;

β0是根据最大似然方法估算的参数。

模型Ⅱ: 贝叶斯零模型(BayesNull)。最大似然零模型似乎太过严格,贝叶斯零模型中,假设关键字转换率根据关键字的不同而随机变化,也即我们可以通过指定一种普遍的分布方法来进行关键词转换的预测,如泊松分布。这些随机模型在20世纪80年代中期风靡于营销界(Morrison and Schmittlein,1981; Schmittlein,et al., 1985),我们在二元Logit架构中使用的另一种相似方法为异质关键词截距。

贝叶斯零模型:

(4)  vw,t0,ww,t

β0,w是个体层面(异质)截距向量;

εw,t是关键词w在t时的罗吉特误差;

l)是基于蒙特卡洛马尔科夫链方法(MCMC)进行估计的参数向量。

下面我们讨论第二个问题,对竞价指标的数据分析是否有益于转换率的估算。由于竞价指标(如广告位置)可以作为解释转换率不同的因素,我们在罗吉特架构中采用竞价指标来研究关键词转换率是否可预测?

模型Ⅲ: 最大似然CV(MLCV)模型。可观测协变量是否能够更好地估算转换率? 作为最大似然零模型的延伸,我们仍然假设关键词转换不可预测,转化率的不同不仅是未被观测因素或抽样误差导致,也与可观测协变量(如位置)有关联。这同传统的选择模型是相似的,价格与陈列等协变量参与到后期效用函数的分析中。在此模型中,我们还假设协变量对于关键词的影响是同质的,如广告位置的影响。

最大似然CV模型很好地反映了Chen and He(2006)在博弈模型中的主要观点。他们认为公司应该为广告的市场关联位置进行竞价,如果该产品在市场中属于第二相关品,那么广告就应为第二个位置进行竞价。在他们看来,关键词对转换率不起作用,起作用的只是广告的位置。我们将用巢套模型对该理论进行实证研究。

最大似然CV模型:

(5)  vw,t01POSw,t2CTRw,t3COSTw,tw,t

POSw,t是关键词w在t时的平均位置;

CTRw,t是关键词w在t时的点击率;

COSTw,t是关键词w在t时的成本;

εw,t是关键词w在t时的罗吉特误差;

β0,β1,β2和β3是由最大似然模型估算的普通参量。

模型Ⅳ: 贝叶斯CV(BayesCV)模型。贝叶斯CV模型是贝叶斯零模型的延伸。假设关键词转换率可以预测,协变量对于关键词的影响是不同的(随机系数模型)。一个较好的位置对于竞争较为激烈的关键词效用更大,如好位置对于“洛杉矶酒店”的作用比对“圣克鲁兹酒店”的作用要大。

贝叶斯CV模型:

(6) vw,t0,w1,wPOSw,t2,wCTRw,t3,wCOSTw,tw,t

POSw,t是关键词w在t时的平均位置;

CTRw,t是关键词w在t时的点击率;

COSTw,t是关键词w在t时的成本;

εw,t是关键词w在t时的罗吉特误差;

β0,w,β1,w,β2,w和β3,w是个体层面基于蒙特卡洛马尔科夫链方法(MCMC)进行估计的参数向量。

在假设关键词转换率可以预测的情况下,我们可以进一步深入研究关键词异质性的影响,是否可以通过关键词的不同特质(应用词汇统计资料)来促进转换率的预测呢?

模型V: HBWG模型。我们将关键词按照其特性分开,建立相应的词汇统计资料,以研究是否可以通过分类后的词语帮助进行

关键词转换率预测。依据贝叶斯文献与Steenburgh等人(2003)的理论,我们通过分层模型(HBWG模型)对统计资料进行研究,同时,用备择方法观察词汇统计资料是否能够在方程5和方程6中更好地作为协变量指标辅助研究。

我们对截距项能否分解为标准截距项和关键词效应截距项(见方程7,方程8)进行研究。关键词异质性不能由任何协变量或词汇统计资料进行解释,只能被标准截距项解释,这里标准截距项就相当于品牌选择模型中的品牌截距项。对关键词效应截距项的应用让我们使用到词汇统计资料的相关信息,这同传统选择模型的应用是相似的: 作为协变量的人口统计因素在效用函数中往往是不显著的。然而,分层模型的使用能够大大提高模型的拟合度,同时,在消费者行为的研究中开创一片新天地(Ainslie and Rossi,1998)。

HBWG模型(贝叶斯CV模型的延伸):

(8)  ωw=Cwγ+vw vw~N(0,Vw)

XTw,tβw是先前提到的协变量(见方程6);

ωw是特定关键词的影响;

Cw是词汇统计资料矩阵(无截距项);

γ是基于蒙特卡洛马尔科夫链方法(MCMC)进行估计的参数向量(详细步骤请参见附录)。

通过层级回归分析将词汇统计资料代入模型进行分析:

(9) ωw1GENw2USw3STAw4CITw5HOTw+vw

GENw是一般关键词w的指示词;

USw是美国相关关键词w的指示词;

STAw是州名相关关键词w的指示词;

CITw是城市名相关关键词w的指示词;

HOTw是酒店名相关关键词w的指示词;

vw~N(0,Vw) γ1,γ2,γ3,γ4,γ5和Vw是基于蒙特卡洛马尔科夫链方法(MCMC)进行估计的参数向量。

模型估计结果

本文通过2004年4月的数据进行模型估算,5—6月的数据作为保留样本进行比较分析。

鉴于只有通过点击才能产生转换,我们必须根据广告点击制定合理措施进行调查,进而对关键词的绩效进行评估。本文把时间段定为1个月,这样可以避免在短时间内一些关键词不能产生任何点击的问题。

本次研究运用七个模型进行分析,其中,包括三个最大似然模型(MLMull,MLCV,MLCV&WG)和四个贝叶斯模型(BayesNull, BayesCV,BayesCV&WG,and HBWG)。我们对301个关键词进行观察,每天产生8497个观测值,平均每个关键词2个观测值(在一些时期内,仍有关键词是零点击)。这8497个观测值包含14302次广告点击。由于观测值存在多种选择情况,我们通过构建似然性模型来解决这个问题。数据显示大多数点击不能促成预订,通过对518次预订的观测,得到转换率为3.6%。

首先从模型选择说起。本文用贝叶斯因子(BF)对标准贝叶斯模型进行假设检验,由于贝叶斯因子易于解释,所以无须巢套模型进行辅助,一个贝叶斯因子相当于对贝叶斯估计作出的似然概率检验。我们通过采用数学方法(调和平均数,Newton and Raftery, 1994)对基于蒙特卡洛马尔科夫链方法的对数边际密度进行计算(对数边际密度和贝叶斯因子见表3)。低于2的测试值不能检验模型的优良性,而高于6的测试值则充分说明一个模型优于其他对比模型(Newton and Raftery,1994)。

表2 估计结果

备注: 1. 覆盖区间为95%;(www.daowen.com)

2. 研究通过贝叶斯分析进行模型选择,影响不显著的协变量将被删除,从而选择最佳模型。

表3 模型选择

备注: 1. 协变量信息包括广告位置,点击率和成本; 2. 词汇统计资料包括关键词特征,指标有: 普通,含“美国”,含州名,含城市名以及酒店名;3. 用BIC作为对数边际密度的近似值。

基于对贝叶斯因子的计算,本文得到HBWG模型优于其他四个模型,其BF值分别为: 贝叶斯CV模型(BF: 8.77),贝叶斯零模型(BF: 26.37),最大似然CV模型(BF: 46.80),最大似然零模型l(BF: 150.90)。同时,本文得出用词汇统计资料作为协变量不能提高模型拟合度: MLCV vs. MLCV&WG (BF: 23.8);BayesCV vs. BayesCV&WG(BF: 2.054)。因此,我们得出结论:HBWG模型优于最大似然模型和贝叶斯模型。

研究结果阐明了两个问题,即关键词转换率可以预测,并且可以被关键词本身解释,因此,我们可以通过对关键词的异质性建模来研究关键词对转换所起的作用。本研究中的实证结果与陈和何(2006)的理论相抵触,他们认为广告位置是最能够解释转换不同的因素,关键词起到次要作用。实则不然,本文证实关键词本身很大程度决定了转换率的大小。

协变量如竞价指标中的广告位置和点击率对于转换率也有重要作用。研究中,我们可以通过位置和点击率等协变量在转换率与拍卖之间建立联系,将转换率模型与实际拍卖模型组合运用。这样的组合模型可以让研究者估测特定关键词的最优位置与点击率,从转换率的角度对不同广告位置进行分析评估。

利用关键词的不同特质对关键词异质性进行研究大大提高了模型的预测能力。我们将关键词按照不同特征分解开,形成像人口统计资料一样的词汇统计资料。这种灵活的方式将关键词的潜在特征也包含进去。而关键词的潜在特征在统计资料之外又更加提升了预测的准确性。统计资料的所需数据可以从广告主那里得来——搜索引擎为广告主提供关键词推荐系统,当广告主键入关键词时,系统自动为其推荐合适的选择。这种推荐系统并没有公开,所以在广告主看来,这些推荐词汇也是在词语的潜在特质上具有相似性。今后,我们会对关键词的潜在特质是否能够提高模型的预测能力进行探索。

接着我们通过最优模型(Bayes/HB模型)对协同因素进行估计(见表2)。和预期相同,截距项(或基本转换率)为复值,导致转换率极低。同样,广告位置也易对转换率起到反向影响。当我们把位置按照从1到10(由高到低)的顺序排列,较低的位置将导致较低的转换率,这不在我们的预期之内。本文基于点击进行研究,这当中存在用户点击进入公司页面,但并未注意到关键词与广告位置。当然,这并不妨碍我们得出的研究结果: 广告位置将对客户与预定之间产生影响——好的位置意味着关键词更加有效(Chenand He2006)。

对广告位置研究之后,我们来关注点击率。结果证明点击率对转换率存在正向影响,高点击意味着关键词更加有效。当用户在搜索后对关键词进行点击,点击在很大程度上促成预定,成为有效转换。

在Bayes/HB模型中,我们观测到成本的影响并不显著。在付费搜索中,成本是广告位置和点击率的代名词。若将关键词定为常量,则高成本等价于更好的位置; 若将广告位置定为常量,则高成本等价于更高的点击。这一现象可以被竞争程度解释。当设定广告位置为常量时,拍卖中竞争越激烈的关键词,点击率也越高,相应的需求成本也更高。当我们对广告位置和点击率对关键词效果影响的不同进行探究时,成本的影响是不重要的。

研究结果鼓励我们对其他方面进行研究,如定量分析和消费者行为调查。如果今后能够建立以用户为中心的资料库,那么我们就可以对用户进行细分,研究用户特征是否如点击率和广告位置一样能对转换率造成影响?

现在来看词汇统计资料的影响。本文将词汇统计资料作为ML模型和Bayes模型的变量指标。当词汇统计资料依据非阶层形式组织,不仅不能提高模型拟合度,而且也违反了模型的选择原则; 当对资料进行分层管理(HBWG模型)时,我们便能很好地对关键词异质性的影响进行研究——五个关键词特质中的四个具有显著影响,并且大大提高了模型拟合度(见表2和表3)。本研究将截距项分为两个部分: 一部分被词汇统计资料解释; 另一部分被模型之外的其他因素解释。研究证明: 第一,由于品牌关键词在用户的决策过程中受到更多青睐,处于更加有力的竞争环境,普通关键词转换率要低于品牌关键词(Rutz and Bucklin,2006); 第二,“美国”作为关键词的一部分不能对转换率产生显著影响; 第三,包含州名或城市名的关键词转换率低于其他关键词; 第四,包含“酒店”或相关字样的关键词转换率低于其他关键词。

关键词异质性有多重要呢? 我们在研究中发现,当引入词汇统计资料,转换率对于广告位置和点击率的敏感性降低。在BayesCV模型中,如果将广告位置降低一个排位(从第2.3个位置降为第3.3个位置),则转换率将降低24.5%,但是在引入词汇统计资料的HBWG模型中,转换率只降低14.2%。因此,BayesCV模型中协变量的选取是不正确的,它过分强调了广告位置和点击率的作用。如果我们不对词汇统计资料加以应用,则分析出现的结果很可能导致对高点击率的关键词和广告位置作出过度投资。

需要注意的是,词汇统计资料用来区分关键词的不同特征对转换率的影响,而非创造新的关键词。根据模型,我们知道对于公司最为有利的关键词就是不包括任何特征(如转换率最高的“品牌名称”)的关键词。统计词汇资料可以更好地帮助我们解释和预测转换率。

我们已基于样本内数据对模型性能进行评定,但此次研究的目的是建立有益于付费广告竞价过程的策略。下一部分我们将阐述如何应用已预测的转换率来促进竞价活动,并将此与非模型策略进行比较。由于需要对拍卖环节进行建模分析,本文暂不对如何进行最优竞价进行研究,主要关注关键词绩效的分析。这将为后续研究作出铺垫。

竞价管理过程的分析

第一阶段着重于对关键词管理的研究。我们用已有的结论和2004年5—6月的数据与非模型策略的数据进行比较分析。当然,再次强调,本次实验并不致力于解决竞价过程的最优定价与位置选择,而是从盈利角度对关键词是否有效进行分析。我们将验证是否这种基于模型的单因素策略已优于现存的依赖启发式探索方法与整体方法的非模型策略。

本文采用不同方式基于“有吸引力”与“无吸引力”对关键词进行列表如下,不同的关键词列表将被2004年5—6月的数据作为保留样本进行检验。这部分研究分为两个步骤:

(1)对特定关键词效果进行评估: 保留有吸引力的关键词,摒弃无吸引力的关键词,通过2004年数据,分别用模型与非模型策略对下列问题进行决策:

·哪些关键词具有吸引力,应当被保留为竞价目标? (对于“有吸引力”的定义将在下文讨论)如果关键词具有吸引力,则公司将继续为其竞价,公司在5—6月的竞价策略将与4月一致。

·哪些关键词不具有吸引力,应当被企业摒弃? 如果关键词不具有吸引力,则企业将不在5—6月对其竞价。根据不同策略,将产生不同的关键词列表。

(2)对保留样本的关键词效果进行评估。通过2004年5—6月的数据对不同策略产生的收益进行分析,在假定出特定的每预订收益后,基于预订数与每预订成本进行收益分析。

下一部分,我们将对关键词列表的形成进行探讨,并且阐述如何依据对抗样本对不同策略的绩效进行分析。

关键词列表的创建

什么样的关键词具有吸引力? 如果能够掌握边际收益,那么我们就能计算出关键词带来的利润。遗憾的是,我们并没有这些数据。不过我们仍然可以通过保留样本对不同策略下选择的关键词进行效果比较(这里,我们需要针对每预订成本设立一个阈值(CPRthreshold),以区分关键词是2004年5—6月的数据)看是否具有吸引力?

非模型策略

首先,本文从公司在竞价中采取的易于操作的非模型策略进行分析:

·无作为策略: 仍然是这些关键词。无作为策略不需要对关键词效果进行评价,也不能解释任何现象,这也是2004年公司最常采用的策略。

·表面价值策略: 从2004年4月的数据中观察关键词的表面价值,使所有关键词的月每预订成本低于每预订成本阈值。其中,产生零预订的关键词的CPR概率值等于∞(costsw>0,reservationw=0)。这种策略使公司在竞价过程中只保留了极少量的关键词,他们往往忽略那些不能产生或只能产生很低点击率的低频词汇。

·点击率策略: 设立点击率阈值为x,使所有关键词的点击率大于阈值x。点击率数据易得性使得在现实中利用点击率进行竞价一种常用方法,需要的唯一数据由搜索引擎提供。尽管通过点击率可以对关键词的效果进行分析,然而,阈值x只是管理者的武断选择,并不能够确定可以通过它使得利润最大化。

通过上述三种策略,产生了不同的关键词列表。无作为策略保留了全部301个关键词,表面价值策略与点击率策略分别从301个关键词中选取不同的子集作为新列表。

模型策略

本文通过2004年4月数据对每个关键词的日转换率进行估算,当然,这只是选取优效关键词的第一步,我们还需要通过月转化率(Convratew monthly)获得特定关键词w的月CPR值(CPRw month-ly)。月转换率由基于日点击率的日转换率(PConvw,t)进行计算,公式为:

接着我们对月每点击成本(CPCwmonthly)进行计算。通过月每点击成本和月转换率可以得到月每预订成本(CPRwmonthly)。

之后,我们对特定关键词的绩效评估都基于月每预订成本。

模型使得基于月CPR值对每个关键词的评价成为可能,在无模型状态下,我们只能对84个关键词的月CPR值作出计算,其余的217个只能被视做有无穷大的值。ML模型、贝叶斯模型和HB模型测出不同的月CPR值。依据不同模型,我们通过月CPR值对关键词进行排序(其中,这些关键词的月CPR值低于设定的CPR阈值,不符要求的关键词被去掉)。这样,就产生了基于模型的不同关键词列表。

保留样本对比分析

公司决定在5—6月延用4月使用的关键词,我们恰好可以利用此机会对其他策略推导出的关键词列表进行效果评估。评估过程可以依据以下两个标准:

·预订数,在该策略的运用下,会产生多少预订?

·CPR(每预订成本),在该策略的运用下,需要的每预订成本是多少?

鉴于没有掌握边际收益,我们通过假定收益来评估不同策略下所选关键词的有效性,并基于不同策略带来的不同收益(策略收益,πstrategy)进行研究:

实证实例

在设立CPR阈值的时候,我们并不能肯定它能够对公司起到好的效果。不过基于平均预订数,30~50美元的CPR值较为合理,我们将CPR阈值范围定为20~60美元。实验证明CPR阈值并不影响所采取策略的效果,为了证明这个结论,我们假设阈值为30美元,进行探究。

首先,将最优模型策略(HBWG模型,见表4)与非模型策略进行比较: 无作为策略运用了301个关键词,拥有最大的预订数,但同时,CPR与总成本也最高; 表面价值策略选取的关键词数量最少,只有74个(因为零预订的关键词都被删除了),产生的预订不多,CPR值在几种策略中最低,只有5.87美元; 点击率策略产生的结果尚存争议,因为没有明确的方法去选取一个目标点击率。我们将高于平均点击率的词语选为有吸引力的关键词,尽管这些关键词与最优模型所选择的词语非常相近,点击率策略却不能很好地对关键词是否具有吸引力进行很好的区分,同时,还导致了极高的CPR值。最优模型的策略解决了这些问题——有效区分关键词,低CPR值,低成本。我们将非模型策略与最优模型策略在收益方面进行比较时得出,2个月的时间内,后者比前者多赢利1200美元,或者说,每个关键词两个月多收益8美元,一年多收益48美元。因此,研究证明点击率策略并非使得利润最大化的最优策略,它甚至不如表面价值策略产生的利润多。

其次,对不同模型(MLCV,BayesCV和HBWG模型)产生的个关键词进行比较。在之前的分析中,我们得出关键词异质性以及词汇统计资料对转换率的模型估算有重要作用,那么对于HBWG模型来说,在对保留样本的CPR进行检验后,它是否依然是拟合度最高的最优模型呢?

表4 保留样本分析: 非模型策略与模型策略的比较

表5 保留样本分析: 模型间比较

在表5中,我们通过保留样本对三个模型进行分析。从收益角度来看,HBWG模型优于其他模型。MLCV模型高估了转换率,在301个关键词中,该模型选择173个词作为有吸引力的关键词,产生的收益甚至低于无作为策略。而BayesCV模型则相反。该模型在选择关键词时较为保守,只选择79个词语作为有吸引力的关键词,在词语数量选择和转换率方面都与表面价值策略大致相近。然而在收益方面,HBWG模型优于所有非模型策略。作为MLCV模型和BayesCV模型的居中模型,HBWG模型很好地对关键词是否具有吸引力进行区分。

最后,通过对保留样本的分析,证明HBWG模型为最优模型(见表6),比BayesCV模型多出110的预订数,平均CPR值为21.7美元,低于我们假定的边际收益30美元。在保留样本的分析过程中,对模型预测能力起关键作用的是关键词的异质性,这同我们先前进行的样本研究得出的结论是一致的。当我们将关键词异质性加入讨论,能对协同因素的分析产生最大促进。因此,基于关键词异质性和词汇统计资料的分层模型分析能够大大提高模型预测能力。

表6 保留样本分析: 收益

结论和局限性

本文基于关键词对付费搜索广告进行研究,研究重点关注两个问题: ①如何对关键词的效果进行评估? ②能否通过对关键词的评估提高企业在竞价活动中的绩效? 就我们所知,本研究是在营销领域对付费搜索广告进行的第一次实证分析。作为网络广告领域中发展最为迅猛的付费搜索已成为Web2.0时代为数不多的盈利方式之一,众多公司也将付费搜索竞价活动纳入并作为其营销预算的主要部分。希望本研究的结论能够对公司的竞价活动起到有效作用。

付费搜索的竞价活动可以基于CPR值进行评估,然而,通常大部分关键词都不能产生预订。在研究中,301个关键词中有84个在2004年4月产生预订,我们只能对这84个词进行转换率的估算。但这并不意味着其他关键词就完全属于零预订,或是有无穷大的CPR值。我们是否能够直接把这些词去掉呢?

答案是否定的。因此,我们建立模型解决这一问题,在模型中,转换率被定义为基于点击的二元选择决策,并通过收缩方法与似然性对每个关键词的日转换率进行估算。模型通过关键词绩效评估手段如广告位置和点击率以及关键词特质(即词汇统计资料)进行解释转换率估算结果的不同。研究证明,对特定关键词进行分析时,必须将关键词的异质性纳入研究范围,进而通过日转换率对月CPR值进行估算。

研究通过保留样本对非模型策略和模型策略进行比较,而我们的目的并不在于研究如何使得付费搜索竞价活动中的竞价效益最大化,比如,并不针对具体的竞价数额进行探究。此次研究将作为竞价活动最优选择的基石,它的意义就在于转换率的数据稀缺,并不易得。我们在保留样本中,对模型策略和非模型策略进行对比,探究哪种策略更有利于企业的竞价行为?

基于不同策略对有效关键词与无效关键词进行区分,建立不同的关键词列表,保留有效关键词,删除无效关键词。根据2004年5—6月数据提供的CPR和收益值,我们对不同的模型分别进行评估,研究发现最优模型策略的收益高于非模型策略。而此中对于区分关键词是否有效的唯一方式即为利用CPR策略。在模型的应用过程中,我们尽量使用容易从管理者那里得到的数据,让他们能够利用研究结果对广告位置,成本等作出正确决策。不过,由于数据的短缺,研究过程受到限制,使结果存在一定误差。首先,公司在研究时期内并不会改变它们的竞价策略,在对样本和保留样本的估计过程中,我们无法对公司的竞争者进行评估,这样,许多被竞争环境影响而发生变化的关键因素如平均位置和每点击成本(CPC)等在本研究中都是不变的,这阻碍了我们对拍卖环节进行模型分析。公司不能掌握竞争者的竞价策略,搜索引擎又有义务对其进行保密,这让我们的数据收集变得艰难。其次,模型中依据用户选择过程的点击流数据不可得。如果能够得到相关数据,那么我们就可以对消费者行为特征对转换率的影响作出分析。最后,在研究中没有包含对链接广告与登录页面设计的分析。在后续研究中,我们将对付费搜索广告中的这两个关键因素进行分析。

附录参考文献

[1]AINSLIE A. P.E.Rossi. Similarities in Choice Behavior Across Product Categories[J]. Marketing Science,1998,17(2): 91-106.

[2]ALLENBY G,P. Rossi. Bayesian Statistics and Marketing[J]. Marketing Science,2003,22:304-328.

[3]ANDREWS R.,A. Ainslie,I.S. Currim. An Empirical Compari-son of Logit Choice Models with Discrete Versus Continuous Repre-sentations of Heterogeneity[J]. Journal of Marketing Research, 2002,34:479-487.

[4]BHAT S.,M. Bevans,S. Sengupta. Measuring the Users'Web Activity to Evaluate and Enhance Advertising Effectiveness[J]. Journal of Advertising,2002,31: 97-106.

[5]BRADLOW E. T.,D. C. Schmittlein. The Little Engines that could: Modeling the Performance of World Wide Web Search En-gines[J]. Marketing Science,2000,19(1): 43-62.

[6]BROADBENT S. Modeling with Ad Stock[J]. Journal of the Market Research Society,1984,16: 295-312.

[7]BURKE R. ,T. K. Srull. Competitive Inference and Consumer Memory for Advertising[J]. Journal of Consumer Research,1988,15: 55-67.

[8]BUSINESSWEEK. The Counterattack on Google[N]. Working Paper,2006-05-08.

[9]CHATTERJEE P. ,D. L. Hoffman,T. P. Novak. Modeling the Clickstream: Implications for Web-Based Advertising Efforts[J].Marketing Science,2003,22( 4) : 520-541.

[10]CHEN Y. ,C. He. Paid Placement: Advertising and Search on the Internet[EB /OL]. Working Paper,2006.

[11]CHO C,J. Cheon. Why do People avoid Advertising on the Internet?[J]. Journal of Advertising,2004,33: 89-97.

[12]DAHLEN M. Banner Advertisements through a New Lens[J].Journal of Advertising Research,2001,8: 23-30.

[13]DAHLEN M. ,Rasch,A. ,Rosengren,S. Love at first Sight? A Study of Website Advertising Effectiveness[J]. Journal of Advertising Research,2003,3,25-33.

[14]DANAHER P. ,Mullarkey,G. Factors affecting Online AdvertisingRecall: A Study of Students[J]. Journal of Advertising Research,2003,9: 252-267.

[15]DREZE X. ,F-X. Hussherr. Internet Advertising: Is Anybody Watching? [J]. Journal of Interactive Marketing,2004,17: 8-23.

[16]EDELMAN B. ,M. Ostrovsky. Strategic Bidder Behavior in SponsoredSearch Auctions[J]. Decision Support Systems,2007,43( 1) : 192-198.

[17]EDELMAN B. ,M. Ostrovsky,M. Schwarz. Internet Advertising and the Generalized Second Price Auction: Selling Billions of Dollars Worth of Keywords[J]. American Economic Review,2007,3.

[18]GELFAND A. E. ,A. F. M. Smith. Sampling-based Approaches to Calculating Marginal Densities[J]. Journal of the American StatisticalAssociations,1990,85: 997-985.

[19]GELMAN A. ,J. B. Carlin,H. S. Stern,Rubin,D. B. Bayesian Data Analysis[M]. Chapman,Hall /CRC,Boca Raton,FL,2004.

[20]GOODMAN A. Winning Results with Google AdWords[M].McGraw-Hill /Osborne,Emeryville,CA,2005.

[21]HAVLENA W. ,J. Graham. Decay Effects in Online Advertising:Quantifying the Impact of Time since last Exposure on Branding Effectiveness[J]. Journal of Advertising Research,2004,12: 327-332.

[22]HOFACKER C. ,J. Murphy. Clickable World Wide Web Banner ads and Content Sites[J]. Journal of Interactive Marketing,2000,14: 49-59.

[23]HOFFMAN D. ,W. Kalsbeek,T. Novak. Internet and Web Use in the US[C]. Communications of the ACM,1996,39 ( 12) : 36-46.

[24]JANSEN B. J. ,P. R. Molina. The Effectiveness of Web Search Engines for Retrieving Relevant Ecommerce Links[J]. Information Processing and Management,2005,42: 1075-1098.

[25]JANISZEWSKI C. Preattentive Mere Exposure Effects[J]. Journal of Consumer Research,1993,20: 376-392.

[26]JOHNSON E. J. ,W. Moe,P. Fader,S. Bellman,G. Lohse.On the Depth and the Dynamics of Online Search Behavior[J].Management Science,2004,50( 3) : 299-308.

[27]LYNCH J. G. Jr. ,D. Ariely. Wine Online: Search Costs Affect Competition an Price,Quality and Distribution[J]. Marketing Science,2000,19( 1) : 83-103.

[28]MANCHANDA P. ,J. -P. Dube,Y. Goh,P. Chintagunta. The Effects of Banner Advertising on Internet Purchasing[J]. Journal of Marketing Research,forthcoming,2006.

[29]MCCULLOCH R. E. ,P. E. Rossi,G. M. Allenby. The Value of Purchase History Data in Target Marketing[J]. Marketing Science,1996,15( 4) : 321-340.

[30]MONTGOMERY A. ,S. Li,K. Srinivasan,J. C. Liechty. Modeling Online Browsing and Path Analysis Using Clickstream Data[J]. Marketing Science,2004,23: 579-595.

[31]MOORE S. ,C. Stammerjohan,R. Coulter. Banner Advertiser-Web Site Congruity and Color Effects on Attention and Attitudes[J]. Journal of Advertising,2005,34: 71-84.

[32]MORRISON D. G. ,D. C. Schmittlein. Predicting Future Random Events based on Past Performance[J]. Management Science,1981,27( 9) .

[33]NOVAK T. P. ,D. L. Hoffman. Advertising and Pricing Models forthe Web,in Internet Publishing and Beyond[M]. Cambridge: MIT Press: 2000.

[34]RATCHFORD B. T. ,M. Lee,D. Talukdar. The Impact of TheInternet on Information Search for Automobiles[J]. Journal ofMarketing Research,2003,XL( 5) : 193-209.

[35]RUTZ O. J. ,R. E. Bucklin. From Generic to Branded: A Model of Spillover Dynamics in Paid Search Advertising[EB /OL]. WorkingPaper,2006.

[36]SCHLOSSER A. ,S. Shavitt,A. Kanfer. Survey of Internet Users'Attitudes toward Internet Advertising[J]. Journal of InteractiveMarketing,1999,13: 34-54

[37]SCHMITTLEIN D. C. ,Bemmaor,A. C. ,Morrison,D. G. Whydoes the NBD Model work? Robustness in Representing ProductPurchases,Brand Purchases and Imperfectly Recorded Purchases[J]. Marketing Science,1985,4( 3) .

[38]SHEN F. Banner Advertisement Pricing,Measurement,and Pretesting Practices: Perspectives from Interactive Agencies [J].Journal of Advertising,2002,31: 59-67.

[39]SPITERI L.F. Access to Electronic Commerce Sites on the World Wide Web: An Analysis of the Effectiveness of Six Internet Search Engines[J]. Journal of Information Science,2000,26(3): 173-183

[40]STEENBURGH T.J.,Ainslie,A.,Engebretson,P.H. Massively Categorical Variables: Revealing the Informationin ZIP Codes[J]. Marketing Science,2003,22(1).

[41]TELANG R.,P. Boatwright,T. Mukhopadhyay. A Mixture Mod-el for Internet Search Engine Visits[J]. Journal of Marketing Re-search,2004,XLI(5):206-214.

贝叶斯估计

我们利用分层模型对关键词异质性进行分析(Steenburgh,et al.,2003)。

(1)vw,t=XTw,tβwww,t forw=1,…,n keywords

(2)ωw=Cwγ+vw forw=1,…,n keywords

XTw,ti是具有截距项的向量,M-1个关键词随着时间而变化(因素包括广告位置,点击率和成本)

βw是被估计的系数向量;

ωw是特定关键词的影响;

Cw是词汇统计资料矩阵,一定时间内不发生改变(指标: 普通,“美国”,州名,城市名);

γ是被估计的系数向量酒店或酒店相关词语;

εw,t是关键词w在t时的罗吉特误差;

vw~N(0,Vw)

为了作出鉴定,Cw可以没有截距项。

先验分布

(1)β~Nwβ,Vβ),超先验分布满足条件:

μβ~N(μb,Vb)Vβ~Wishard(v1,v2)

标准值应用于超先验分布中的向量。

(2)γ~Ncγ,Vγ),满足条件: μγ=Oc,Vγ=106Ic

(3)Vw~gamma(k/2,m/2),满足条件: k=4,m=4。

样 例

(1)重新赋值βw,并使用Metropolis-hastings方法接受或拒绝新值。

(2)重新赋值,并使用Metropolis-hastings方法接受或拒绝新值。

(3)运用吉布斯采样方法选取μβ,Vβ

(4)运用吉布斯采样方法选取γ1,Vw

步骤2和步骤4不应用于未将词汇统计资料纳入研究的贝叶斯模型。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈