理论教育 内生性问题的分析探讨

内生性问题的分析探讨

时间:2023-06-01 理论教育 版权反馈
【摘要】:近年来,很多相关研究都发现内生性问题会对研究结果产生重要的影响。例如,Oberholzer-Gee和Strumpf[190]在研究中发现,对音乐行业而言,控制内生性的影响后,音乐文件的网络下载次数对专辑销量的影响由显著变为不显著。在产品评论与销量关系的研究中,内生性也是一个重要的问题。Chintagunta等[192]也考虑了内生性问题。因此,在基于多属性离散选择的产品销量模型中,也存在内生性问题。表6-1产品销量计量模型中相关变量的定义

内生性问题的分析探讨

在计量模型中,内生性的存在将导致解释变量系数的估计结果产生偏误。产生内生性的一个主要原因是某些变量难以被观测或者度量,从而使得模型中遗漏了重要的相关变量[188]。如果这个被遗漏的变量同时与因变量以及目标自变量相关,那么解释变量与随机扰动项的无关性假定就不再成立,从而使得最小二乘的估计方法不再有效,并且目标自变量的估计结果是有偏的[189]

近年来,很多相关研究都发现内生性问题会对研究结果产生重要的影响。例如,Oberholzer-Gee和Strumpf[190]在研究中发现,对音乐行业而言,控制内生性的影响后,音乐文件的网络下载次数对专辑销量的影响由显著变为不显著。其原因是难以观测的变量(如音乐质量和受欢迎程度)同时影响着音乐的网络下载量和专辑销量。

在产品评论与销量关系的研究中,内生性也是一个重要的问题。原因在于影响产品销量的可能并非是产品评论,而是其他一些产品本身的内在因素,例如Oberholzer-Gee和Strumpf[190]提到的产品受欢迎程度,以及Basuroy等人[191]提到的产品年龄

现有关于产品评论与销量关系的研究也印证了这一说法。Duan等[110-111]在对电影行业口碑效应的研究中指出,对内生性的思考会显著影响口碑效应的分析结果。他们的研究结果发现,控制内生性后,只有评论数量对评论的口碑效应具有显著影响,而评论分数的影响并不显著。Chintagunta等[192]也考虑了内生性问题。他们将电影产业的口碑研究细化到区域市场,并且指出在控制内生性后,评论数量对总体市场具有显著的影响,而评论分数则对区域市场产生显著的影响。

因此,在基于多属性离散选择的产品销量模型中,也存在内生性问题。本书主要通过在模型中添加控制变量,以控制更多的因素,从而减小内生性的影响。

大多数现有相关研究将产品评论的数量(Volume)、情感极性(Valence)和情感极性混杂度(Variance)作为度量产品评论口碑效应的指标[105-117]。其中,产品评论的情感极性主要是以星级评分的平均值来判断,产品评论的情感极性混杂度主要是以星际评分的方差来衡量。此外,其他控制变量还包括:

(1)产品年龄:Basuroy等人[191]指出处于生命周期不同阶段的产品在销量上存在很大差异。

(2)受欢迎程度:Oberholzer-Gee和Strumpf[190]提出产品的受欢迎程度也会影响产品销量。

(3)产品类型:Li和Hitt[116]、Liu[108]以及Jung Lee和Jae-Nam Lee[128]都认为产品类型决定该产品的目标市场,并且不同的细分用户群在购买力和购买行为上可能存在较大差异,从而影响产品的销量。

(4)零售商的竞争:Chevalier和Goolsbee[193]还提出网络零售商之间激烈的竞争也会影响产品的销量。

因此,本书在基于多属性离散选择的产品销量模型(详见公式(6-16))中加入了价格、评论的星级评分平均值、评分的方差、评论数量、评论平均长度、有用评论的数量、产品年龄、受欢迎程度、产品类型和网络零售商的竞争等多个控制变量来削弱内生性的影响。

然而,还有一些因素可能因为难以观测和度量而无法直接进行控制。例如产品自身的质量,产品的目标市场定位,以及通货膨胀加剧等因素都容易被忽略或者难以直接获得,却可能对产品定价以及消费者购买能力等产生影响,这些遗漏变量可能使得产品评论这一目标自变量与随机误差项相关,从而产生内生性问题,高估产品评论对销量的作用。(www.daowen.com)

产品质量、目标市场以及宏观经济增长等因素的变化缓慢,对产品销量的影响并非“立竿见影”,而是需要经过一段较长的时期才能起到作用。因此,本书将这些因素视作不随时间而变的遗漏变量,并且通过面板数据的固定效应模型(Fixed Effects Model)来控制它们造成的内生性问题[197]

综合上述,本书采用的控制变量包括:

(1)产品零售价格:用以控制销量随价格波动的情况;

(2)产品评论的数值信息:用以控制用户的星级评分等对产品整体评价的影响,包括评论的星级评分的平均值、评分的方差、评论数量、评论平均长度和有用评论的数量;

(3)产品年龄:以产品的发布时间来计算产品的年龄,用以控制产品生命周期对销量的影响;

(4)受欢迎程度:以产品在电子商务网站提供的热门排行榜中的排名来衡量,用以控制市场潮流等无法预测的周期性因素对产品销量的影响;

(5)产品类型:通常根据购买产品的细分市场,对其进行分类(例如手机被分为触摸屏手机、滑盖手机和翻盖手机等不同类型),用以控制产品分类对产品销量的影响;

(6)网络零售商的竞争:在网络购物过程中,消费者价格敏感性通常较高,由于在不同网站间的搜索成本和转换成本很低,所以该变量是用于控制网络渠道竞争对产品销量的影响;

(7)固定效应(FE):该变量是个体固定效应,由产品个体决定,具有在横截面上变化、在时间序列上不变的特点。

产品销量模型中相关变量的定义如表6-1所列。

表6-1 产品销量计量模型中相关变量的定义

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈