当因变量是离散的整数时,应考虑应用计数模型(Count Model)。在计数模型中使用较为广泛的是泊松模型,可以通过极大似然估计量与最大化对数似然函数,来求解泊松分布的参数。如果均值和标准差近似相等,则极大似然估计量是一致的、有效的,且渐进服从正态分布。但是,泊松关于均值和标准差近似相等的假定,在实际应用中经常不成立:如果这一条件被拒绝,模型就会被错误地设定。此时,则使用负二项式回归模型,在条件均被正确设定的情况下,使用准极大似然法进行参数的估计(Quasi-Macamum Likelihood,QML)(高铁梅,2012)。
企业发明专利的数量,具有典型的负二项回归特征(高铁梅,2012;Chunlei et al.,2014)。采用负二项回归模型对企业发明专利数量进行回归分析,以研究企业技术创新、探索性创新等绩效影响因素和机制,是相当部分技术创新领域实证研究的共同选择。也有部分研究使用泊松分布模型进行回归分析,但使用情境有所不同。泊松模型分析的技术创新绩效,主要发生在相对成熟的技术领域里。在成熟技术领域,用发明专利数量来衡量的技术创新绩效,具有相对明确的主要影响因素,如知识积累、研发投入和创新网络的位势等,发明专利数量呈现相对稳定的变异特征,能够满足泊松分布关于变量标准差和均值近似相等的严格假设。但是,在新兴技术领域,新兴技术的创新与成效,存在高度不确定性和跳跃性,相比于成熟技术发明专利,新兴技术发明专利的分布更加离散,影响因素也更加复杂多变,目前尚未有成熟和清晰的理论框架来阐释新兴技术创新的动力源泉与机制。当标准差不近似地等于均值时,新兴技术发明专利的数量服从负二项回归。较之一般的线性回归模型,负二项回归模型包含了对横截面异质性的自然表述,既可以对非正态分布的样本回归进行刻画,同时又可以解决泊松分布无法处理的过度分布问题(Chang et al.,2010;马述忠等,2013)。因此,本章采用负二项回归模型进行新兴技术创新数量的分析。
1.负二项回归模型及其设定
以新兴技术创新数量作为结果变量,采用负二项回归模型进行回归分析,检验双重资源多样性和双模网络结构,对新兴技术创新数量的独立效应做出假设。借鉴马述忠(2013)的方法,采用符合如下分布函数的负二项回归模型来建模。如式5.1-1所示。
其中,i表示个体区别,Patent为被解释变量新兴技术发明专利数量,x为解释变量,λ是引入了伽马分布误差项的泊松参数,ε为样本观测效应,误差项exp(εi)服从参数(1,δ)的伽马分布,且独立分布。用极大对数似然函数的求解原理,可获得简化后的计量模型,模型具体设定如式5.1-2所示。
其中,Patanti为新兴技术创新数量,以新兴技术发明专利数量来衡量;αi为常数向量;xim为维度为m的解释变量向量,主要包括双重资源多样性(知识多样性与研究者多样性)、知识网络结构(知识网络结构洞与知识网络中心势)、合作网络结构(合作网络结构洞与合作网络中心势)等6个解释变量;βim是其回归系数向量;φi为控制变量向量,主要包括衡量企业规模的销售收入,衡量企业研发重视程度的研发投入,衡量企业研发成果和实力的发明专利总数,以及企业新兴技术研发经验;γin为其回归系数向量;εi为残差向量。
2.负二项回归模型检验结果
采用Eviews6.0软件的计数模型进行负二项回归模型回归分析。为了检验有关变量对模型的解释力,同时检验各个解释变量和新兴技术创新数量之间的关系强度,共分5步,采用5个模型进行逐步回归,回归结果见表5-1。
表5-1 新兴技术创新数量作为结果变量的负二项回归模型回归结果表
注:括号中为z值;*表示p<0.05(双尾),**表示p<0.01(双尾),***表示p<0.001(双尾)。
首先,将控制变量对新兴技术创新数量回归作为基准模型。基准模型回归结果显示,新兴技术创新数量和四个控制变量显著正相关,McFadden R2的值为0.47,说明控制变量解释了新兴技术创新数量变异的47%,似然比LR检验显著,LR后的括号中数字,是LR检验的自由度,为解释变量个数。
(1)知识动力源泉影响新兴技术创新数量的独立效应检验结果。模型1和模型2分别用来检验知识多样性和知识网络结构对新兴技术创新数量的影响。为了检验知识多样性与新兴技术创新数量之间的倒U形关系假设,采用倒U形关系检验的常用方法,将知识多样性及其平方项纳入回归模型。模型1检验结果显示,相比于基准模型,McFadden R2增加了15个百分点,似然比检验显著,说明知识多样性及其平方项对新兴技术创新数量具有显著的解释力。模型2中,将知识网络结构的两个变量纳入回归模型,检验知识资源的生态秩序对新兴技术创新数量的影响。
检验结果表明,相比于模型2,McFadden R2增加了9个百分点,似然比检验显著,说明知识网络结构洞和知识网络中心势对新兴技术创新数量具有显著的解释力。
采用模型2的标准化回归系数作为检验结果,各变量回归系数的符号验证了理论假设,企业销售收入、研发投入、发明专利总数以及企业在新兴技术领域的研发经验,都和新兴技术创新绩效数量显著正相关,符合企业研发活动的基本规律。知识多样性的一次项回归系数显著为正(标准化回归系数0.09,P<0.001),二次项回归系数显著为负(标准化回归系数为-0.10,P<0.01),系数检验结果表明知识多样性与新兴技术创新数量呈倒U形关系。知识网络结构洞与新兴技术创新数量显著负相关(标准化回归系数为-0.10,p<0.001),而知识网络中心势与新兴技术创新显著正相关(标准化回归系数为0.11,p<0.001)。(www.daowen.com)
(2)研究者动力源泉影响新兴技术创新数量的独立效应检验结果。模型3和模型4分别用来检验研究者多样性与合作网络结构对新兴技术创新数量的影响。根据理论假设,由研究者多样性和合作网络结构形成的团队创新动力和知识多样性与知识网络结构形成的知识创新动力存在整合效应。相关系数检验结果也表明,知识多样性和研究者多样性、知识网络结构与合作者网络结构等变量之间存在较为复杂的相关性。尝试在模型2的基础上直接增加研究者多样性等变量,多重共线性检验结果显示,知识多样性、研究者多样性、知识网络结构洞和合作网络中心势的方差膨胀因子VIF值都超过100,检验结果显示这几个变量之间存在严重的多重共线性。在这个条件下,检验研究者多样性和合作网络结构对新兴技术创新数量的影响,宜在基准模型上增加变量,而不能在模型2的基础上增加变量,以避免多重共线性问题。模型3结果显示,相比于基准模型,McFadden R2增加了5个百分点,似然比检验显著,说明研究者多样性及其平方项对新兴技术创新数量具有显著的解释力。模型4结果显示,相比于模型3,McFadden R2增加了7个百分点,似然比检验显著,说明合作网络结构对新兴技术创新数量具有显著的解释力。
采用模型4的标准化回归系数作为检验结果,各变量回归系数的符号验证了理论假设,研究者多样性与新兴技术创新数量呈倒U形关系的假设得到验证,一次项回归系数显著为正(标准化回归系数为0.09,p<0.001),二次项回归系数显著为负(标准化回归系数为-0.12,p<0.01),合作网络结构洞和新兴技术创新数量显著负相关(标准化回归系数为-0.07,p<0.05),而合作网络中心势则与新兴技术创新数量显著正相关(标准化回归系数为0.13,p<0.01)。
3.中美两国企业样本比较分析
将中美两国企业样本分组后分别回归,以比较中美两国企业样本的解释变量对新兴技术创新数量的影响是否存在差异,存在何种差异。先用中美两国企业样本,用知识多样性、知识多样性平方项、知识网络结构洞、知识网络中心势及控制变量对新兴技术创新数量进行回归,回归结果(见表5-2)。再用中美两国企业样本,用研究者多样性、研究者多样性平方项、合作网络结构洞、合作网络中心势对新兴技术创新数量进行回归,回归结果(见表5-2)。结果显示,无论是知识角度的回归模型,还是研究者角度的回归模型,中美两国企业样本的回归结果都显著,且绝大部分解释变量与控制变量的回归系数都通过了假设检验,符号与全部样本的回归模型相一致,说明分样本的回归情况良好,进一步验证了相关假设。但是,中国企业样本的知识多样性平方项和美国企业样本的知识网络结构洞等个别解释变量的回归系数不显著。造成回归系数变化或者假设检验通不过的原因有两个:一是计量模型变化导致的,二是样本数量变化导致的。对样本进行分组后,中国样本数量为122个,比全部样本数量少了一半以上,样本数量减少可能会导致部分参数的估计出现偏差,甚至导致不显著或者符号相反等结果。这一结果,也有理论上的含义,反映了中美两国企业样本在新兴技术创新特征上的差别。
表5-2 对新兴技术创新数量的影响:中美两国企业样本的比较表
注:括号中为z值;*表示p<0.05(双尾),**表示p<0.01(双尾),***表示p<0.001(双尾)。
(1)知识动力源泉的比较。回归结果显示,中美两国企业样本的Mcfadden R2分别为0.46和0.51,相差5个百分点。说明中国企业样本的知识动力源泉对新兴技术创新数量的影响只占到总变异的46%,而美国企业样本则达到51%,这预示着中国新兴技术企业的专利数量影响因素更加复杂,或者其他解释变量起着更重要的作用。中美两国企业样本的控制变量与解释变量回归系数,除了中国企业样本中的知识多样性平方项、美国企业样本中的知识网络结构洞两个回归系数不显著之外,主要变量的回归系数都通过了显著性检验,且符号与样本总体完全一致。
控制变量方面,中国企业样本的销售收入和研发投入的回归系数比样本总体的回归系数有所降低,但降低相对较少,可能不具备太多理论含义,更多的是样本量变化的原因。但是,新兴技术领域研发经验的回归系数未通过假设检验,主要是因为中国企业在新兴技术领域的研发经验相对较少,涉足新兴技术特别是新一代信息技术、生物制药、高端装备制造技术等领域的时间相比于美国而言要晚10—20年。在本书所采集的7个新兴技术领域样本中,中国企业样本涉足新兴技术领域的研发经验,均值为11.5年,而美国企业样本的均值达到17.6年,样本均值的T检验结果表明二者具有显著差异。这导致处于后发地位的中国企业在新兴技术领域的创新,不是依靠过往积累,而是更多地依赖前瞻性探索。相比之下,美国企业样本中的新兴技术领域研发经验与新兴技术创新数量的关系有所增加,说明经验积累在美国企业新兴技术创新中发挥了更重要的作用。
解释变量方面,中国企业样本中,知识多样性的一次项回归系数(标准化回归系数为0.13,p<0.01)、知识网络结构洞(标准化回归系数为-0.11,p<0.01),以及知识网络中心势(标准化回归系数为0.15,p<)等三个主要的解释变量,比样本总体都有所强化(标准化回归系数分别为0.09、-0.10、0.11)。但是,知识多样性的平方项未能通过显著性检验,说明中国企业样本的知识多样性与新兴技术创新绩效的倒U形关系未能得到验证,而正相关的关系却得到了验证。除了计量方面的原因之外,另一个可能的原因是,中国进行新兴技术创新的企业,总体上处于新兴技术创新的初期或者成长期,知识的积累、知识的探索以及知识的动态更新等,尚未达到边际效应为负的阶段,也就是说知识多样性的水平正处在与新兴技术创新绩效正相关的阶段。这种情况下,对有限的知识如何进行组织,可能处于更加重要的地位,在回归结果中表现为回归系数的强化(回归系数绝对值增加)。
(2)研究者动力源泉的比较。回归结果显示,中美两国企业样本的Mcfadden R2分别为0.43和0.59,相差16个百分点。说明中国企业样本的研究者动力源泉对新兴技术创新数量的影响,只占到总变异的43%,而美国企业则达到59%。结合中国企业样本的知识动力源泉对新兴技术创新绩效变异的解释也低于美国企业样本。两个方面都说明中国新兴技术企业的创新数量,除了知识动力源泉和研究者动力源泉之外,更有可能取决于这些创新资源是如何组织的。中美两国企业样本的控制变量与解释变量回归系数,主要变量的回归系数都通过了假设检验,且符号与样本总体一致。
控制变量方面,销售收入这一变量的回归系数在中美企业样本之间发生了一定程度的分化。与样本总体回归系数相比(标准化回归系数为0.13,p<0.01),中国企业样本销售收入的回归系数略有增加(标准化回归系数为0.14,p<0.001),但是美国企业样本的回归系数明显下降(标准化回归系数为0.10,p<0.001)。研发投入的回归系数,中国企业样本明显增加(标准化回归系数为0.09,p<0.001),而美国企业样本略有下降(标准化回归系数为0.06,p<0.01)。发明专利总数和新兴技术研发经验这两个变量回归系数的变化不大。结合销售收入和研发投入的变化情况,可以看出,相比于美国企业样本,中国企业销售和研发投入,对新兴技术创新绩效的影响更大。这符合中国企业新兴技术创新的阶段性特征,在新兴技术创新初期或者成长期,中国企业更加依赖对新兴技术创新的投入和研发动机的强度。
解释变量方面,中美两国企业样本回归系数发生明显变化的是合作网络中心势,由0.13(p<0.01)增加到0.18(p<0.01),而美国企业样本发生明显变化的是研究者多样性的平方项,强度上由-0.12(p<0.01)增加到-0.15(p<0.01);合作网络中心势的回归系数由0.13(p<0.01)下降到0.10(p<0.01)。可以看出,相比于美国企业而言,中国企业合作网络中心势对新兴技术创新数量的影响更大,美国企业研究者多样性的边际递减效应表现更加突出,这可以更进一步地解释中美两国样本企业在新兴技术创新阶段上的差异。
(3)综合比较分析。中国企业样本中,对新兴技术创新数量的影响强度,依次为:合作网络中心势(标准化回归系数为0.18,p<0.01)、知识网络中心势(标准化回归系数为0.15,p<0.01)、发明专利总数(标准化回归系数为0.14,p<0.05)、知识多样性(标准化回归系数为0.13,p<0.01)、销售收入(标准化回归系数为0.12,p<0.01)、研发投入(标准化回归系数为0.10,p<0.01)。美国企业样本中,对新兴技术创新数量的影响强度,依次为:销售收入(标准化回归系数为0.15,p<0.01)、研发投入(标准化回归系数为0.13,p<0.05)、研究者多样性(二次项标准化回归系数为-0.15,p<0.01)、知识网络中心势(标准化回归系数为0.10,p<0.001)与合作网络中心势(标准化回归系数为0.10,p<0.01)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。