只有赋予概念以操作化的定义,才能具体表达概念所代表的意义,也才能由外在的观察与测量而得知概念的层次(吴明隆,2000)。在管理学的定量分析中,特别是在对潜变量的研究中,问卷调查法是最为常用的方法。本部分研究所涉及的区域创业环境的各要素信息,难以从公开的资料中获得数据,因此研究者将通过问卷调查法来收集相关数据信息。
1.区域创业环境问卷设计
荣泰生(2005)认为好的问卷设计必须遵循以下原则:问卷的内容必须与研究的观念性架构相互响应;问卷中的问题必须尽量使填答者容易回答;尽量不问个人隐私(例如收入、年龄等);先前的问题不影响对后续问题的回答;在问卷设计过程中,研究者必须决定哪些是开放性问题(open-ended questions),哪些是封闭性问题(close-ended questions);在正式使用问卷前应先经过预测的过程[2]。
本书的问卷设计拟采用上述的问卷设计原则,在问卷设计过程中尽量考虑了以下三点:将整个概念的构思包括在其中;在测量问卷的答项设置上简洁明了,易于一般成年人理解;控制问卷题项数量,减轻调查对象的负担。
为了获得具有信度和效度的问卷,本书遵循了比较成熟的问卷设计及验证方法。在问卷设计和验证的具体操作中主要遵循以下6个步骤:
一是文献研究。对创业环境、区域环境、产业集群等相关领域的文献进行回顾与整理,汇集与本研究相关信息,对区域创业环境的基本概念构思形成比较系统的初步认识。
二是访谈研究与焦点小组讨论。进行问卷设计之前,对24位来自高校、研究机构、企业、风险投资机构、中介、政府等组织的代表进行半结构化的深入访谈,同时安排了主题焦点小组讨论,并对特定区域创业环境进行了实地考察。了解环境当中影响创业主体创业活动的要素、区域创业环境的构成要素,以及区域创业环境如何对创业行为和绩效产生作用。通过访谈和焦点小组讨论,得到大量有关区域创业环境的关键事件信息。
三是分析访谈资料内容。在本书第四章里,研究者根据访谈资料信息,通过内容分析方法,初步得到区域创业环境的5个要素概念构思,即政府政策、创业资源基础、创业网络、创业文化、创业服务。同时,依据访谈资料内容,用演绎法提出能够反映这5个要素的各个具体条目。
四是编制初始问卷。将基于文献梳理所获得的测量条款以及基于内容分析结果演绎所获得的测量条款分别进行归类和汇总,形成区域创业环境的初始量表。采用面谈或电子邮件的方式,向创业和区域经济研究领域以及在问卷设计方面有丰富经验的专家学者征求意见,咨询的内容主要集中在问卷中各题项间逻辑关系、题项措辞、题项增删、题项与所测变量间的一致性等方面。同时,向实践人士征求意见,主要集中在题项的表达与措辞、问卷格式两方面。根据学界专家和实践人士的意见对问卷进行了相应的修改,形成了问卷初稿。初步选择了30个题项进入项目池(the pool of items),分别测量政府政策、创业资源基础、创业网络、创业文化、创业服务这5个区域创业环境的内容维度。每一个项目采用Likert五点量表测量其符合程度(从“1”表示“极不符合”到“5”表示“完全符合”)。
五是小样本预调研。对各潜变量的测量题项进行净化,去除信度较低的条款。采用的方法有两步:第一步,利用纠正条款的总相关系数(Corrected-Item Total Correlation,简称CITC)净化测量条款,对于CITC值小于0.5且删除后可以增加α值的条款予以删除;第二步,根据对试测数据进行斜交方式(考虑因素间相关)探索性因素分析(主成分因素提取)。特征值和碎石图结果表明可以抽取5个因素。根据概念定义及数据结果,去除在主要因素上负荷很小(小于0.3)或在多个因素上有负荷的项目,最终保留了27个题项。
六是修订问卷。为提高结构效度,请两位创业领域和区域经济学的博士仔细鉴定测量题项内容的充分性和一致性,以期测量题项能反映潜变量的概念构思域完整性。同时,在不影响概念构思域完整性的前提下,剔除语义不清或语义冗赘的项目,或对问项进行修订。
通过以上6个步骤,最终形成了区域创业环境量表,共包含27个测量条款(量表具体内容参见本书附录3第二部分)。
2.问卷的防偏措施
Fowler(1988)认为主要有4种原因可能导致非准确性应答:应答者不知道该问题的答案;应答者不能回忆所提问问题答案的信息;虽然知道这些问题答案的信息,但是应答者不想回答这些问题;应答者不能理解所问的问题。[3]由于本书中测量题项的回答主要建立在应答者的主观评价之上,因而可能存在上述所提到的导致测量出现偏差的因素。
尽管上述4个因素带来的测量偏差可能没有办法完全消除,但仍可以通过一些措施降低这些因素带来的偏误。对于第一种由于不熟悉情况所引起的偏差,本书这部分研究要求应答者是对所在单位比较熟悉的个人,如企业的中高层管理者,或政府相关部门领导等。对于第二种由于记忆偏差所引起的偏差,结合本书的研究需要,问卷题项都设计成对目前或近几年情况的描述,以尽量避免由于记忆与回忆引起的偏差。针对第三种由于应答者意愿性引起的偏差,笔者在问卷卷首庄严、醒目地向应答者承诺,问卷数据仅用于学术研究,不公开任何填答内容。此外,本问卷采取匿名的方式,即不要求应答者填写公司名称和个人信息。借助以上措施减轻或消除应答者的顾虑。针对第四种由于应答者不理解题项内容引致的问题,本问卷在设计过程中参考了现有的理论研究,广泛征求了学界与实践界的意见,进行多次修改,尽量避免了题项难以理解或者意义含糊不清的情况发生[4]。
3.研究样本及数据收集过程
收集有效的数据是实证研究过程中一个非常重要的步骤。本次调研获得国家社会科学基金、苏州市科技局软科学研究计划以及苏州市工业园区“十三五”规划项目的支持,这为调研的开展提供了便利的条件。本次调研以创业个人和新企业为调研对象,对区域创业环境等问题进行了比较深入的现场调研,以便对区域创业环境的基本情况有详尽的了解。
本研究为了检验问卷的信度和效度,在发放正式问卷之前进行了预测,以确定测量工具的可信程度和有效性。问卷初步设计完毕后,通过两种方式来获取样本:一种是直接发放与回收问卷。笔者自行联系中小企业局或者园区管委会获取新创企业名录,通过电子邮件或亲自前往企业请中高层管理者填写问卷,或者到多所大学的EMBA、总裁班和MBA课堂请学员填写问卷。另一种是关键被调查人技术。关键被调查人技术在管理领域的定量研究中常用,主要是通过一些与新创企业联系广泛的联系人,如高校教师、园区管委会政府官员等,由这些联系人将问卷以纸质或电子邮件的形式发放给相关企业的被调查者。被调查者回答完问卷后,直接将问卷寄给笔者,或经由联系人转交给笔者。
本研究试测样本来自北京、哈尔滨、上海、苏州、广州、西安、合肥等地,共发放问卷2 100份,收回843份,其中有效问卷225份。剔除无效问卷的原则有:问卷中有多处缺答现象的予以删除;问卷中“不确定”选项选择过多者予以删除。问卷回收率为40.14%,有效问卷率为10.71%(见表5.1);问卷填写呈现明显规律性的予以删除,如答案呈“Z”行排列、所有条款选同一项等(李晶,2010)。对于出现多选、漏选以及个人信息填报存在问题的问卷,都不予采用。
本次正式调研由课题组教师和研究生共6人参加。在进行正式调研之前,参与调研的人员参加了培训,由问卷设计者和预调研人员向其余人员讲解调研主要过程、需要特别注意的事项,以及如何获得有效问卷的技巧。为了减少调研过程中的理解偏误,6名调研人员分成3组,各调研小组共两名成员,每组分别由一名经验较丰富和一名经验较少的调研人员组成。
本次调研中的正式调研样本来自北京、苏州、上海、广州、东莞、杭州、哈尔滨、西安、沈阳、合肥、芜湖等地,采用关键被调查人技术共发放问卷2 000份,回收747份,回收率为37.35%;其中有效问卷293份,有效问卷率为14.65%。笔者直接发放问卷1 200份,共计回收413份,回收率为34.42%;其中有效问卷135份,有效问卷率为11.25%。两种方式共发放问卷3 200份,回收1 160份,总体回收率为36.25%;其中有效问卷428,有效问卷率13.38%。
表5.1 试测和正式调研问卷发放与回收情况简表
探索性因素分析样本基本情况:被访者以中层管理者为主,占受访者总人数的29.6%,其次是创业者;从被访者性别比例来看,男性较多,占受访者总人数的61.8%;样本企业成立年数多集中在7~8年,共占受访企业总数的33.4%;主营业务所属行业以制造业为主,占受访企业总数的24.6%。就行业类型而言,传统行业占受访企业总数的56%,高新技术行业占受访企业总数的44%;样本企业规模20人以下较小规模占多数,共占受访企业总数的35.6%,200人以上较大规模企业占受访企业总数的15.2%。样本所在地区以京津冀地区为主,占受访企业总数的45.9%,其他三个地区各占20%左右。探索性因素分析样本具体情况如表5.2所示。
验证性因素分析样本基本情况:受访者以中层管理者为主,占受访者总人数的33.4%,其次是创业者;样本企业成立年数多集中在7~8年,共占受访企业总数的31.7%;主营业务所属行业以制造业为主,占受访企业总数的30.8%。就行业类型而言,传统行业占受访企业总数的56%,高新技术行业占受访企业总数的44%;样本企业规模20人以下较小规模占多数,共占受访企业总数的32.4%,200人以上较大规模企业占受访企业总数的21.3%。样本所在地区最多的是京津冀地区,占比35.7%,其次是中西部地区,占比28.5%,东部沿海和东北地区的占比都在18%左右。验证性因素分析样本具体情况如表5.3所示。
表5.2 探索性因素分析样本(N=225)
续表
表5.3 验证性因素分析样本(N=428)
续表
4.区域创业环境的测量
根据本次研究区域创业环境的关注点,结合案例研究、实地深入访谈和内容分析,笔者尝试修订和构建区域创业环境测量工具。量表条款主要有三类来源:一是直接引用国内外文献中已经被定量研究证实具有较高信度和效度的测量条款;二是在案例研究、实地访谈和内容分析的基础上,根据获得的编码类目进行修改而得的测量条款;三是根据本研究的特点,与相关领域的专家学者进行交流,根据专家意见及访谈结果提出的测量项目。通过上述分析研究,本研究初步将区域创业环境划分为政府政策、创业资源基础、创业文化、创业网络和创业服务5个内容维度。(www.daowen.com)
已有对区域创业环境的研究多涉及对政府政策这一维度的测量,政府政策的目的在于增加新的创业机会,以及提高新创企业生存率。Stevenson和Lundstrom(2001)把创业政策措施归为6个焦点:为初创者提供融资渠道、提供商业支持、降低行业进入壁垒、整合创业教育、提升创业文化、提高企业家的参与水平。肖勇军(2012)用7个题项测量政策环境,α=0.889。CPSED(2012)用了单一题项测量政府政策,即“地方政府为创业提供了足够的支持”。GEM报告中政府政策由6题项测量,该量表是比较常用的测量政府政策的量表,其有效性已经被一些研究验证。基于以往研究测量的结果,结合实证访谈分析,初步得到本研究政府政策测量条款如表5.4所示。
表5.4 区域创业环境初始测量量表-政府政策维度
大多数学者在研究创业环境时,都会涉及对创业资源基础这一维度的测量。CPSED项目对创业环境充裕度的调研,主要是从获取原材料、招募高技能员工、获取创业必需的资本、争取到分销商、吸引客户、战胜其他竞争者、紧跟技术变化趋势、获取银行帮助、获取风险资本家帮助、赢得国家和地方政策支持这10个方面来测量。GEM报告中的金融支持(7题项)、教育与培训(6题项)、有形基础设施(5题项)都与创业资源基础相关。肖勇军(2012)设计的创业环境量表中与创业资源相关的包括:基础设施环境(5题项,α=0.773)、融资环境(6题项,α=0.849)、人力资源环境(6题项,α=0.757)、技术环境(6题项,α=0.759)。本研究根据访谈研究,对以往的量表做了适当的调整,创业资源基础初始条款如表5.5所示。
表5.5 区域创业环境初始测量量表-创业资源基础维度
文化价值支持环境主要包括了企业家的示范效应、对企业家精神的鼓励、对经验与成绩的认可、雇员工作的流动性、投资者的积极参与、社会对失败的宽容程度(肖勇军,2012)。CPSED报告(2012)也强调了创业氛围对创业活动的影响,主要是社会对创业认可度、周围人是否从事创业等几方面来进行测量创业氛围。有关创业文化研究指出,社会文化对创业行为失败的容忍,可以增加人们创新创业的动力。这个观点在访谈研究中也得到了验证。本研究对创业文化的测量初步设计的题项如表5.6所示。
表5.6 区域创业环境初始测量量表-创业文化维度
目前学者多从网络规模、倾向性、网络密度、强度、多样性等方面来测量创业网络。Burt(1992)认为社会网络结构包括3个维度,即网络规模、网络密度和网络层次。崔启国(2007)用创业者(或新创企业)与外部环境主体所建立的网络联系强弱来衡量创业网络,从个体网络(创业者与家人、朋友、熟人所建立的网络联系,3题项,α=0.731 9)和组织网络(新创企业与其他组织机构,如政府机构、中介机构、关联企业、融资机构等建立的网络联系,5题项,α=0.827 7)这两个方面来衡量。基于以往的研究成果,结合访谈内容,本研究从与创业活动相关的网络多样性和联系强弱两方面来测量创业网络,测量初始条款如表5.7所示。
表5.7 区域创业环境初始测量量表-创业网络维度
创业服务能够帮助创业者或新创企业把技术、资本、人才、信息、市场等创业资源进行合理配置,创业服务环境包括各类中介服务机构与部门,创业服务集中体现在创业企业孵化器中。GEM报告中创业环境的金融支持、政府项目、教育与培训等维度中都体现了创业服务理念。肖勇军(2012)从5个方面测度创业服务环境,主要围绕着中介服务和中介服务机构,共5个题项,α系数为0.718。在访谈过程中我们发现,创立企业之前的创业教育和培训,以及创业过程中的排忧解难对于创业结果有重要的影响。本研究根据访谈分析对以往测量进行了适当调整,创业服务的初始量表如表5.8所示。
表5.8 区域创业环境初始测量量表-创业服务维度
将上述各部分测量量表条款打乱排序,组合形成区域创业环境的整体测量量表。以上题项或者是选择已经检验有较好信度效度的测量条款,或者是通过实地深入访谈,对已有相关题项修订而成,以期获得较好的测量效果。在实际测量中,将上述题项打乱排序,是为了尽可能减少同一维度题项连续出现所产生的认知偏差,以便更好地检验区域创业环境的概念构思和题项适用性。
5.研究步骤与方法描述
本部分研究主要按以下四个步骤依次进行:第一步,选取探索性因素分析和验证性因素样本,发放问卷,回收数据,进行数据的初步检查,将废卷剔除,对数据进行录入整理,形成数据文件,为问卷数据分析做准备;第二步,运用SPSS 17.0统计软件,对区域创业环境的内容结构进行探索性因素分析;第三步,运用AMOS 7.0统计软件,对区域创业环境的内容结构进行验证性因素分析;第四步,对数据分析结构讨论与总结,提供各效度验证结果。[5]
本研究采用荣泰生(2005)的选择方法来选择变量分析技术,需要考虑:①变量之间的关系如何?是相依还是互依?即是自变量与因变量的关系,还仅仅是变量间彼此相关?考虑变量之间的关系,在本部分的分析中,只针对单个潜变量的内部测量条款的关系进行分析,不考虑各个潜变量之间的关系,因而各变数间是互依关系,本部分的研究方法应选用互依法,对于互依法技术层面的具体选择详见图5.1。②是单因变量,还是有一个以上多因变量?由于变数间存在互依性,所以不需要考虑因变量数量这个问题。③所收集来的资料尺度(类型)如何?本部分研究运用Likert五点量表,所获得的资料均为等距(区间)尺度,所以可供选择的分析方法为因素分析、集群分析等多种统计分析方法。
图5.1 多变量互依法技术的选择
资料来源:荣泰生,2005。
本书这部分研究主要是要对各条款之间的关系进行分析,探究区域创业环境的概念构思以及内容结构。通过探索性因子分析,探寻其中一些条款是否可以集结出公共因子。根据荣泰生(2005)的变量分析技术选择原则,以及本书这部分研究的需要,笔者选择了因素分析方法,在对各潜变量的条款进行净化之后,再对其进行因素分析。
本部分研究采用的具体分析方法如下:
(1)描述性统计
描述性统计主要对样本基本资料,包括问卷填答者的性别、婚姻状况、所在地区、是否创建企业、新创企业行业类型、企业规模、企业年龄等进行统计,描述样本的类别、特征以及比例分配状况。同时,对各测量条款进行均值、标准差、偏度、峰度等统计,以了解数据的大体情况,并为数据正态分布验证提供指标。
(2)信度分析
在进行假设检验之前,应对测量结果进行信度和效度分析。只有满足信度和效度要求的量表,其分析结果才具有说服力(李怀祖,2004)。
信度即可靠性,是指测量结果的一致性和稳定性程度。信度有外在信度与内在信度两大类。在多题项量表中,内在信度特别重要。所谓内在信度是指每一个量表是否测量单一的概念,一般用α信度系数法(Cronbach’s alpha)检验测量条款的信度,Cronbach’s alpha的值不得低于0.5。另外,利用纠正条款的总相关系数(Corrected-Item Total Correlation,简称CITC)对测量条款进行净化,去除信度较低的条款。一般而言,CITC小于0.5时,就可以考虑删除该测量条款(Cronbach,1951;转引自刘怀伟,2003),但也有学者认为CITC等于0.3也符合研究的要求(卢纹岱,2002)。本研究对同时满足以下两个标准的条款予以删除:纠正条款的总相关系数小于0.5;删除此条款可增加α系数。
(3)效度分析
效度指题项能够真正测量出研究人员所要衡量事物的真实程度,它表明概念与其测量指标之间的关系。本研究主要关注四种效度,内容效度、结构效度、聚合效度和区分效度。
内容效度(content validity)是指该测量工具是否涵盖了它所要测量的某一观念的所有项目(观念),其更多的是靠研究者在观念的定义上或者语义上的判断(荣泰生,2005),即内容效度是一种质性的效度,主要依赖于逻辑的处理而非统计的分析,依赖于研究者对理论定义的认同(黄芳铭,2005)。判断方法为:测量工具是否可以真正测量到研究者所要测量的变量以及测量工具是否涵盖了所要测量的变量。本研究相关变量的量表是经由文献梳理、访谈研究、学者检验及预调研得来的,因而具有较好的内容效度。
结构效度(construct validity)是量表测度出理论的概念和特征的程度,一般可以通过因子分析来检测。使用KMO(Kaiser-Meyer-Olkin)测度来检验数据是否适合做因子分析。KMO值在0.9以上的数据,非常适合;KMO值为0.8~0.9的数据,很适合;KMO值为0.7~0.8的数据,适合;KMO值为0.6~0.7的数据,不太适合;KMO值为0.5~0.6的数据,很勉强;KMO值在0.5以下的数据,不适合。根据这一原则对KMO值在0.6以下的数据不进行下一步分析;对KMO值在0.7以上的数据进行因子分析;对于KMO值为0.6~0.7的以理论研究为基础,根据实际情况决定是否进行因子分析(马庆国,2002)。
聚合效度(convergent validity)是指测量同一概念的多重指标彼此间的聚合或关联程度,可以通过平均提取方差值即平均变异数抽取量(Average Variance Extracted,简称AVE)进行测量,其标准为测量条款的解释力超过其误差方差(Carmines和Zeler,1979;转引自王庆喜,2004)。Fornell和Larcher(1981b)认为若误差的解释大于测量条款的话,则表示该变量的效度是有问题的,因此AVE的数值范围为大于0.5。对于因子负载而言,测量的有效性要求其超过一定的标准,且达到统计显著性水平,Ford,McCallum和Tait(2006)推荐的标准化因子负载的最低水平为0.4(转引自徐碧祥,2007)。参照适配度指标的理想取值范围标准、标准化因子负载和AVE取值的下限标准,对各潜变量进行确定性因子分析以检验其各自的聚合效度。
区分效度(discriminant validity)是指当一个概念的多重指标相聚合时,则这个概念的多重指标也应与其相反概念的测量指标负向相关。借鉴Fomell和Larcker(1981a,b)的研究,采用不同潜变量(或因子)AVE值的均方根与不同变量(或因子)之间的相关系数比较的方法进行区分效度检验。如果某潜变量(或因子)与其测量条款共有的方差多于其他潜变量(或因子)与其测量条款共有的方差,则其就具有了区分性。要判断区分效度是否满足分析要求,关键就是看两个潜变量(或因子)之间的相关系数是否小于这两个潜变量(或因子)的AVE均方根(徐碧祥,2007)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。