理论教育 如何选择数据来源和样本?

如何选择数据来源和样本?

时间:2023-06-08 理论教育 版权反馈
【摘要】:我们根据CSMAR以及新浪财经板块中上市公司企业的“经营范围”表述对样本进行了筛选,依据是在表述中是否明确指出企业主营业务为制造业,而兼营业务为服务行业。因此,对于本书要分行业地进行研究分析并采集数据是可取的。

如何选择数据来源和样本?

从行业选取上,考虑到双重差分法有严格的适用限制。为能准确估计政策效应,该方法要求实验组如果未受到政策干预,其时间效应或趋势应与控制组一样,即平行趋势或共同趋势假定。又因为制造业服务化具有服务业和制造业的双重性质,单纯的生产性服务业和制造业均不能满足这一假设而作为其控制组,因此,本书主要选用未改革地区的制造业服务化上市公司作为控制组,改革地区的制造业服务化上市公司作为实验组。本书依据CSMAR数据库、WIND数据库以及巨潮资讯网关于制造业上市公司“经营范围”的表述对样本进行了筛选,依据表述中是否明确指出企业从事下列服务项目,进而判断该企业是否为制造业服务化,并且根据服务化程度指标体系计算该企业的服务化深度。

根据本书研究需要以及DID模型的基本设定,本书选择2012年“营改增”试点改革前后的季度数据,样本时段2011年第四季度至2012年第三季度为营改增之前的时段,而2012年第四季度至2013年第三季度为营改增之后的对照时段[4],涉及在我国沪深两市以及创业板上市工业企业的年度数据,根据前文所述,由于我国“营改增”地区试点发生在2012年且除上海试点期始于稍早的2012年1月1日,其他试点省——北京(2012年9月1日),江苏与安徽(2012年10月),福建与广东(2012年11月)以及天津、浙江和湖北(2012年12月1日)试点开始期都集中于2012年三四季度,时点较为集中,因此,为保持研究时段的一致性,我们在三个市场板块遴选时以除上海外的其他几个试点省的企业作为“试点组”,试点省(含上海)以外地区企业作为“对照组”,时间上,由于税改的地区试点跨度不到一年,我们以试点开始前的2011年第三季度至2012年第二季度之间四个季度为对照期间,以税改发生时以及发生后的2012年第四季度至2013年第三季度之间的四个季度作为干预期间进行比对,从而探讨随着时间的推进税改对于企业业务结构变化影响的趋势。相关信息来自于CSMAR以及新浪财经股票板块,企业所属省的判断来自于企业基本信息的介绍,需要说明的是尽管上市企业的业务活动不会仅仅局限于其注册所在地,但一方面所属地区政策的落地对于当地企业整体经营思路会有着最直接的影响,即使企业的部分业务不在注册地区内。此外,在样本期内,我们特意遴选了在研究时段一年内没有发生注册地更替现象的企业,以保证“试点组”样本企业的纯粹。

下一步就是关于工业企业“服务化”水平如何衡量,这也是本书在技术上的难点,服务化水平的测度其实质是要求对产业融合度进行核算,由于产业融合涉及技术融合、业务融合、组织结构融合以及市场融合四个不同阶段(李美云,2007),目前学术界多采用技术融合度来近似对产业融合度进行仿真,具体可以付诸实施的技术方法包括由熵指数法演变而来的赫芬达尔指数法(Gambardela & Torrisi,1998),专利相关系数法(Fai & Tunzlmann,2001)以及NEGOPY网络分析方法,上述方法主要还是围绕技术融合度的测算而展开,对于本书的研究而言,工业服务化实际上是企业业务范畴的拓展,涉足到非制造业领域,因此应当是属于业务融合的范式,本书参考肖挺等(2014)、江积海、沈艳(2016)的研究方法,以上市工业企业中服务业业务收入占总营收的比重对“服务化水平”指标进行表征。由于我国上市制造企业服务创新收入部分指标为非指定公开披露信息,只能从上市公司的其他公开信息(如招股说明书、定期报告、日常信息披露资料以及公司网站等)通过手工方式收集整理。

我们根据CSMAR以及新浪财经板块中上市公司企业的“经营范围”表述对样本进行了筛选,依据是在表述中是否明确指出企业主营业务为制造业,而兼营业务为服务行业。如以下企业能够入选样本,就源自它们营业范围较为理想的表述:主要业务是生产与销售汽车及其配件、收割机、拖拉机等设备,其他经营活动包括提供培训和技术服务、汽车内部装饰及修理服务、产品进出口等。上述表述能明确反映出企业除了进行产品制造,也提供了一些相关性的服务业务,属于典型的“生产+服务”模式企业。所以在样本采集中,我们选取的就是与上例一样有着明确表述的企业,我们再以企业的利润水平为基础,采用前后5%的Winsorization方法处理样本极端值,最终获得了共计201个有效的企业数据。以企业财务数据中“其他业务收入”作为服务收入,这是由于如前文所述,经过筛选的样本企业,除了主营产品制造外,兼营的其他项目都属于服务业,所以大体上可以认为营业外收入就是服务业的收入。当然,其他业务收入是指企业除主营业务以外的其他附带业务所取得的收入,也可能包含了材料销售收入、无形资产转让收入等。因此我们从上市公司财务报表附注中“其他业务收入”项中剔除这些项目后的值作为兼营的服务收入。为求得数据可靠性,我们对样本中江西、湖北、湖南等省内的部分制造企业进行了求证性调研[5],结果也基本证实了猜想,这也就表明这种技术手段是可靠的,即采用上述服务产出占企业总营收的比重来表征该指标。本书所收集的企业样本主要可划分为三个部类,即重工、轻工与建材。重工行业包括汽车、飞机以及船舶制造,工业机械以及仪表等几个行业;轻工行业涵盖了新浪板块中轻工制造、家用电器、电气设备、食品、酿酒等若干行业;建材则囊括了建筑材料以及钢铁、有色金融等门类。承前文所述,由于不同服务行业在其市场供求弹性存在差异,因此“营改增”税改所能发挥的作用也存在差异。因此,对于本书要分行业地进行研究分析并采集数据是可取的。但本书所收集的企业样本来自工业制造业板块,而非服务行业,但由于我们探讨的是工业制造业服务化的问题,只能从这个角度出发进行整合样本,但在样本采集过程中,我们也发现不同类型的工业企业,其涉足的服务业种类通常也是与其主营业务有较强相关性的,譬如汽车行业多从事4S、汽车金融信贷、物流业等,飞机与船舶都往往会涉足租赁、码头管理等业务,而建材行业往往涉足房屋的物业管理、房地产中介等业务,家电行业也从事家电维修、自营和代理各类商品及技术的进出口等业务。当然,我们也并非认为工业种类与其所从事的服务业一一对应,泾渭分明,但区分门类的分析肯定可以获取更细致的结论。

还有一个必须回答的问题,即工业企业所从事的服务行业在税改前后所缴纳的税种是否真的发生过变化?尽管所从事的业务属于服务业,但为工业制造所配套的生产型服务业在税改之前所缴纳的是不是营业税呢?这是本书研究意义的关键,现实生活中确实有很多企业生产型服务业与实体产业一样一直缴纳增值税,税改因此对其并没有产生什么实际意义,现实情况是,在大部分企业进行与产品相关的技术咨询、调试、安装、售后保养等所获得的收入往往打入产品销售额中一并征收增值税,但在“营改增”前大部分独立的业种如金融、物流、科技服务、软件信息、商务服务等生产型服务业所缴纳的都是以营业税为主的税种组合[6]。而如前所述,由于工业部门的不同,其所涉足的服务业也存在一定的差别,因此,从总体来看税制改革后,对于企业而言,如果业务中一致包含服务业务的内容,则其所纳税额有很大可能会受到影响。(www.daowen.com)

控制变量方面,本书采纳了三组指标,反映的是样本企业状态特征,包括三组指标,企业的资产收益率(Roa)、企业规模以及研发支出比。企业的服务化与绩效之间存在千丝万缕的联系(Gebauer,2005;Neelyetal.,2008),服务化水平会决定绩效的变化,但反之当企业发展出现瓶颈之时同样有可能进行大胆的创新,该数据来自CSMAR原始数据;同样,大型企业往往更有勇气进行创新,因此具备一定的企业规模也成为企业展开服务化行为的倚靠(姜铸,李宁,2015),企业规模以各企业固定资产额表征(取自然对数以平滑数据),相对而言,相对于人员流动的频繁,我们认为固定资产对于企业规模的刻画更为合理准确;第三组研发支出比采自CSMAR报表附注提供的数据,用该数据占企业总营业收入的比重衡量企业的研发力度。服务化本质也是一种创新行为,理应包含在企业研发的范畴之中。最后,我们采用“营改增”前四个季度(2011年第四至2012年第三季度)所谓服务业营业收入(即营业外收入扣部分款项)的平均值来反映各企业初始的发展状态(取自然对数)。

通过前文所述的严格筛选过程,最终我们共获得了201个有效的企业样本,其中重工企业92家,轻工企业70家,建工企业39家,共有试点省企业121家,非试点省企业80家(重工行业内注册地在试点省的企业50家,非试点省42家;轻工行业内注册地在试点省的企业46家,非试点省24家;建工行业注册地在试点省的企业25家,非试点省14家),根据DID的要求,承前所述我们取“营改增”之前和之后各四个季度的两组平均值(但期初各上市企业的服务业收入取单组收入值),在表5-2中简要展示了所选取主要指标的描述性统计。

表5-2 实证变量描述性统计

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈