同传统劳动力市场研究方法相比,大数据在描绘市场现状、刻画行为、预测未来趋势等方面具有显著的优势,国内外研究者们已将其应用于失业率预测、雇佣标准分析、搜寻与匹配动态研究、搜寻持续时间分析以及用工方偏好分析等方面的研究中。比如,中国就业研究所基于智联招聘网上注册的求职人数、发布的岗位空缺数量,以求职申请人数与招聘需求人数的比值提出了“劳动力市场景气指数”。该指数不仅能够及时、灵活地反映劳动力市场供求匹配状况,对研究就业与宏观经济变量的关系也提供了支持。有的研究采用搜索引擎上人们工作检索行为数据,构建了与失业相关的在线检索强度测量指标,通过该指标提高宏观经济指标的预测能力。
1.辅助政府经济政策研究
基于互联网的劳动力市场大数据,能够即时反映外部因素对劳动力市场冲击产生的影响,因而更加容易形成自然实验数据。以2008年爆发的金融危机为例,为了缓解危机期间就业难的形势,美国政府将领取失业救济金的时间从26周延长至99周,该政策是否达到了预期效果呢?由于传统的统计调查数据方法具有滞后性,不能实时反映政策带来的群体和市场的变化,因此无法利用传统方法进行及时的政策评估,而大数据所包含的海量且连续的信息使这一问题迎刃而解。美国研究者Marinescu在Career Builder网站上收集了2007年至2011年间的工作搜寻的相关数据,由于数据涵盖了经济危机前后的信息,形成了危机前后的自然样本数据。Marinescu通过研究发现,经济危机期间推出的积极政策具有就业压力抑制效应。延长失业救济金领取时间,使得州一级的求职人数有所降低,减轻了就业的压力。通过这个案例可以发现,传统调查数据的滞后性使其更适用于评估政策的长期效果,而大数据则更有利于对政策短期效果的评估。从这个层面来看,大数据可作为政府传统调查数据方法的一种重要补充,它能够及时地反映政府政策的效果以及民众对此的反映,进而为政府政策的优化提供数据支持。
2.就业政策研究
个人和群体的持续求职时间可以反映就业状况和政府就业政策的社会效果。目前,有关工作搜寻持续时间或失业持续时间的研究,所使用的数据主要是基于问卷调查获得的,即根据被调查者报告的工作搜寻开始时间和结束时间来计算持续时间。而在招聘网站上,可以通过观测求职者首次和末次投递简历的时间,直接测量求职持续时间。Faberman和Kudlyak通过美国Snag AJob网站进行相关数据的收集,他们在2010年9月至2011年9月观测期内,观测求职者投递第一份求职申请的时间和投递最后一份求职申请的时间,并根据这两个时间点来测算求职持续时间,以此来分析求职者工作搜寻强度与搜寻持续时间之间的关系。研究发现:一是从网上求职角度看。随着网上求职时间的推移,求职者发送求职申请的数量会越来越少,即工作搜寻强度会逐渐降低;二是从网上网下求职对比看,求职者通过网上进行求职的时间越长,其工作搜寻强度就越大,也就是网上求职会强化求职者的求职意愿,促使其频繁地换工作。此外,用工方搜寻持续时间或者岗位空缺持续时间研究是从动态角度对搜寻成本进行分析,通过在招聘网站上观测空缺岗位的状态变化及相应时间,可以直接测量空缺持续时间。基于此类数据,研究者们分析了空缺持续时间的影响因素。Nivalainen在2002—2003年从芬兰公共就业服务网站(Public Employment Service,PES)上收集了岗位空缺持续时间数据,以评估就业政策的效果。研究显示,2002年10月芬兰公共就业服务机构推出的雇主网络招聘政策有效地缩短了雇主搜寻的持续时间,但是这种促进效应具有显著的区域差异,对城市地区的雇主而言,促进效应更大。
3.用工部门偏好及决策研究
大数据还可用于对用工部门的研究,如用工部门的用人偏好、用工歧视等问题的研究;用工部门也可使用大数据研究本部门的用工政策及效果评估等。基于网上招聘信息数据,用工部门能够分析实行某种工资制度的决策效果和影响因素。国外研究者从美国Monster上收集了250000个空缺岗位数据,用以分析通过支付绩效工资的决策因素,结果发现,当空缺岗位涉及多任务、质量控制或团队合作时,雇主为该岗位提供绩效工资的可能性较低。企业在不同发展阶段,对雇员特点的重视程度不同,导致其具有不同的偏好。基于网络的大数据同时包含聘用和未被聘用劳动者两类信息,基于此类数据的对比分析,就可以得出有关用工部门偏好的结论。例如,根据大数据中劳动者的个体特征、工作搜寻历史以及所在地信息,可以分析雇佣过程中用工部门对劳动者所在地的偏好。研究发现,居住地对劳动者是否被雇用具有显著影响。Agrawal等在oDesk上随机选择求职者,分析求职者被雇用的概率的区域差异,结果显示,在欠发达地区的求职者申请发达地区工作时,存在惩罚效应(penalty)。在抛开学历、工作经验和保留工资等变量的情况下,发达地区的雇主雇用欠发达地区求职者的概率较低。与地区偏好类似的还有户籍偏好,通过分析雇主对求职者户籍的偏好,结果显示,私营企业更倾向于雇用非本地求职者,并且对于低技能岗位而言这一点更为突出。
4.用工与求职需求匹配研究
当前,各大招聘平台已经积累了大量的应聘方和招聘方的资源,整个行业面临的难题不再是应聘方数量的不足或是招聘方需求的缺乏,而是应聘方与招聘方需求精准匹配的问题。大数据和云计算可以将海量的需求进行高效的处理,并有针对性地匹配每一群体甚至个人单独的需求,提供精细化和个性化的需求解决方案,并创造出良好的用户体验。AI技术的发展基于精细化方案的基础之上,会使得单个需求的价值更容易得到提高,AI技术能进一步发现、判断、分析并最终解决用户的隐性需求和衍生型需求,不仅能扩展网上招聘求职平台的业务范围和盈利空间,还能在一定程度上推动劳动力整体市场规模的扩大。
(1)岗位聘用需求分析。通过网站上的招聘信息,可以从用工方和求职者角度分析某个职位对任职者组织技能和专业技能的要求,提高用工求职供需的匹配效率。有研究者从招聘网站收集的800个网站管理员职位招聘广告的分析显示,用工方对专业技能的要求高于对组织技能的要求。比如,英国的研究人员通过一个计算机程序收集了48000个招聘广告,数据分析结果显示:英国雇主对IT技能工人存在较大需求。他们进一步将雇主对IT技能需求的内容与10所大学IT专业的课程进行了对比分析,认为大学的培养内容与方案不能完全满足雇主对IT技能的需求,即现行人才培养机制与劳动需求之间存在偏差。由于劳动力市场大数据包含了高技能岗位和低技能岗位的信息,基于大数据能够从用工方需求的角度对上述效应进行分析。采用相同的网站数据和不同的岗位分类方法,还能够分析中等技能岗位和低技能岗位在学历要求方面的差异。可以将技能岗位划分为高、中、低三个等级,并进行内容分析法和简单统计模型分析,研究中等技能岗位和低技能岗位对学历及其他技能的要求的差异性,以及高技能工人与低技能工人之间的互补性。
(2)区域聘用标准分析。基于招聘网站来自不同地区的数据,可以进行雇佣标准的区域比较分析,进而对地区或区域间的劳动力合理流动提出建议。在以往的研究中,跨区域性的职位空缺调查存在较大难度,使得研究者们无法基于调查数据分析雇佣标准的区域差异。然而,招聘网站是跨区域的,从一个综合性招聘网站上收集的数据有利于进行这种区域比较研究。比如,欧洲就业服务网是一个标准化网站,在欧盟以及EEA(欧洲经济区European Economic Area的简称)成员国之间通用,并且该网站发布的空缺岗位数量占欧洲劳动力市场空缺岗位总量的30%~40%。采用该网站的数据,通过分析雇主对劳动者认知技能和非认知技能要求的区域差异后结果显示,不同国家对这种技能组合的要求不同,这表明区域性内在因素对用工方需求的形成存在较大影响。(www.daowen.com)
5.社会就业与失业情况预测
失业率能反映一国劳动力市场的变化情况,是监测宏观经济运行的重要指标,对于政府部门制定就业政策、判断和预测国民经济形势具有重要的现实意义。过去,我国主要采用城镇登记失业率和调查失业率来反映失业状况。这种方式能够在一定程度上反映我国的失业状况,但也存在很大局限性:统计数据时效性差,在统计口径、统计方法、统计频率等方面均存在不足,不利于宏观政策的制定。国际著名的劳动经济学家克劳斯·F·兹姆曼在《大数据与失业率分析》一文中,对近年来大数据与失业这一领域的研究进展进行了评述,分析了不同领域内互联网数据与信息的使用情况,并把重点放在失业率模型构建方面,得出结论认为:大数据有很大潜力,当前的应用需进一步深化。根据一些国家的研究,互联网数据能够改进模型并进行失业率预测,其预测的准确度依赖于每个国家的互联网渗透率、互联网使用者的年龄结构以及构建的互联网变量的稳定性等。在国内,中国人民大学就业研究所与智联招聘联合向社会公开发布“中国就业市场景气报告”,使用CIER来反映劳动力市场供需变化情况(CIER指数=市场招聘需求人数/市场求职申请人数)。该指标采用智联招聘全站数据分析而得,通过不同行业、城市职位供需指标的动态变化,来反映劳动力市场上职位空缺与求职人数的比例的变化,从而起到监测劳动力市场景气程度以及就业形势的作用。
作为第三方数据挖掘和分析机构的艾媒咨询,根据艾媒数据中心、艾媒咨询商业情报数据库、艾媒商情舆情数据监测系统基础数据,在对往年CIER指数变化趋势分析的基础上,对2020年中国就业创业环境进行了分析和预测,发布了《2020年中国就业创业市场现状与趋势发展分析报告》。艾媒咨询认为:2019年中国CIER指数低于去年水平,反映出就业竞争较为激烈,社会就业信心较低。城镇新增就业人数、就业困难人员就业人数等数据都呈现同比下降趋势。这是由于一方面,2019年大环境不景气,许多企业都减少了招聘的数量,开始进行不同规模的裁员,不少企业甚至倒闭。另一方面,高校毕业生等人数不断增加,适龄劳动力不断涌入就业市场。
图10 2019年中国CIER指数变动情况分析
图11 2013—2019年中国就业人数数据分析
基于搜索引擎的就业状况研究。求职者在使用搜索引擎搜寻工作信息的同时,在网络上也留存下大量浏览信息,这些数据信息背后就隐含着失业与就业情况的重要信息。目前国际上已有众多运用网络搜索数据进行失业统计分析的研究:Askitas和Zimmermannw基于网络搜索关键词数据成功地预测了德国失业率数据,研究发现基于某些关键词的预测比官方数据能够更早地显示失业趋势的变化。D'Amuri和Marcucci等利用网络搜索数据建立了工作搜索指数来预测美国的失业率,并发现加入搜索指数修正之后的模型的预测效果显著高于传统模型。当前,我国网民都在使用“百度”搜索引擎,其中有许多是通过百度搜索政府就业政策以及相关企业职位空缺等方面的信息,通过百度提供的分析工具对这些数据信息的研究,这有助于了解国家和地区就业与失业状况。未来失业率预测将借助大数据时代的海量信息,由过去的调差统计向大数据测算、网络监测模式转变,运用大数据数据源的优势,充分整合行政记录、求职招聘平台数据、电子商务企业数据、互联网搜索数据等不同来源数据,构建能够实时更新的劳动力人员就业信息数据库,进而实时分析社会就业状况,预测就业趋势并及时制定切实可行的就业政策。
6.存在的问题
当前,大数据应用于劳动力市场的研究以及求职招聘平台的发展还存在以下几个方面的问题:一是研究的角度不全面。当前,国内研究者对劳动力市场大数据的研究还集中在劳动者搜寻行为方面,对用工方搜寻行为的研究略显不足。今后,可以基于招聘网站大数据,以及用工方搜寻强度和持续时间等测量指标,对用工方搜寻行为的特征进行分析。二是平台形式不够多样化。由于网络招聘覆盖的行业太多,不可能用一套或少数几套模式、流程就达到精确匹配的效果,而且,用户对综合型平台已经形成了较为固化的认知,相对专业的需求很少能在其平台上有一个完善的解决方案。因此,综合型平台也需要专精于某一领域或某一类型的业务平台作为其延伸和补充,这部分的业务可能来自大平台内部的孵化,也可能来自对垂直厂商的收购与兼并。三是数据有待整合。当前求职平台和APP很多,但平台企业之间的整合力度有待加强。平台企业之间出于自身利益考虑,把数据视为企业的宝贵资产,加上安全性方面的考虑,平台企业之间的数据还不能很好地共享。政府数据与企业数据也有待整合,政府部门掌握着大量劳动力方面的信息,应加快政府数据的对外开放。应加强顶层设计和统筹规划,明确各部门数据共享的范围边界和使用方式,厘清各部门数据管理及共享的义务和权利,在依法加强安全保障和隐私保护的前提下,稳步推动公共数据资源开放,提高政府与企业的数据综合运用能力,发挥数据的规模效应。此外,应加强城乡融合方面的劳动力市场研究,包括城乡各类人员在不同时期、不同地区、不同行业之间的流动情况,以及发展变化的趋势,通过有效的数据来评估城乡融合的城乡经济发展情况、城乡社会发展情况、城乡生活水平等,进而为政府决策提供数据支撑。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。