理论教育 数据收集方法与测量指标详解

数据收集方法与测量指标详解

时间:2023-05-26 理论教育 版权反馈
【摘要】:劳动力市场大数据不仅降低了数据收集成本,极大丰富了数据来源,同时也提高了数据的客观性。基于互联网的数据其收集方式则与此有显著区别,劳动力市场大数据的收集方式归结为直接观测、跟踪监测和网站档案数据库收集三种:一是直接观测。因此,在既定时间内,“工作申请数量”是工作搜寻搜索的测量指标。在线劳动力市场中,求职者是否收到用工方的录用通知也是匹配结果的测量指标,也可用于分析雇佣过程中的歧视问题。

数据收集方法与测量指标详解

劳动力市场大数据包括从搜索引擎求职招聘网站、在线劳动力市场、网民等网络主体上获得的有关搜寻与匹配的数据。在相关实证研究中,研究者通过直接观测、跟踪监测、网站档案来收集静态数据或动态数据。劳动力市场大数据不仅降低了数据收集成本,极大丰富了数据来源,同时也提高了数据的客观性

1.收集方式

我国就业相关数据受制于抽样、数据采集、计算方式缺陷等因素,统计数据质量常常备受各界诟病,就业数据亦是如此。由于就业服务和社会保障制度不完善,部分失业人员并没有动力到相关政府部门进行失业登记,导致我国的城镇登记失业率指标不真实、不全面,这种状况并不鲜见。传统的调查数据通过问卷设计、问卷发放与问卷回收的流程来收集。基于互联网的数据其收集方式则与此有显著区别,劳动力市场大数据的收集方式归结为直接观测、跟踪监测和网站档案数据库收集三种:一是直接观测。这种方法就是在某一时点,在既定的招聘求职网站上,直接观测劳动求职者的求职申请、用工部门发布的招聘广告以及双方形成的匹配信息。通过互联网收集数据的步骤包括:确定目标网站、借由计算机程序在网站上收集数据并进行数据分析。在收集数据之前,可通过计算机应用程序自动收集网站上的招聘广告,在收集的招聘广告中,程序自动标记哪些是新刊登的、哪些是前一天的。二是跟踪监测。这种方法是在招聘求职网站上连续监测选定的求职者或用工企业,观测并记录他们的搜索行为,以获得短期、中期或长期跟踪数据。如可列出一些关键词如学历、技能、年龄等,也可将包含关键词的招聘广告作为监测对象,并进行跟踪观测,目的是观察这些空缺信息在什么时间失效,并记录具体的失效时间。利用空缺信息失效的时间减去该信息开始刊登的时间,可获得职位空缺持续时间数据。在传统的职位空缺调查中,用工方以“回忆性”方式得到的数据往往无法提供精确的时间,这种误差将导致测量结果不准确,互联网数据可以很好地解决诸如此类的问题。三是网站档案数据库收集。每个招聘求职网站的后台数据库都记录了大量网民操作的历史数据,利用这些原始数据能够分析网站使用者(求职方与用工方)的行为方式和特征,进而从社会层面对整个劳动力市场变化做出研判。

对于国内的使用者来讲,百度指数是一个强大的大数据分析工具。由于百度在线网络搜索引擎的用户数量十分庞大,遍及全国,而百度指数则是以百度搜索网站上大量的网民搜索数据为基础,能够提供从2006年至当前时间、不同搜索关键词的频度、相关性等数据,是当前互联网乃至大数据时代最重要的数据统计分析平台之一。百度指数能够告诉你:某个关键词在百度的搜索规模有多大,一段时间内的涨跌态势以及相关的变化,关注这些词的网民群体特征、分布情况,相关的词的搜索情况,有助于分析广大网民对某一事件的关注度。百度指数的主要功能模块有:基于单个词的趋势研究(包含整体趋势、PC趋势、移动趋势)、需求图谱、舆情管家、人群画像;基于行业的整体趋势、地域分布、人群属性、搜索时间特征等。(www.daowen.com)

2.测量指标

就工作搜索而言,求职者通过鼠标在网页上的“点击”来完成信息浏览、简历投递,求职者的“鼠标点击”行为轨迹和次数及相应时间,是工作搜索的主要测量指标。一般而言,招聘网站规定同一个岗位求职者只能申请一次。因此,在既定时间内,“工作申请数量”是工作搜寻搜索的测量指标。利用网站数据可分析工作搜寻行为的特征。比如,工作搜寻强度受失业救济金政策的影响显著,失业救济金领取时间延长,工作搜寻强度就相对降低,二者之间存在线性对应关系。此外,在招聘网站上,求职者搜寻的起止时间差是工作搜寻持续时间的测量指标,它收集了劳动者发送第一份求职申请和最后一份求职申请的时间,并以这两个时间的差值测量工作搜寻持续时间。

职位空缺持续时间是用工方开始寻找求职者与找到合适的求职者或被雇用的求职者开始工作的时间之差,可以将招聘网站上空缺信息发布时间与失效时间之差定义为空缺持续时间。在线劳动力市场中,求职者是否收到用工方的录用通知也是匹配结果的测量指标,也可用于分析雇佣过程中的歧视问题。Mill在freelancer上观察了向同一个岗位投递简历的求职者的个人信息,以及是否收到录用通知的信息,并基于这些数据,对招聘过程中求职者的地区和居住地歧视进行了实证分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈