理论教育 农村劳动力转移数据库的建设与实现

农村劳动力转移数据库的建设与实现

时间:2023-05-26 理论教育 版权反馈
【摘要】:解决农村劳动力转移渠道的问题,需以农村劳动力自身属性变化、用工方及劳动岗位的属性、渠道属性等内容,搭建农村劳动力转移数据库;通过各种属性之间的关联规则或启发式方法对劳动力转移的渠道进行分析,为宏观上的决策提供支撑,并预判劳动力市场变化趋势,大幅提升信息供求双方的匹配程度,加快劳动力的合理流动。去除噪音数据主要采用聚类算法。在应用阶段,一是可通过系统各因子的关联关系,分析劳动力转移的变化规律。

农村劳动力转移数据库的建设与实现

大体上说,农村人力资源服务业在信息化普及应用上,较其他行业发展较为迟缓:一是从信息的获取上看。用工信息获取采用的很多还是口耳相传、老乡介绍的方式,部分派遣机构和生产企业也会分派专人驻点进行招聘信息的传发,这种模式存在效率低下、信息不对称等问题。二是从整体统筹上看。农村劳动力流动缺乏统一规划、记录与分析。根据有关调研,基本上所有的农村外出务工人员、滞留人员的信息登记都不完善,这也带来整体统筹规划管理上的困难。三是从劳动者的工作能力来看。由于农村劳动者对市场需求不了解,无法有针对性地学习满足市场需求的劳动技能,90%以上的农村劳动力从事的都是蓝领岗位,而技术工种的比例在部分农村地区甚至呈逐年下降的趋势。解决农村劳动力转移渠道的问题,需以农村劳动力自身属性变化、用工方及劳动岗位的属性、渠道属性等内容,搭建农村劳动力转移数据库;通过各种属性之间的关联规则或启发式方法对劳动力转移的渠道进行分析,为宏观上的决策提供支撑,并预判劳动力市场变化趋势,大幅提升信息供求双方的匹配程度,加快劳动力的合理流动。劳动力转移数据库建设大体上可分为以下几个方面:

1.搭建数据库

首先要明晰与农村劳动力有关的数据维度、类型、来源以及记录频度等,通过专人录入、劳动者录入、网络自动记录等形式,不断完善数据库的信息维度及信息量。以常见的用工登记表及网络招聘的信息作为数据来源,在数据维度上可选用劳动者属性、用工岗位属性等维度划分。劳动者属性维度包括劳动者身份信息、自然属性、学历信息、工作信息、意愿以及求职行为属性等。用工岗位属性包括岗位信息、岗位要求、用单位信息、岗位用工情况等。在考虑用工岗位及劳动力属性维度时,也应把涉及劳动力转移途径作为属性一并进行分析。在信息的搜集上,数据库建设要尽量把统计的面放宽,收集尽可能多的信息。

2.数据加工及预处理

数据加工及预处理的目的是通过对数据库中的数据从格式、单位、分类等进行初步加工,为下一步的数据分析打下基础。数据库信息可通过系统或人工录入的方式进行采集,由于数据的来源不同,录入和导入的数据会存在错误以及格式、单位方面的不统一,为了进行下一步的数据挖掘与分析,需要对数据进行加工及预处理。主要解决如下几个方面的问题:数据不完整导致系统默认值或缺项问题、人工输入错误所产生的噪音数据、不同数据源导致的数据格式不一致等问题。

(1)数据完整性处理。预处理系统主要解决数据不完整性问题。比如,在招聘网的简历填写中,简历中的非必填项漏项、缺项问题严重。最有效的解决方法是通过在线填写系统来保障数据的完整性,需要通过对数据进行清洗以填充遗漏值。在实际的运用中,要根据具体的数据字段属性来考虑具体的应用,如采用全局常量和使用与给定元组属同一类的所有样本的平局值方法来进行漏项的补充。全局常量适用于劳动者求职意向的部分字段,如期望工作地点为空的,可默认为“任何地点皆可”等,如用工职位要求学历字段为空,则可默认为“无标注学历要求”等。

(2)噪音数据处理。主要解决数据的随机错误或偏差,这类问题主要是输入时产生的。去除噪音数据主要采用聚类算法。聚类算法是一种聚类分析的方法,是数据挖掘的一个重要算法。聚类分析又称群分析,起源于分类学,是人们把数学工具引用到分类学中的结果,在形成了数值分类学之后,又将多元分析的技术引入到数值分类学形成了聚类分析。聚类分析以相似性为基础,是利用数学工具对“物以类聚,人以群分”进行定量的分类。在实际操作中,可针对非选择项的输入进行聚类分析,在聚类集合之外的数据可进行剔除或采用分箱的方法(一种数学方法,通过考察周围的值来平滑存储数据的值)实现数据平滑处理。(www.daowen.com)

(3)统一数据格式。系统需要针对同一数据不同的数据格式进行统一,首先对来源数据进行识别,并建立相应的转换规则让计算机系统自动处理即可完成。如涉及出生年月、工作经历等日期格式方面的不一致等。较为复杂的是职位类别、专业技能、企业名称等称谓方面的不统一,解决的办法是在每个数据源接入系统时,对同一元组的不同名称进行人工分类,建立字典表,以保证数据称谓的一致性。

3.数据挖掘

在对原始数据集进行处理后,要进行数据的挖掘。主要是对经过处理后的数据系统进行因子的关联性分析,找到各个维度数据之间的内在关联并建立分析模型。通常对已经经过预处理与聚类分析的数据,会采用两种方式进行数据的分析:一种可采用常见的数据分析软件如SAS和SPSS,进行因子关联等分析,这类软件具备统计方法以及图形、表格绘制等直观的功能;另一种方式可以根据实际的需求用关联规则挖掘方式进行数据模式提取、项集子序等频繁模式的识别,通过发现数据中蕴含的事物内在规律,进行预判。

4.数据应用

结合数据关联信息进行建模,模拟宏观调控各个因子后产生的影响,系统将通过模型分析,模拟出结果,从而最终实现对劳动力转移渠道优化的决策支持。在应用阶段,一是可通过系统各因子的关联关系,分析劳动力转移的变化规律。例如,在实验中分析出劳动力在生产行业、不同工种职位的上岗率,以及劳动者年龄、性别、期望薪酬等相关信息。二是通过调整系统变量,根据变量的变化情况,可以系统预测、模拟出变量的变化会产生何种结果,从而用更科学的手段对劳动力转移市场进行宏观调控。最后,劳动力市场与大数据的结合是解决农民工就业问题的有效手段,利用大数据分析的优势,我们可以不需要把过多的精力放在对劳动者进行长期与其就业岗位无关的学历教育,而只是在大数据数据决策的导引下,为其找到更匹配其素质技能的劳动岗位,就能实现用工需求和求职需求的有效对接,从而有效解决农民工就业问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈