理论教育 数据分组的相关概念和原则

数据分组的相关概念和原则

时间:2023-08-01 理论教育 版权反馈
【摘要】:利用数据分组,能根据统计研究的目的,将这些现象区分为各种性质不同的类型,以研究这些现象的数量差异和特征以及相互关系。正确选择分组标志应该遵循以下三个基本原则。明确了数据分组的目的和任务,还不等于能选择到最佳分组标志。数量标志分组就是根据统计研究的目的和任务,选择反映事物数量差异的数量标志来作为分组标志

数据分组的相关概念和原则

1.数据分组的含义和原则

(1)数据分组的含义

数据分组又称统计分组,它是根据统计研究的任务目的,按照一定的标志将总体划分为若干性质不同的部分的一种统计方法。例如,在全部企业这个总体中,我们可以按照其生产规模将企业划分为大型企业、中型企业和小型企业三个组,每一组内各企业生产规模相同或相近,而组与组企业之间的生产规模差异较大。又如,可以把具有中国国籍的人组成人口总体,按年龄、性别、民族、文化程度等标志将其划分为不同的组,以反映中国人口结构现状。

数据分组同时具有两个方面的含义:对总体而言,是“分”,即将总体划分为性质相异的若干部分,因此,各组之间具有一定的差异性;对个体而言,是“合”,即将性质相同的个体合并到同一组,因此,每一组内的各个个体具有同质性。

(2)数据分组的原则

1)穷尽原则,就是使总体中的每一个单位都有组可归,或者说,各分组的空间足以容纳总体所有的单位。

2)互斥原则,就是在特定的分组标志下,总体中的任何一个单位只能归属在某一组,而不能同时归属于几个组。

2.数据分组的作用

(1)划分社会经济现象的类型

社会经济现象是极其复杂多样的,客观上存在着各种不同的社会类型,各种不同类型的社会经济现象有着各自的运动形式和本质特征,受其内在规律支配,这些现象在规模、水平、速度、结构、比例关系等方面的数量表现有所不同或具有差异。利用数据分组,能根据统计研究的目的,将这些现象区分为各种性质不同的类型,以研究这些现象的数量差异和特征以及相互关系。例如,把国民经济按产业进行分组,分成第一产业第二产业、第三产业,便于分门别类地、深入细致地研究与分析,以揭示不同产业的特征及其发展规律。

(2)研究现象总体的内部结构

将所研究的现象总体按某一标志进行分组,计算出各组在总体中所占的比率,以反映总体内部的构成,认识总体各部分的地位,借助于总体各部分数量上的差别和联系,进而对总体做出正确的分析。例如,2015—2019年某地区三次产业分类的从业人口构成变化情况,如表3-1所示。

表3-1 2015—2019年某地区三次产业分类的从业人口构成变化情况

通过上述分组,可以研究2015—2019年某地区三次产业分类的从业人口构成变化情况。

(3)分析现象之间的依存关系

现象不是孤立的,而是相互依存和相互联系的,如产量和产品成本之间以及商品销售额和商品流通费用之间的关系。利用数据分组,可以确定这种关系的存在以及这种关系对现象发展的影响程度,并分析影响因素中哪些是主要的,哪些是次要的。例如,某地区农作物的收获率和耕作深度之间依存关系如表3-2所示。

表3-2 某地区农作物的收获率和耕作深度之间依存关系

①1亩≈666.67平方米。

从表3-2可以看出,某地区农作物的收获率和耕作深度具有明显的正依存关系,即耕作深度越深,农作物的平均收获率越高。(www.daowen.com)

3.数据分组的方法

(1)分组标志的选择

数据分组的关键在于正确选择分组标志,这是数据分组的核心问题。任何一个总体单位都有许多特征,表现为不同的标志,其中作为分组根据的那个标志就是分组标志。分组标志选择得正确与否,关系到能否正确地反映总体的性质与特征、实现统计研究的目的和任务。正确选择分组标志应该遵循以下三个基本原则。

1)根据统计研究的目的和任务,选择分组标志。总体的各个单位有许多标志,应该选择什么标志作为分组标志,依据统计研究的目的而定。例如,对于某高等院校在校学生这一总体,每一个在校学生是总体单位。学生有年龄、身高、性别、体重、民族、政治面貌和学习成绩等标志。如果要分析该校学生的年龄结构,就要选择年龄作为分组标志;如果要反映学生的学习成绩构成,就要选择每门课程的平均成绩作为分组标志;如果要研究学生的性别构成,就要选择性别作为分组标志。可见,对于不同的研究目的,需要选择不同的分组标志。

2)选择能够反映事物本质特征的标志。明确了数据分组的目的和任务,还不等于能选择到最佳分组标志。因为在同一统计研究目的和任务下,既可以选择这个标志,也可以选择另一个标志,这就要根据被研究对象的特征来选择带有根本性的、本质性的主要标志作为分组标志,以求所选分组标志为最佳标志。例如,研究职工的生活水平时,可以选择职工的工资水平作为分组标志,也可以选择职工家庭人均收入水平作为分组标志。但选择职工家庭人均收入水平作为分组标志可以更好地反映职工的生活水平,因为职工生活水平的高低不仅取决于职工收入的高低,还取决于职工供养人口的多少。

3)根据事物所处的具体历史条件及经济条件选择分组标志。在不同的历史条件和经济条件下,选择的分组标志是不一样的。例如,反映企业规模大小的标志有职工人数、生产能力、资产总额等,究竟应选择哪个标志作为分组标志,还需视具体条件而定。一般来讲,在技术不发达或劳动密集的条件下,适宜采用职工人数多少来表示企业规模大小;反之,在技术进步或技术装备比较先进的条件下,则采用生产能力、资产总额作为分组标志会更恰当、更切合实际。即使是在同一历史条件下,在不同的经济部门或生产部门中,由于它们的经济条件和生产性质、特点的不同,也应分别对待。

(2)数据分组的种类

1)根据分组标志的性质,分为品质标志分组与数量标志分组。品质标志分组就是根据统计研究的目的和任务,选择反映事物性质、属性差异的品质标志来作为分组标志,在品质标志变异的范围内划定各组的界限,将总体区分为若干性质不同的部分或组别。例如,研究人口构成状况时,可按性别划分为男、女两组;按文化程度划分为大学及其以上、高中、初中、小学等几个组;按民族划分为汉族和少数民族等。

一般情况下,按品质标志分组比较简单,分组标志一经确定,组的名称和组数也随之确定,如人口按性别分组,分为男、女两组。但有些品质标志分组也会比较复杂,组与组的界限不易区分,如第一产业中的林业与第二产业采掘业中的木材及竹材采运业的区分。对于这一类问题,统计工作中采用的统一分类标准有《工业产品分类目录》《工业部门分类目录》等具体规定分类(组)的标准,从而为数据整理提供统一的依据。

数量标志分组就是根据统计研究的目的和任务,选择反映事物数量差异的数量标志来作为分组标志,在数量标志变异范围内划定各组的数量界限,将总体划分为性质不同的若干部分或组别。例如,我国在研究人的成长状况时,可按年龄分组,0~6岁为婴幼儿,7~17岁为少年儿童,18~59岁为中青年,60岁(其中女性为55岁)及以上为老年。按数量标志分组并不是要单纯地确定各组间的数量差异,而是要通过分组体现的数量变化来确定现象的不同性质和不同类型。

2)根据采用分组标志的多少,分为简单分组与复合分组。简单分组就是对所研究现象总体按一个标志进行的分组。例如,职工按性别分组,可分为男、女两组;按收入分组,可分为高、中、低三组;学生按成绩分组,可分为60分以下、60~80分、80~90分、90分以上四组。

简单分组只能说明总体在某一方面的差异情况。在实际工作中,简单分组很难满足多方面的要求。此时,就需要从不同角度,运用多个分组标志进行分组,形成一个分组体系来认识事物。

对同一总体选择两个或两个以上的标志进行简单分组,这种分组方法形成平行分组体系。例如,对某校学生消费情况进行调查,可分别按年级和性别分组,得到的分组结果如表3-3所示。

表3-3 某校学生消费情况(按年级和性别分组)

平行分组体系是由几个简单分组平行排列形成的,各个简单分组都单独反映总体某一方面的特征,相互之间并不交叉。

复合分组就是对同一总体采用两个或两个以上的标志层叠起来进行分组。复合分组形成复合分组体系。例如,对某校学生先按年级分组,再将各年级的学生按性别分组,就是复合分组,如表3-4所示。

表3-4 某校学生情况分组(按年级和性别分组)

复合分组比简单分组能更深入地说明问题,能更深入地反映总体的内部结构。但是,随着分组标志的增加,组数将成倍地增加,从而使各组的单位数减少,不易揭示总体的本质特征。因此,不宜采用过多的标志进行复合分组。究竟采用几个标志进行复合分组,要根据统计研究的目的和任务决定。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈