统计分组的关键在于分组标志的选择和各组界限的划分。
(一)分组标志的选择
统计总体由若干个总体单位组成,每个总体单位又有若干个标志。究竟选择什么样的标志对总体单位进行分组呢?分组标志选择正确与否是分组能否正确反映客观实际的关键,在选择分组标志时一般需考虑以下三点:
(1)选择分组标志需从统计研究的目的出发。例如,为了说明工业企业对国家的贡献,可以选择创造的产值、利润和税金及出口创汇能力等标志,如果选择工人数、资金占有额等标志就不符合研究的目的。
(2)要选择最能反映事物本质特征的主要标志,即从众多标志中选择最重要的、最能反映现象本质特征的主要标志。
(3)要充分考虑被研究对象所处的时间、地点、条件。例如,要研究工业企业的生产规模,可以选择的标志有许多,如厂房大小、占地面积、职工人数、设备数量、固定资金、生产能力、产值、利润、税金、成本等。其中,职工人数、固定资金、生产能力、产值等标志在说明生产规模时具有本质性,但具体选用哪个标志作为分组标志,还需考虑当时的时间、地点、条件。如果处于工业生产发展的初期,技术比较落后,则选用职工人数作为分组标志比较合适;而在技术迅猛发展的今天,则应选择以设备为基础的工业产品生产能力或固定资产原值等作为分组标志。
(二)划分各组界限
分组标志确定之后,必须解决分组界限问题,即按选定的分组标志将所研究的总体划分为若干组,确定各组之间的界限。根据分组标志的特征,统计总体可按品质标志和数量标志分组。
1.按品质标志分组和分组数列
按品质标志分组就是选择反映事物属性的品质标志作为分组标志进行统计分组。例如,人口按性别分组,企业按所有制分组等。按品质标志分组,有的界限明确,划分也比较容易,如人口按性别分组;而有的则比较复杂,各组界限的确定也困难,如国民经济按部门、职业、商品等分类都很复杂。在实际工作中,对于较复杂的品质标志分组(习惯上叫作分类),有专门的分类目录,以统一全国的分组口径,方便大家查阅。此处仅介绍较容易的分组,至于较复杂、较困难的品质标志分组则不作阐述。
按照选定的品质标志对所研究的总体进行分组后所形成的数列叫分组数列。这种数列可分为两种:一种是品质分配数列;另一种是品质非分配数列。
(1)品质分配数列。品质分配数列是由按品质标志分组的各组名称和各组的总体单位数组成的数列。它可以说明总体单位分布在各组的情况,故称为品质分配数列,也称为属性分布数列。例如,在人口统计中将全国的居民作为一个总体,每一个居民便是总体单位,如果按性别这个品质标志进行分组,再将各组中的数列表示出来,便是品质分配数列。表4-4所示为2017 年我国大陆人口的性别分布。
表4-4 我国大陆人口的性别分布
(www.daowen.com)
(2)品质非分配数列。品质非分配数列是由按品质标志分组的各级名称和总体单位以外的其他指标数值所组成的统计数列。例如,对全国工业企业进行调查时将全国的工业企业作为一个总体,每一个工业企业作为一个总体单位。若将调查的资料按轻工业、重工业分组,就不用企业数量说明各组的分布情况,而是用总体单位数以外的其他指标数值来说明,如工业企业总产值指标。表4-5 所示为按1990 年不变价格计算的某地2015 年轻、重工业总产值。
表4-5 某地2015 年轻、重工业总产值
续表
2.按数量标志分组和变量数列
在对调查资料进行整理时,可选择数量标志分组。由按数量标志划分的各组和说明各组的指标数值形成一个统计数列,这个统计数列称为变量数列。变量数列有两种形式:一种是变量分配数列,另一种是变量非分配数列。
(1)变量分配数列。变量分配数列也称为变量分布数列,是按数量标志分组形成各组,并反映总体单位数在各组的分布状况。例如,表4-6 所示为某班学生某科期中考试分数统计资料。
表4-6 某班学生某科期中考试分数
(2)变量非分配数列。变量非分配数列是指按变量数列分组,但说明各组的指标数值不是总体单位数,而是其他指标数值。例如,为研究某地区乡镇工业企业职工人数与劳动效率的情况,将该地区的乡镇工业企业作为总体,每一个乡镇工业企业就是一个总体单位。选择职工人数作为分组标志进行分组,分组后不是用企业数说明各组的分布情况,而是用劳动生产率去说明,如表4-7 所示。
表4-7 某地区乡镇企业职工人数与劳动生产率
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。