2.1.2.1 标志
统计活动的对象虽然是统计总体,但是人们所关心的实际上并不是该总体和组成该总体的各个个体本身,而主要是为了考察与各个个体以及总体相联系的某些特征,考察这些特征在总体上各个个体间的分布情况。例如,人口普查是为了考察不同性别、民族、年龄、文化程度、职业等特征上人口数量的分布状况;对工业企业总体进行调查,是为了考察不同行业、职工人数、资产规模、销售收入、利润等特征上企业数量的分布情况等。
总体中各单位普遍具有的属性或特征称为标志,每个总体单位从不同方面考察都具有许多属性和特征,例如,每个工人都具有性别、工种、文化程度、技术等级、年龄、工龄、工资水平等属性和特征,这些就是工人作为总体单位的标志。标志在某个个体上的具体表现称为标志表现。例如,工人王进,男性,29岁,高中毕业,就分别是性别、年龄、学历的一个具体表现。对于一个可以有不同表现结果的标志,一般来说有多少个总体单位,就有多少个标志表现。
标志分为品质标志和数量标志两种。品质标志表明个体属性方面的特征,品质标志的表现只能用文字、语言来描述,例如,工人的性别是品质标志,其标志具体表现为男、女。数量标志表明个体数量方面的特征,可以用数值来表现。例如,职工的工龄是数量标志,其标志具体表现为年数。由于总体是由同类事物的全体构成,所以在一个总体中必然有些标志在各个个体上的标志表现完全相同,这样的标志称为不变标志。例如在工人这一总体中,职业这一标志的具体表现都是工人,所以职业便是不变标志。在一个总体中,当一个标志在各单位的具体表现有可能不同时,这个标志便称为可变标志。例如在工人总体中,每个工人的工龄、年龄、工资表现不尽相同,所以工龄、年龄、工资便是可变标志。在统计总体中,不变标志和可变标志各自发挥着重要的作用。一个总体至少要有一个不变标志,才能够使各单位结合成一个总体。例如,工人总体中职业的标志是不变的,才能使全体工人构成一个总体。所以,不变标志是总体同质性的基础。如果没有不变标志,那么总体也就不存在。作为总体,同时必须存在可变标志,这表示所研究的现象在各单位之间存在着差异,这才需要进行统计研究。上例中工人的职业标志是不变的,但又存在工龄、年龄、工资等可变标志,所以才需要开展调查统计工作,并计算平均工龄、平均年龄、平均工资等标志。如果各工人的工龄、年龄、工资水平都一样,也就没有必要去统计工人的工龄、年龄、工资,也不需要用统计方法测度平均数了,这里同时也说明了统计总体的同质性、大量性和差异性三个基本特性。
2.1.2.2 变量
在数学中变量是与常量相对应的概念,变量是指在一个问题里可以变化的量,常量是指在一个问题里始终保持不变的量。在统计中,狭义的变量是指说明现象某一数量特征的概念,即可变的数量标志称为变量。如人的年龄,身高,体重,企业的销售收入,利润等都是变量。因此,变量实际上是可变的数量标志的抽象化,而各个单位在可变的数量标志上的标志表现就是变量的各个取值,称为变量值,也称为标志值。但是从广义上看,变量不仅指可变的数量标志,也包括可变的品质标志。通常将可以取不同数量值的变量称为数量变量或定量变量(quantitative variable),将取非数量值的变量称为属性变量或定性变量或分类变量(qualitative variable,categorical variable),前者是可变的数量标志的抽象化,后者是可变的品质标志的抽象化。当然数量变量和属性变量的变量性质不同,在统计处理的方法上有许多区别。
根据变量值连续出现与否,变量可分为连续型变量和离散型变量。连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,气象上的温度、湿度,一种产品零件的尺寸,电子元件的使用寿命等都是连续型变量。离散型变量是指变量的数值只能用计数的方法取得,其取值是整数值,可以一一列举。例如,企业数、职工人数等。
根据变量的取值确定与否,变量又可分为确定性变量和随机变量。确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量,变量的取值无法事先确定。社会经济现象既有确定性变量也有随机变量。随机变量是统计学研究的主要内容。
2.1.2.3 计量尺度
统计标志有数量标志和品质标志两种,相应地,统计数据也有定量型数据和定性型数据两类,各有不同特点,所以在统计观测中,需要有不同的测定和计量尺度。根据我们对客观事物测度的程度或精确水平来区分,可将所采用的计量尺度由低级到高级、由粗略到精确分为四个层次,即定类尺度、定序尺度、定距尺度和定比尺度。不同的标志使用不同的计量尺度,采用不同的计量尺度可以得到不同类型的统计数据。
(1)定类尺度(www.daowen.com)
定类尺度也称名义尺度或列名尺度,它是最粗略、测度层次最低的计量尺度,这种计量尺度只能表明个体所属的类别而不能体现其数量大小、多少或先后顺序。定类尺度一般用于对客观事物进行平行的分类或分组。例如,按照性别将人口分为男、女两类,按照国民经济部门将工业分为采掘工业和加工工业两类,按照所有制性质将企业分为国有、集体、民营、合资企业等。定类尺度除了用文字表述以外,也可以用数值符号来表示,比如用“1”表示男性人口,用“0”表示女性人口;用“1”表示国有企业,用“2”表示集体企业,用“3”表示民营企业,用“4”表示合资企业等。这里我们只是将事物的一个类别转化成一个数字,绝不意味着可以根据这些数字区分大小或进行数学运算。
使用定类尺度进行分类必须符合“穷尽”和“互斥”的原则,即在所分的全部类别中必须保证每个个体或单位都能够归属于某一类别,并且只能归属于一个类别。定类尺度是对事物的一种最基本的测度,它是其他计量尺度的基础。
(2)定序尺度
定序尺度也称顺序尺度或列序尺度,它是对事物之间等级或顺序的一种测度。该尺度不仅可以将事物分成不同的类别,而且可以确定这些类别的优劣或顺序。或者说,它不仅可以测度类别差,还可以测度次序差。例如,产品质量等级,奖励等级,学习考试成绩的优、良、中、及格、不及格等分级都是定序测度。显然,定序尺度对事物的计量比定类尺度精确一些,但也只是测度了类别之间的顺序,而未测量出类别之间的准确差值。定序尺度也可以用数字来表示,但是其计量结果只能比较大小,仍不能进行加、减、乘、除等数学运算。
(3)定距尺度
定类尺度和定序尺度主要应用于品质标志,对于数量标志则可以应用更高级的计量尺度:定距尺度和定比尺度,二者都是刻度级(scale)尺度。定距尺度也称间距尺度或差距尺度,它是以数值来表示个体的特征并且能测定个体之间数值差距的尺度。就是说,定距尺度不仅能够将事物区分为不同的类型并进行排序,而且可以准确地计量出它们的差距是多少。广义上看,所有的数量标志或数量变量都可以应用定距尺度,但是从狭义上看,定距尺度是指应用于那些没有绝对零点的数量标志的计量和测度的。如摄氏温度,考试成绩等,其数值不存在绝对零点,摄氏温度零度并不表示没有温度,考试成绩为0分并不等于没有知识。这类没有绝对零点的数量标志虽然其标志表现为数量值,但是其数值之间不存在比例换算关系,因此这类数量标志值只进行加减运算而不进行乘除运算。例如气温30℃与15℃比较,温度相差15℃,但是并不表示30℃比15℃热一倍;同样学生的统计学考试成绩,80分并不表示比40分掌握的统计学知识多一倍,两者相除没有实际意义,但是,可以计算分差。
(4)定比尺度
定比尺度也称比例尺度和比率尺度,是最高级别的统计测度和计量尺度。定比尺度除了具有上述三种尺度的全部特性外,还具有一个特性,那就是可以计算两个测度值之间的比值,即定比尺度不仅能进行加减运算,而且也能进行乘除运算。这就要求定比尺度中必须有一个绝对的零点,这是它与定距尺度的唯一区别。例如人的年龄、身高、体重,物体的长度、面积、容积等数量标志,都存在绝对零点,即“0”表示没有。因此,我们在将60岁的老赵与20岁的小赵比较时,可以说老赵年龄是小赵年龄的3倍,当然也可以说老赵与小赵年龄相差40岁。在现实生活中,大多数数量标志存在绝对零点,因此,定比尺度是常用的计量尺度,它的应用范围也最广。
上述四种计量尺度对客观事物的测度层次或水平是由低级到高级、由粗略到精确逐步递进的。高层次的计量尺度可以兼有低层次计量尺度的功能,如定比尺度包含了定距尺度的功能,定距尺度包含了定序尺度的功能,定序尺度又包含了定类尺度的功能,但是低层次的计量尺度却不能兼有高层次的计量尺度的功能。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。