定义6.1 由于总体X 概率分布是确定的,但也是未知的,或至少分布的某些参数是未知的,为此,要研究总体必须在其中抽取一定数量的个体进行观测,这个过程称为抽样(取样、采样),从一个总体X 中抽取n 个个体为观测值(x1,x2,…,xn),这样得到的(x1,x2,…,xn)称为取自X 的一个样本(又称子样).样本中的元素为样品,样品的个数为样本容量.
注:由于抽样是随机的,故在抽取前样本中的每个样品也是随机的,并且每个个体被抽到的机会是相等的,为此,可用n 维随机向量(X1,X2,…,Xn)表示样本,样本一旦抽取测量后,得到的观测值则是一组具体确定的数值(x1,x2,…,xn),不再具有随机性.
为了从样本正确的推断总体,要求样本要较好地反映总体信息,为此抽样需满足下面2 条性质:
①样本要有代表性:即要求每一个个体都有同等机会被选入样本,也就是说每一个样本Xi(i=1,2,…,n)与总体X 有相同的分布.
②样本要有独立性:即要求样本中每一个样品取什么值不受其他样品取值的影响,也就是每一个样品Xi 之间相互独立.
为了满足上述要求,我们给出简单随机抽样的定义.
定义6.2 满足上述①②两条性质的抽样方法称为简单随机抽样方法,所获得的样本称为简单随机样本(random sample),在数理统计研究中简称为样本.
注:引入简单随机样本就可利用概率论中独立同分布随机变量序列所建立的许多重要定理结论为数理统计提供了必要的理论基础.
例如,对有限总体,采用有放回抽取得到的样本是简单随机样本.但实际中,有放回抽样使用起来不方便,通常采用无放回抽样.当总体容量很大时,有放回与无放回近似相同(概率论中可以证明).对无限总体,采用无放回即可得到一个简单随机样本.(www.daowen.com)
定义6.3 若总体X 的分布函数为F(x),由于样本中的个体是相互独立的,则简单随机样本X1,X2,…,Xn 的联合分布函数为
其中,F(xi)(i=1,2,…,n)称为样本分布.
(1)总体分布为离散型随机变量
若总体X 是离散型随机变量,其概率函数为P(X=xi)=p(xi),xi 取遍X 所有可能取值,则样本的联合概率函数为:
(2)总体分布为连续型随机变量
设总体X 是连续型随机变量,其概率密度函数为f(x),则样本的联合概率密度函数为
由于样本来自总体,样本中必然包含了总体的信息.总希望利用样本信息去推断总体的信息,即利用样本信息x1,x2,…,xn 来获得有关总体分布类型或总体参数的信息,而由于样本信息是一堆数据,需先对数据进行整理.常用方法有分组数据统计表和频率直方图、折线图、茎叶图以及经验分布函数等.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。