理论教育 山西省消费结构和年龄结构数据分析及回归模型结果

山西省消费结构和年龄结构数据分析及回归模型结果

时间:2023-11-17 理论教育 版权反馈
【摘要】:表4.4.1山西省消费结构和年龄结构数据(%)考虑消费结构为成分因变量,年龄结构为成分自变量,建立单形上的线性回归模型其中a 0和A 1是参数。而且表4.4.2也给出了统计量F值及相应p值。表4.4.2基于置换后的消费成分和年龄成分的ilr坐标的回归模型结果根据表4.4.2可知公式中c 0和C 1的估计值。对于模型,y i的第8个成分的预测值为两种模型和的RMSD分别为0.1549和0.1581。

山西省消费结构和年龄结构数据分析及回归模型结果

本节来验证本章所提出的模型的有用性和有效性。基于该模型来对中国山西省的消费结构年龄结构之间的线性关系进行建模。消费结构成分(y)包括在食物(y 1)、衣服(y 2)、房屋(y 3)、家庭设备(y 4)、医疗保健(y 5)、交通通信(y 6)、教育娱乐(y 7)和其他活动(y 8)方面的消费。年龄结构成分(x)包括三个部分:年龄小于15岁(x 1),年龄在15岁到64岁之间(x 2),年龄大于64岁(x 3)。消费结构和年龄结构数据来自历年《山西统计年鉴》(见表4.4.1)。

表4.4.1 山西省消费结构和年龄结构数据(%)

考虑消费结构为成分因变量,年龄结构为成分自变量,建立单形上的线性回归模型

其中a 0和A 1是参数。基于置换后的消费成分和年龄成分的ilr坐标的回归模型为

其中因变量和自变量分别为(l 0∈{1,2,…,8})和ilr(x(l 1))(l 1∈{1,2,3}),是截距,回归系数向量。当模型(4.4.2)中的l 0从1变到8,l 1从1变到3时,参数估计和推论结果见表4.4.2。例如,参数估计的第一行是的估计及p值。而且表4.4.2也给出了统计量F值及相应p值。当l 0固定时,通过定理4.3.1(3),对于任意的l 1(l 1=1,2,3),检验统计量F值可以通过模型(4.4.2)中的任意一个模型得到。

表4.4.2 基于置换后的消费成分和年龄成分的ilr坐标的回归模型结果

根据表4.4.2可知公式(4.3.8)中c 0和C 1的估计值。根据定理4.3.2可以得到(www.daowen.com)

其中黑色字体值代表对应参数在显著性水平0.1下是显著的。易证估计的系数矩阵A^1每行每列求和都为0,a^0是一个成分向量。矩阵A 1的第i行第j列的参数解释了关于成分x j对数比率对关于成分y i的对数比率的影响,即解释了关于成分x j的所有相对信息对关于成分y i的所有相对信息的影响。估计的回归系数矩阵A^1的解释如下:小于15岁,在15~64岁,大于64岁的居民分别更加关注教育娱乐,交通和通信以及居住;年龄组小于15岁的居民对文教娱乐方面的消费具有正影响,因为教育是一个永恒的主题,要从小抓起;年龄在15~64岁的居民对交通和通信方面的消费具有正影响,因为对于该年龄段的居民,汽车手机在日常生活中是必不可少的;年龄大于64岁的居民对居住方面的消费具有正影响,这对应于父母为孩子买房的社会现象。因此,年龄小于15岁的人口比例和教育娱乐消费比例,年龄在15~64岁的人口比例和交通通信消费比例,年龄大于64岁的人口比例和居住消费比例分别随着年份的变化有一种直接的比例关系,这与表4.4.1中的数据趋势是一致的。

考虑另一个实数空间上基于未变换数据的模型

其中y i,-8,x i,-3分别为因变量和自变量,y i,-8指的是y i中除了第8个成分外的其余成分,x i,-3指的是x i中除了第3个成分外的其余成分。x i中去掉第3个成分是为了避免多重共线性。由于y i的8个成分求和为常数100%,则y i中去除第8个成分。通过最小二乘法可得,

其中黑色字体值代表对应参数在显著性水平0.1下是显著的。从回归系数可以看出,年龄小于15岁和15~64岁的人口比例对相同的因变量y 1,y 3,y 6,y 7具有显著影响,而且具有相同的回归系数符号。由于年龄小于15岁和15~64岁人口比例之间的差异,基于未变换数据的模型中参数的解释结果与实际是不相符的。

为了比较基于原始成分数据的模型(4.4.1)和模型(4.4.3)的预测精度,考虑均方根距离作为评价指标

其中为y i的预测值。对于模型(4.4.3),y i的第8个成分的预测值为两种模型(4.4.1)和(4.4.3)的RMSD分别为0.1549和0.1581。结果表明这两种模型的预测精度非常接近,虽然如此,模型在回归参数的解释方面表现更优。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈