为研究农户对农村信息化认知及其影响因素,依据调查问卷提供的数据构建了多重线性回归(Multiple Linear Regression)模型,并设计了统计变量。
(1)模型及统计变量的选择
多重线性回归模型是一种计量分析模型,适合于分析一个因变量和多个自变量间的线性依存关系,因变量要求是随机的,自变量的值可以是随机的也可以认为是固定的。多重线性回归模型用偏相关描述在控制其他变量影响后因变量和某一个自变量间的线性相关关系。多重线性回归模型的数学模型表达式为:
y=β0+β1χ1+β2χ2+…+βpχp+ξ
式中y为因变量,一般是随机的观测值;χ1,χ2,…,χp为p个自变量;β0,β1,β2,…,βp是偏回归系数,βj(j=1,2,…,p)表示在其他自变量固定不变的情况下,自变量χj每增加或减少一个单位时,因变量y的变化量;β0为常数项;ξ为随机误差,又称残差,服从N(0,σ2)分布。
根据农户对农业信息化的认知、应用以及需求状况的分析,本研究首先选取了“农户年龄”“常住成年人”“是否外出务工”“家庭成员最高文化程度”“耕地面积”“种植作物种类”“居住地理位置”“收入水平在当地所处的地位”“所在行政村是否设有综合信息服务站点”“本村的农田水利工程是否能发挥作用”等十个可能影响农户对农业信息化的需求作为自变量;选择“认为农村信息化对自己作用如何”作为因变量。
(2)模型和统计量检验
SPSS16.0软件Multiple Linear Regression统计模块提供对自变量的自动筛选,筛选的依据是自变量对因变量y的贡献大小,由大到小依次进入方程。常用的方法有强制进入法(Enter)、前进法(Forward Selection)、后退法(Backward Selection)和逐步回归法(Stepwise Selection)等。为获得自变量进入模型的详细过程,本研究选择了逐步回归法(Stepwise Selection)作为自变量的筛选方法,分析每进入一个自变量,都对方程中的变量进行检验,对符合剔除标准的变量要逐一剔除,进入模型的显著性标准是变量的“Sig”值小于等于0.05,剔除变量的显著性标准是其“Sig”值大于等于0.1。最后除“农户年龄”“常住成年人”“是否外出务工”“种植作物种类”“所在行政村是否设有综合信息服务站点”五个自变量外,其余5个自变量都进入了模型。下面是通过SPSS16.0软件对模型进行模型总体拟合优度检验、模型方差分析、模型和变量的显著性检验、自相关检验、多重共线性检验以及其他必要的统计检验。
模型总体拟合优度通常用可决系数“R2”来衡量。从表2-13中可以看出随着进入模型的5个自变量被选入模型,调整的“R2”为0.933,说明最终模型总体拟合情况很好。
表2-13 Model Summary(模型检验)
表2-14是对拟合的模型进行方差分析的检验结果,可知模型在“0.05” 显著性水平下具有统计学意义,但模型有统计学意义并不能代表模型内的各个变量具有统计学意义,还需进行下一步的变量检验。
表2-14 ANOVA(模型自由度、F检验和显著性检验)
经济序列及经济计量模型中的随机误差序列经常存在自相关。比较常用的自相关检验方法是DW(Durbin-Watson)检验,该方法是杜宾(J.Durbin)和沃特森(G.S.Watson)于1950年提出的。使用DW检验需要满足:第一,误差项u的自相关为一阶自回归;其二,模型中变量没有滞后项;其三,样本容量必须大于“15”等。通常DW值小于1.5或者大于2.5,则说明存在自相关的可能性很大,本研究的多重线性回归模型符合使用DW检验的条件,由表2-13可知模型DW值为“1.620”,满足DW值在“1.5~2.5”区间的自相关检验标准,可见模型通过了自相关检验。
(3)多重共线性检验
多重共线性检验的方法较多,通常有五种:方差膨胀因子法(Variance Inflation Factor,VIF);条件指数判别法(Condition Index);特征根值法(Eigenvalue);容忍度法(Tolerance);“Variance Proportions”值法等。其中特征根值法(Eigenvalue)和条件指数判别法(Condition Index)主要通过对自变量进行主成分分析而实现。方差膨胀因子法(Variance Inflation Factor,VIF)中VIF值越大,表示存在多重共线性的可能性越大(当VIF值大于“10”时表示存在严重的共线性);当某些维度的条件指数(Condition Index)大于“30”时,表示存在严重的共线性;当特征根(Eigenvalue)为“0” 时,提示存在严重的多重共线性;当“Variance Proportions”的值大于“0.9”时,提示存在严重的多重共线性;容忍度(Tolerance)的值越大,超过“0.9”时,提示存在多重共线性。
每个变量的容忍度(Tolerance)值都小于“0.9”,方差膨胀因子(Variance Inflation Factor,VIF)的值除了“收入水平在当地的情况”(12.099,略微大于10)外,其他的都小于“10”;从表2-15可以看出,所有维度的条件指数(Condition Index)都小于“30”,特征根(Eigenvalue)的值也不为零,“Variance Proportions”的值小于“0.9”。综合以上分析可以看出,模型基本通过了多重共线性检验。
表2-15 Collinearity Diagnostics(多重共线性判断)
(www.daowen.com)
(4)因变量正太分布假设检验
通过残差正态“P-P”图来分析。通过对图2-1进行分析,可以看出,残差分布比较均匀,近似正态分布,说明因变量服从正态分布。
表2-16 没有进入模型变量的相关检验结果
表2-16中列出来了没有进入模型变量的检验结果,可以看出“农户年龄”“常住成年人”“是否外出务工”“种植作物种类”“所在行政村是否设有综合信息服务站点”五个自变量的“Sig.”值分别为0.059、0.261、0.948、0.187、0.299,没有通过“0.05水平”下的显著性检验。但是农户年龄的显著性检验结果是0.059,在“0.1水平”上通过了显著性检验,所以“常住成年人”“是否外出务工”“种植作物种类”“所在行政村是否设有综合信息服务站点”等四个自变量被剔除出模型。
图2-1 残差正态“p-p”图
(5)偏相关系数检验及变量显著性检验
在多重线性回归统计模型中,偏相关系数可以用来衡量自变量对因变量变化贡献程度的大小,通常情况下用0.05显著性水平下标准化偏相关系数的大小来表示,标准化偏相关系数的数值越大,则说明自变量对因变量的贡献程度较大。
本研究在利用SPSS16.0软件中自变量筛选时,对不符合0.05显著水平的变量进行了剔除,对所有在表2-17中的变量都通过了0.05的显著水平检验,标准化偏相关系数的大小如表2-17,但是0.1显著水平的变量在统计学上也具有统计意义,所以对那些通过0.1显著水平而不符合0.05显著水平的变量会单独分析。可见对因变量贡献程度较大的自变量有:“收入水平在当地所处的地位”“居住地理位置”“家庭成员最高文化程度”“本村的农田水利工程是否能发挥作用”“耕地面积”“农户年龄等”。
表2-17 偏相关系数及变量显著性检验
(6)农户信息化认知程度影响因素多重线性回归模型回归结果分析
以上模型和变量的检验结果表明,模型回归结果在统计学上有意义,并且通过了各种类型的统计检验。统计模型回归结果有效地检验和分析了因变量和自变量之间的相关关系,即自变量对因变量变化贡献程度的大小,在模型统计结果中用标准化偏相关系数(Standardized Coefficients)的大小和方向表示(见表2-17),通过分析我们可以得出以下结论:
“农户收入水平在当地所处的地位”与农户对农业信息化的认知及重要性评估显著正相关。“农户收入水平在当地所处的地位”的标准化偏相关系数是所有自变量中最大的(0.332),说明“农户收入水平在当地所处的地位”对农户认知、应用农业信息及评估其重要性具有非常积极的促进作用,收入水平在当地越高,农户获取农业信息及应用于农业生产中的渠道越多,逐步认识到农业信息化对自己的作用就越大。
“居住的地理位置”与农户对农业信息化的认知存在较强的正相关关系。“居住的地理位置”的标准化偏相关系数值为0.296,说明地理位置的优势有利于获知更多的政策信息,处于偏远地带的农户获取信息的途径相对较少,且不及时,从而无法认识到农业信息化的重要性。
“家庭成员最高文化程度”与农户对农业信息化重要性的认识有一定的正相关关系。偏相关系数为0.153,说明文化程度越高,对农业信息化的重要性认识越深,需求意愿也会更强烈。
“本村的农田水利工程是否能发挥作用”对农业信息化在农户生产中发挥的作用具有一定的正面影响。该研究结果表明,本村的农田水利工程发挥的作用越大,农户对当地水资源及水利建设情况了解得就越多,从而在一定程度上加大了对信息化的需求欲望。
“耕地面积”对农户认知农业信息化有正面的促进作用,其标准化偏相关系数为0.113。耕地面积越大,农户往往将其作为家庭的主要收入来源,从而更加注重自己的农业经营质量与效益,进而会更加主动地了解各种农业政策,对信息化需求也会更强。
“农户年龄”,令人感到惊讶的是,户主年龄对农户认知农业信息化有正面的促进作用,而且其标准化偏相关系数为0.15,相对于其他自变量并不算小,也就是说农户年龄越大,其对农业信息化重要性的认知程度越高,对农业信息化的需求也较强,这似乎与现实不符,但是经过相关研究成员讨论,并与农业经济专家探讨,最后一致认为造成这种现象的原因很多:第一,当前我国农村特别是甘肃省等一些经济发展落后、劳动力富裕的地区,年轻人大多都在外打工,很少参与农业生产劳动,对农业信息技术几乎毫不关心,也不清楚,而在农业生产一线参加农业劳动的大多是一些年龄较大的农民,所以反倒是那些文化程度较低、岁数较大、信息感知和接受能力较差的人群成为对农业信息最为关注的人;第二,留在农村参与农业劳动的岁数较大的农户,其在市场化大环境中对外来信息感到茫然无措,其农业生产经营中的信息化使用程度较低,在农业经营相关市场决策中也屡屡受挫,所以其在主观上对农业相关的技术和信息具有一种近乎渴望的心理。这个统计检验结果,不但在现实中有意义,而且能够准确地反映我国农村信息化需求和发展的现状以及农村农业整体的大环境,非常具有理论参考价值和实践指导意义。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。