理论教育 中国高等教育投资的需求预测及研究

中国高等教育投资的需求预测及研究

时间:2023-10-08 理论教育 版权反馈
【摘要】:综上,笔者认为,高等教育经费的需求预测不仅受高等教育发展系统内部因素的影响,而且受系统外部经济政治等因素的制约。根据以上分析,我们将高等教育投资经费的总需求作为因变量,记为Y; 高等学校在校生人数、生均高等教育经费支出、高等教育毛入学率、GDP、人均GDP 五个变量作为自变量,分别记为x1、x2、x3、x4、x5。表4-1回归分析中相关变量的样本观测值续表数据来源:《中国教育经费统计年鉴》 1996—2010 年。

中国高等教育投资的需求预测及研究

目前,中国正处于城市化加速发展阶段和高等教育大众化发展时期,有关高等教育发展规模的预测问题已引起了学者们的高度重视,但从4.1.1 节的方法简介和文献综述来看,现有文献中大多以高等教育毛入学率Y1,或者高等学校在校生人数Y2 来表征高等教育规模,也就是以Y1 或者Y2 为被解释变量(或分析单元,或输出变量),而选取的影响因素Xi 却各不相同,得到的高等教育规模预测结果也不尽相同。这些研究各具优点和价值的同时,也各有缺陷,它们的模型大都以线性分析为基础,并且在解释变量的选择上差别较大,有的具有一定的随意性,缺乏深层次的理论分析; 有的对高等教育规模预测的精确度不高,而这些都将影响到中国高等教育规划决策科学性。[12]当然,也有学者以25~64 岁人口中受高等教育人口的比重来表征一个国家的高等教育发展规模,如岳昌君(2004) 以1999 年的相关数据为样本,对这个指标和人均国民收入总值及第二、第三产业增加值的比重进行了回归预测的国际比较分析。[13]

与此同时,也有少数文献对中国普通高等教育经费或财政性经费进行需求预测,但有的预测模型中以上一年的经费为影响因素,有的预测模型中以时间t 为解释变量,这些模型都是单变量的,预测结果严格依赖于时间的变化,这样无法反映出不同时期受不同经济社会发展等因素而影响的高等教育状况,而且一旦某年度的统计数据出现误差或者缺失,或统计口径出现差异,都会严重的影响预测结果的精度。另外,在高等教育经费的需求预测中,也有一些文献,如来卓(2009)、罗玲(2011) 等,采用生均高等教育经费指数这个指标进行估计,即:

其中Y 表示高等教育经费的总需求,a 表示生均高等教育经费指数,X1表示人均GDP,X2 表示高等学校在校生人数,X3 表示生均高等教育经费。笔者认为,选用这种测算方法对高等教育经费的总需求进行预测有一定的道理,但是对于关键指标生均高等教育经费指数,不同文献中所给出的过去的实际值及未来的预测值差异很大,其中生均高等教育经费指数未来时期的预测值,主要是根据国际水平主观估计的,由于不同国情的高等教育发展状况是迥异的,那么这样也将影响高等教育经费总需求预测结果的可信度。不过这种估计思路与叶欣茹(2005) 所提出的计算高等教育经费总需求的方法比较一致,即:Y=X1 ×X2,此处Y 表示高等教育经费总需求,X1 表示高等学校在校生总人数,X2 表示生均高等教育经费。笔者认为,选用这个公式计算高等教育经费总需求不无道理,但是从笔者在相关年鉴上找到的X1、X2 和Y的1995—2009 年实际数据来看,利用这个公式计算所得的Y 与当年实际的总经费偏差较大,所以如果直接选用此公式预测未来时期的高等教育经费总需求,预测的精确度可能并不会太理想。正是基于以上种种问题的考虑,笔者在现有研究的基础上,选取1995—2009 年15 年的相关指标观测值做输入样本,在加强变量选择科学性的同时,利用MATLAB 软件进行逐步线性回归,选择拟合效果最好的回归模型,对高等教育投资经费的总需求进行预测模拟,以期得到更可靠的结论以供参考。

4.1.2.1 解释变量的选取

正如许多学者所言,高等教育的发展不仅受国家的政治、经济、文化、人口等多种因素的影响,也还与所处的历史发展时期密切相关,因此可以说,高等教育发展系统是介于严格的有序与无序之间,具有开放性、动态性、非线性和自组织性等的复杂系统。[14]然而,在所有的影响因素中,经济发展因素被学术界公认为是对高等教育发展最具显著影响的因素,如吕作琴等(1997)、俞培果等(2002)、严全治(2003)、孙绍荣等(2004)、毛宏涛等(2004) 等都从不同角度对这一问题进行了探讨。而国内生产总值(简称GDP) 是在一定时期内一国国内所生产的全部最终产品的价值总和,是描述一国总体经济活动的重要指标。[15]另外,从4.1.1 节的文献综述可知,高等教育发展规模主要可以通过高等教育毛入学率,或者高等学校在校生人数等来反映。综上,笔者认为,高等教育经费的需求预测不仅受高等教育发展系统内部因素的影响,而且受系统外部经济政治等因素的制约。其中,系统内部影响因素中主要选取高校在校生人数、高等教育毛入学率等为代表元; 系统外部影响因素中主要选取GDP 等为代表元。同时,为了充分考虑高等教育发展系统的复杂影响因素,尽可能提高预测精度,在此笔者也将生均高等教育经费指数纳入考虑范围,因此将其相关指标人均GDP 和生均高等教育经费也选为解释变量。

根据以上分析,我们将高等教育投资经费的总需求作为因变量,记为Y; 高等学校在校生人数、生均高等教育经费支出、高等教育毛入学率、GDP、人均GDP 五个变量作为自变量,分别记为x1、x2、x3、x4、x5。我们的目的就是要通过样本观测值,确定回归方程Y =f(x1,x2,x3,x4,x5) +ε,其中ε 是随机误差项,并根据xi 的值预测高等教育经费总需求Y。

4.1.2.2 数据的预处理

对于上述选定的六个变量,笔者以1995—2009 年的相关数据为样本,得到样本观测值如表4-1 所示。其中,Y 的样本观测值取1995—2009 年的高等教育经费总支出数据; 考虑到成人高等教育情况较为复杂,在校生的统计数据有些年份缺失,而且成人高等教育支出占总支出的比重呈逐年递减趋势,2008 年开始已降到不足3%,因此这里采用普通高校在校生人数代替变量x1

表4-1 回归分析中相关变量的样本观测值

续表

数据来源:《中国教育经费统计年鉴》 1996—2010 年。

为了检验所选择的这些变量之间是否存在相关关系,观察因变量与各自变量之间是线性的还是非线性关系,下面做出因变量与各自变量的样本散点图,以便选择恰当的数学模型形式。图4-1、图4-2、图4-3 分别为高等教育经费总需求Y 与普通高校在校生人数x1、生均高等教育经费支出x2、高等教育毛入学率x3、GDPx4、人均GDPx5 五个变量之间的散点图。

图4-1 Y 与x1 、Y 与x2 的散点图

图4-2 Y 与x3 、Y 与x4 的散点图

图4-3 Y 与x5 的散点图

4.1.2.3 回归预测模型的建立和检验

从上述散点图可以看出,除了Y 与x2 的散点图外,因变量Y 与其他四个变量的散点图的走势比较类似,即随着自变量的增加,因变量Y 基本也呈上升趋势,图中的点大致分布在一条向右上方延伸的直线附近。但各点不完全在一条直线上,这是由于因变量Y 可能还受到其他一些随机因素的影响。因此,可以认为,因变量Y 与自变量x1、x3、x4、x5 有比较好的线性关系,所以在此可以应用逐步线性回归的方法建立高等教育投资需求的预测模型。

设多元线性回归模型为:

其中β0,β1,…β5,σ2 为与x1、x2、x3、x4、x5 无关的未知参数,对变量x1、x2、x3、x4、x5 和Y 作n 次观测得样本值(此处取n = 15),则有

下面利用MATLAB 软件进行逐步线性回归,并从中选择拟合效果最好的回归模型。

①考虑所有解释变量:为了尽可能全面考虑所有影响因素,将因变量Y 和自变量x1、x2、x3、x4、x5 的15 组样本观测值输入程序,利用MATLAB 统计工具箱进行逐步线性回归,得到经验回归直线方程为:

t 统计量的值(5.9551) (3.2903) (12.9147)

p 值(0.0001) (0.0072) (0.0000)

且检验结果为:R - square = 0.9977,F = 1601.31,RMSE = 75.7027,

AdjR - sq = 0.9971,p = 8.38604e - 015。

②剔除变量x5 或x4:由于变量x4 和x5 都与经济因素有关,具有一定的相关性,因此依照向后剔除法在模型中先后剔除了x5 及x4,然后利用MATLAB 软件,分别可得拟合直线方程。其中剔除x5 后所得回归方程如下:

t 统计量的值 (14.3570) (4.7248) 

p 值 (0.0000) (0.0005)

且检验结果为:R - square = 0.9847,F = 386.57,RMSE = 187.47,

AdjR - sq = 0.9822,p = 1.27468e - 011。

而剔除x4 后所得回归方程如下:

t 统计量的值 (3.8394) (15.2400) (www.daowen.com)

p 值 (0.0024) (0.0000) 

且检验结果为:R - square = 0.9955,F = 1317.65,RMSE = 102.095,AdjR - sq = 0.9947,p = 8.67514e - 015。

对于这三个直线方程,分析所得到的检验结果可以发现:相关系数平方值R2 都很接近于1,说明模型拟合程度较高,回归方程都较显著;F 检验统计量的值都满足F >Fα(k,n -k - 1) ,这表明模型的线性关系在95%的水平下是显著的; 每个解释变量所对应的t 检验统计量的值都满足(n -k -1) ,这表明模型中对应的解释变量是显著的,即都通过了变量的显著性检验; 显著性概率都满足p <0.05,故拒绝零假设H0,即三个回归模型都是成立的。因此可以说,这三个回归模型都较好地通过了拟合优度检验、方程的显著性检验和变量的显著性检验。

既然三个模型都通过了检验,下面我们利用这三个方程分别计算样本期每年的高等教育经费总支出的模型模拟结果,相关估计值及模型的相对误差分别如表4-2 所示。

表4-2 高等教育经费需求模型模拟结果

从表4-2 可知,虽然三个回归模型都较好地通过了统计检验,但是根据拟合直线方程计算高等教育经费总支出,其模型估计值与实际值之间还是存在着一定的误差,其中第二个模型的相对误差较大,第三个次之,第一个模型的相对误差最小。不过第三个与第一个模型的拟合误差情况比较接近,且拟合优度很高,统计检验结果也相当好。同时,从经济意义的角度来看,第三个模型中包含的解释变量是高等教育毛入学率x3 和人均GDPx5,正好一个表征高等教育发展系统内部因素,即x3 是衡量一国高等教育规模和品质的指数; 另一个表征高等教育发展系统外部因素,即x5 是衡量一国经济社会发展动力和民族进步速度的指针。所以从这个角度来说,选用x3 和x5这两个指标作为高等教育经费需求预测模型的解释变量更具合理性和科学性。另外,从变量的意义来看,高等教育毛入学率x3 反映高等教育的增量,人均GDPx5 反映国民经济发展的效果和国民劳动的价值[16],因此,无论x3还是x5,二者都是相对指标,都是存量的概念,随着时间的推移二者的样本值虽都在增长,但相比较其他变量,即高等学校在校生人数x1 和GDPx4这两个绝对指标来说,其增长率要小得多,并且其取值范围在一定时期内是可期的,所以选用这两个相对变量的函数进行预测,相对来说估计精度会更高。基于以上分析,笔者在此选用第三个回归模型对未来高等教育经费的总需求进行预测,即预测模型如下:

其经济意义可解释为:高等教育毛入学率每增加1%,高等教育经费的总支出约增加47.1176%; 人均国内生产总值增加1%,高等教育经费的总支出约增加0.1703%。

4.1.2.4 高等教育投资经费总需求的预测

①高等教育毛入学率x3 与人均GDPx5 的预测模型

要根据上述回归分析模型,对中国未来一定时期的高等教育经费总需求进行科学预测,还需先预测出未来中国的高等教育毛入学率x3 和人均GDPx5 的值,因此下面先根据中国过去十五年的相关样本值(表4-1),在直角坐标系中分别做出高等教育毛入学率x3、人均GDPx5 与时间的关系的散点图,以确定高等教育毛入学率x3 与人均GDPx5 的预测模型。

图4-4 高等教育毛入学率与时间的关系图

如图4-4 所示,该曲线表明中国1995—2009 年的高等教育毛入学率变化趋势。通过该图不难看出,中国高等教育毛入学率x3 与时间的关系图基本呈一条向右上方延伸的直线,即随着自变量时间t 的增加,因变量x3 也大致呈直线上升趋势。从增长规模来看,中国从1995 年到2009 年的15 年间,高等教育毛入学率的年均增长率为9.15%,但2003 年开始增幅一直呈下降趋势,2009 年的年增长率只有3.86%,这表明高等教育毛入学率后期的增幅已呈减缓态势。而 《国家中长期教育改革和发展规划纲要 (2010—2020) 》 已明确提出,到2020 年,中国的高等教育毛入学率达到40%。另据《2010 年全国教育事业发展统计公报》,2010 年高等教育毛入学率已达到26.5%。基于以上考虑,笔者假设2010—2020 年,中国高等教育毛入学率x3 朝着40%的目标按照线性增长,即中国未来十年的高等教育毛入学率x3 的估算公式为:

其中以2010 年为基年,对应的t =0,而2011—2020 年高等教育毛入学率中的t 分别取1-10。

图4-5 人均GDP 与时间的关系图

如图4-5 所示,该曲线表明中国1995—2009 年人均GDP 的变化趋势。通过该图可以看出,散点图上的样本数据点在一条向右上方延伸的曲线周围,这表明中国的人均GDPx5 与时间之间不再是线性相关关系,而是一种非线性的相关关系。根据数学知识初步判断,x5 与时间t 之间的这种趋势曲线大致为:x5 =f1(t)=α eβt +γ +ε( α,β,γ 为待定系数,ε 是随机误差项),或者x5 =f2(t)=α t2 +βt +γ +ε( α,β,γ 为待定系数,ε是随机误差项)。

为了检验上述判断的正确与否,笔者利用MATLAB 软件,首先对人均GDPx5 与时间t 的相关性进行了检验,可得相关系数R = 0.9380,这表明人均GDPx5 与时间t 具有显著的相关性; 然后利用表4-1 中的样本值,对人均GDPx5 与时间t 进行线性回归,可以发现拟合结果并不好,其中拟合优度R - square=0,常数项的置信区间包含了零点,残差分析结果也不太好,这表明回归结果并不太显著。因此,我们可以分别用上述两种曲线形式来拟合人均GDPx5 与时间t 之间的相关关系。为了确定二者之间的曲线函数关系式:x5 =f1(t)=α eβt +γ 或者x5 =f2(t)=α t2 +βt +γ,笔者根据表4-1 中的样本值,应用LINGO 软件,通过求解最优化模型,即

其中t) 为被解释变量也就是人均GDP x5 的估计值,RSS =表示残差平方和。可求得局部最优拟合模型分别为:

为了检验拟和模型的拟合效果,以及对两个拟和模型进行比较择优,下面应用这两个拟合模型分别计算样本期每年的人均GDP 的模拟结果,其估计值及模型的相对误差分别如表4-3 所示。

表4-3 人均GDP 的模型模拟结果

续表

从表4-3 的模拟结果可知,对于拟合函数(t) ,模型的相对误差基本上都满足Δf1(t)/f(t) <5% ,这表明局部最优拟合模型式(4.3) 是一个比较好的拟合模型; 对于拟合函数(t) ,虽然模型中1995—2009 年的平均相对误差= 0.0085,远小于5% ,但模型的相对误差较拟合函数(t) 而言,还是整体较大,因此应用此模型对目标变量进行预测,可能每个估计值与实际值之间的偏差会大一些,预测精度可能不是太高。因此,下面按照1995—2009 年的拟合情况,考虑模型式(4.3) 对2011—2020 年中国人均GDPx5 预测的估计值,分别如表4-4 所示。

表4-4 人均GDP 的模型预测值

通过上表可以发现,应用拟合函数(t) 所得到的中国人均GDP 的估计值偏大。因为运用(t) 所得到2020 年人均GDP 的估计值是2000 年的23.9倍,而从中国的奋斗目标和实际情况来看,党的十七大提出,要实现人均GDP 到2020 年比2000 年翻两番; 基于国内外经济发展形势,2011 年3 月14 日第十一届人大四次会议批准通过的“十二五”规划,明确提出“十二五”期间经济发展速度是7%; 许多专家都预测中国会提前实现人均GDP比2000 年翻两番的奋斗目标,但是2020 年达到2000 年的23.9 倍显然不符合中国经济发展的规律与预期。之所以出现这样的情况,笔者分析,原因在于公式(4.3) 中的指数增长模型有其自身的局限性,即在初始阶段增长还比较缓慢,但是随着自变量的增大,即到了事件发展的中后期阶段,指数增长模型所反映的发展非常迅速。而这显然不符合中国实施加快转变经济发展方式战略,未来经济发展速度会有所趋缓的基本走势。

笔者认为,在选择合适的未来人均GDP 的预测模型时,既要充分考虑过去历史时期的人均GDP 的拟合情况,也要考虑未来中国的经济发展水平和趋势。基于以上分析,笔者在此将拟合模型(t) 进行修正,也就是将自变量的增长幅度放缓,即将Δt = 1 减小到Δt = 0.5。经过计算可以发现,无论是从理论上还是计算结果来看,这样得到的未来一段时期的中国人均GDP 的预测是相对合理的,其中修正模型(t) 后所得到的预测值及其年增长率如表4-5 所示。

表4-5 人均GDP 的修正模型预测值

②中国高等教育投资经费的需求预测

综上所述,利用公式(4.2) 和(4.3),我们可以分别预测出中国2011—2020 年的高等教育毛入学率x3 与人均GDPx5 的点估计值(见表4-5),然后利用二元线性回归模型(4.1),可以对2011—2020 年中国的高等教育经费总需求进行预测,具体预测的估计值如表4-6 所示。

表4-6 中国高等教育经费总需求的模型预测值

从表4-6 可以看出,2011—2020 年中国高等教育经费总需求和毛入学率、人均GDP 的模型预测的估计值都随时间的变化而逐渐增大。当然这也只是不同时期高等教育经费需求预测值的点估计值,而与未来的实际值之间难免会有一定的误差,因为在经济社会发展的背景下,在中国高等教育发展的进程中,难免还会受到一些随机因素的影响,诸如国际政治经济环境的变换、国内相关政策的变化等,而这是模型中所无法预测也无法量化的,但是可以说,高等教育经费总需求的预测值会以一个很高的置信水平处于以该估计值为中心的一个区间内,那么该预测分析对未来高等教育的发展趋势和投资结构的优化方向具有一定的参考作用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈