传统典范式历史人口规模的研究,一般都是通过对大量相关史料的判读来进行概略的估算。曹树基先生认为,更多的样本数量和更高的样本精度可以有效提升最终的研究结论的可靠度。简单地说,就是估算一个省或更大区域的人口规模时,使用县一级的人口样本要优于使用府一级的人口样本,使用更多的县一级的人口样本要优于使用较少的县一级的人口样本。这一研究思路和方法,从统计的角度讲是正确的。在无法获取全部数据时,一般情况下,较多的样本容量(样本数)可以得到较高精度的估值。但是,这有两个重要的前提:其一,要有科学合理的抽样规则;其二,样本本身要足够准确。否则,更多的样本数,意味着更多的样本误差,而更多样本误差累积,可能会使总误差超出可以接受的范围,最终导致错误的结论。实际上,历史人口数据很难做到这两点。因为所有的历史人口数据都是经过记录者和时间筛选之后的结果,研究者最终得到的样本数据都是不可控的。同时,几乎所有的历史人口数据,最初来源都是以收税为目的的保甲登记,这样的人口数据,一般都严重漏报未成年人、老人及女性等非纳税人口,并非实际的人口数。基于这些数据的研究,尤其需要谨慎处理。而过于主观随意的厅、县人口估计数,实际上缺乏真正实证的意义。
如何对曹先生的研究结论进行检验,是一个很有挑战性的工作。对于历史人口规模的估算,在大部分情况下,由于史料极其有限,研究的过程并不复杂。所使用的基本方法也比较有限,就是历史文献学的方法,即史料的人工判读和简单的数理统计。所以,如果没有新的研究手段或方法,仅使用原来的史料、按照原来的套路对现有研究数据进行重复检验,很难有新的发现,也很难证明其真伪。对于后来的研究者来讲,这种重复性的检验,既没有必要,也缺乏意义。在此,笔者使用人口重心模型,对曹树基先生给出的1820年《大清一统志》人口修正值和1910年新政人口修正值,分别进行检验。(www.daowen.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。