您的IP是113.233.223.189,欢迎访问中国社会科学年鉴数据库!
新中国人口学研究70年
人口统计学
人口
生育
预测
人口普查
调查
死亡
人口统计
死亡率
统计
中国人口
字体:大中小
第一节人口统计学概述
人口统计学又是一门交叉学科。人口的基础性、全局性和战略性决定了人口科学的发展,作为统计学的重要组成部分和定量社会科学研究的基础,人口统计方法越来越广泛地运用于经济、社会、文化、卫生、地理等学科领域中。与此同时,人口统计学的发展也得益于其他自然科学和社会科学的发展,现代人口统计方法吸收了数学、统计学、计算机科学、经济学、地理学、社会学、心理学、生物学等许多学科的研究成果,成为社会科学基础研究的重要组成部分。
按照研究内容与特点划分,人口统计学研究包括:(1)人口统计资料的收集,如人口普查、重大生命事件(出生、死亡等)的日常性登记、经常性人口统计、人口抽样调查、典型调查,以及其他人口统计资料的收集。(2)整理与分析人口现象和人口过程的统计特征,包括人口的规模、结构、分布等静态人口状况,以及出生、死亡、婚姻、迁移等动态人口过程。静态人口统计分析反映特定时点某一人口的规模、结构与分布状况的总量、比例、比率等统计特征。动态人口统计分析考察特定时期某一人口的变化规模与速度、模式特征等,其统计指标包括人口变动规模、率、概率等特征。根据研究内容与数据特征的不同,人口统计指标又可分为总量指标、相对指标与平均指标,以及时期指标与队列指标等。(3)估计与推算人口现象和过程、预测人口发展趋势。相应的人口统计方法包括标准化与因素分解技术、生命表技术、人口模型、间接估计与趋势预测技术等。
第二节人口统计学发展回顾
一人口统计数据的收集、整理及评估
人口统计数据的收集是人口统计学科建设的重要内容,也是开展人口统计分析工作、制定社会发展决策与规划的基础。第一次全国人口普查于1953年组织实施,是中国有史以来第一次使用现代科学方法在全国范围内进行的人口普查[※注]。此后,中国分别于1964年、1982年、1990年、2000年和2010年顺利开展全国人口普查。人口普查工作的开展,不仅为各时期中国一系列发展规划的制定、重大人口政策的出台与调整实施提供了系统科学的数据基础,也直接促进了统计实践经验的积累和人口统计学科的全面发展。历经几十年,中国已形成了常规的、与国际接轨的人口普查制度和普查办法;历次普查的结果也为大量社会调查和统计研究工作的开展提供了不可多得的抽样框,对统计数据的交叉检验和质量评估提供了依据,由此推动了多种类、不同主题的社会抽样调查繁荣发展。
(一)人口普查
随着普查工作的不断开展,其设计不断科学化,普查内容日益丰富,并实现与国际接轨,普查实施的过程控制和数据质量明显提高。毋庸讳言,人口普查已成为中国反映国情国力不可替代的统计活动。除此之外,全国人口普查数据也为大量人口与社会抽样调查提供了较为完备、准确的抽样框,对设计和开展抽样调查发挥了不可替代的支撑作用。随着普查数据的收集和整理,特别是第三次全国人口普查的实施,全国范围内开始出现大量的抽样调查,这些抽样调查作为人口统计数据的重要组成部分,为统计资料的积累、质量校验与评估、人口统计研究的繁荣贡献了重要的力量。
(二)全国1%人口抽样调查
除“小普查”外,自第三次全国人口普查起,国家统计局建立了年度人口变动情况抽样调查制度[※注]。每年进行一次的人口变动情况抽样调查旨在准确、及时地收集全国和各省(直辖市、自治区)的人口变动情况,从而为社会经济发展规划与人口管理提供决策依据。
(三)全国性人口专项抽样调查
1.生育调查
2.死亡调查
与生育相比,死亡事件相对较少,具有瞬时性和难以预期性;与文化和情感等方面的因素相联系,死亡事件的事后调查更有可能出现漏报等情况。因此,到目前为止,关于死亡的统计活动以常规性死亡登记为主。新中国成立以来,常规死亡登记主要由国家公安部门承担[※注],国家卫生部门则负责死因调查和统计工作。
3.迁移调查
人口的迁移流动是人口变动的重要组成部分,迁移流动直接影响人口的空间分布,进而对地区人口与社会经济发展规划产生重要的作用;除此之外,迁移流动也可能影响人口的其他变动特征,如婚育等人口现象。为此,人口迁移流动的抽样调查构成了人口统计活动的重要内容。
1986年,中国社会科学院人口所组织实施全国74城镇人口迁移抽样调查。这是新中国成立以来首次大规模的人口迁移调查,也是一次比较系统和完整的迁移调查。调查于1986年7月开始,在15个特大城市、6个大城市、12个中等城市、10个小城市和31个镇开展(共计74个城镇),调查样本包括2万余家庭户,涉及的人口数量超过10万人。这次调查填补了中国人口迁移数据的空白,为进行迁移规模和变动、迁移人口的构成、迁移与生育、城镇化和就业的关系提供了不可多得的统计数据资料。
除此之外,20世纪80年代以来人口统计学界也组织实施了大量区域性的人口迁移流动调查,例如北京、上海等大城市针对辖区内人口流动进行了较为频繁的调查,为区域人口统计、规划和管理提供了较为及时的数据资源。2010年以来,国家卫生计生委实施的全国流动人口卫生计生动态监测调查为全国人口迁移流动、生育等问题提供了重要的统计资源。
4.其他全国性的人口专项抽样调查
除上述人口变动要素的专项调查外,从20世纪80年代开始,中国人口统计活动也针对特定人群进行了一系列的专项抽样调查。
1990年,中国社会科学院人口所组织实施“当代中国妇女地位抽样调查”。调查采用分层分级不等概率抽样及二重抽样技术,在10个省(直辖市、自治区)抽样,收集了包括基本情况、文化状况、婚姻与婚姻质量、避孕与生育、就业、职业和收入、家庭生活状况与事务管理、性别规范在内的数据信息,成为新中国首次规模较大的关于妇女地位的调查。此外,全国妇联和国家统计局分别于1990年、2000年、2010年联合组织开展“第一次全国妇女社会地位调查”“第二次全国妇女社会地位调查”和“第三次全国妇女社会地位调查”。
1992年,国家统计局在全国范围内组织开展儿童基本情况抽样调查。此次调查抽取56万户家庭,调查的儿童数量接近70万人。调查的内容涵盖了儿童营养和生长状况、计划免疫、儿童出生、死亡状况、基础教育、青少年辍学和劳动参与情况、儿童生活的家庭环境和社会情况等,为全面了解儿童发展提供了重要的统计资料。
5.纵贯追踪人口抽样调查
(四)人口统计数据的质量评估与统计方案改进
张广宇和顾宝昌从国际视角考察人口普查中低龄儿童漏报问题,指出各国人口普查或多或少存在缺陷,低龄儿童的漏报具有普遍性,普查数据质量有赖于细致谨慎的事后评估,还介绍了澳大利亚、美国和加拿大的实践经验[※注]。齐嘉楠使用国家卫计委2014年开展的中国计划生育家庭发展追踪调查的平行数据,分析样本点级无应答发生情况,发现调查员的年龄、调查点发达程度以及居住环境对无应答次数有着重要影响,而调查员的性别、受教育程度等影响均不显著,泊松多水平回归具有良好的应用效果[※注]。
胡英对比普查数据分析了中国年度人口变动情况抽样调查的抽样误差[※注]。庄亚儿和李伯华对流动人口调查中抽样框的编制、重复抽选及抽选后合并、目标与抽样总体关系的复杂化等问题进行了描述和讨论[※注]。其提出编制抽样框时应注意偶然性因素的影响,也对重复抽选或抽选后合并和“事后加权”技术进行了讨论。庞丽华等通过对两次全国残疾人抽样调查资料和数据的分析,从登记质量、样本代表性和性别年龄数据准确性等角度对两次残疾人抽样调查的数据质量进行了评估[※注]。这些研究发现中国人口普查与抽样调查数据中存在着不同程度的数据质量问题。针对这些问题,有学者建议在实践中进一步改善抽样调查方法,结合定性调查与定量调查数据以深化人口统计研究[※注]。吕萍介绍复杂抽样设计和复杂调查数据的特征,对抽样信息在复杂抽样数据中的应用进行研究,并根据中国家庭追踪调查(CFPS)的抽样设计方案重新得到CFPS的误差层和误差群,说明抽样信息在复杂调查中的应用,提示在复杂抽样调查的数据分析中不能忽视对抽样信息的使用[※注]。
综上,关于人口统计数据质量评估的研究与统计活动相互促进,为后续人口普查和抽样调查设计的不断完善以及数据质量的提高贡献了知识和经验。2000年第五次全国人口普查首次使用长短表问卷、普查与抽样调查相结合的方法,其调查设计、数据整理、质量评估等发展与改进,无疑凝结了此前中国人口统计领域实践和研究的智慧[※注]。
二生育分析
生育是重要的人口再生产过程,也是决定人口变动的核心因素之一。任一时期,育龄妇女生育水平的高低、具体的生育模式与特征不仅影响当期人口变动,而且在很大程度上决定中长期的人口规模、结构与发展趋势。因此,在世界各国的人口统计研究中,关于生育的统计分析都占据了重要的位置。
同一年,新中国第一部人口学著作《新人口论》发表。这部著作中,著名的人口学、经济学家马寅初利用第一次全国人口普查数据和浙江等地的调研资料,分析了当时的人口生育状况。分析指出,1953年中国人口出生率高达37‰,远远高出人口死亡率(17‰),这也就意味着当时中国人口面临过快的增长速度(自然增长率20‰)。基于此,《新人口论》旗帜鲜明地提出控制生育的必要性,代表了当时学界和社会关于中国人口生育问题认识的一种重要观点。
尽管第一次全国人口普查提供了宝贵的人口统计资料,但由于其调查的项目有限,加之,同一时期其他类型的人口或生育调查几乎处于空白,1964年开展的第二次全国人口普查同样未收集具体的生育信息,这就决定了当时人口统计数据严重匮乏,无以支撑系统的、细致科学的生育统计分析[※注]。20世纪50年代末到70年代末,关于生育的统计研究成果很少。
直到20世纪80年代初,第三次全国人口普查的组织实施,人口统计学研究才真正意义上重新得以恢复和发展。随着改革开放和一系列人口科学研究机构的设立,人口统计工作作为国家进行人口与社会经济发展规划制定、政策评估的重要依据重新受到重视;生育统计分析也由此迎来了一个快速复兴和繁荣的新阶段。1982年全国第三次人口普查首次针对育龄妇女收集具体的生育信息,为开展系统的生育研究、了解全国育龄妇女的生育状况提供了重要的数据资源和契机。加之,同一时期国家统计部门和国际组织开展了一系列关于生育的专项调查,这些调查收集了大量丰富的生育数据,为进行生育统计分析和科学研究奠定了坚实的数据基础。与之相适应,20世纪80年代起,关于生育的统计分析成为人口统计学领域最为活跃、争论最为激烈的分支。
概括来说,这一时期关于生育的统计分析大致包括以下几类:对生育水平“真值”的估计,对生育模式及其长期变化趋势的探讨,生育指标、模型和统计方法的推介、改进和应用评估。
(一)生育水平估计
20世纪下半叶,中国育龄妇女的生育水平经历了快速的下降,其下降的动力既包括社会经济与人口发展互动作用,也在很大程度上反映了国家对生育控制的倡导和计划生育政策效应。中国各时期生育水平的统计结果表明,20世纪80年代中国育龄妇女的总和生育率总体保持在3以下,明显低于六七十年代的生育水平。据1982年全国1‰人口生育率抽样调查的估计结果,1981年中国育龄妇女的总和生育率为2.63,比1971年的5.44低一半以上。据国家统计局关于历次全国人口普查和大型抽样调查公布的统计结果,1990年全国育龄妇女总和生育率为2.04,1995年为1.46;此后2000年、2005年、2010年和2015年中国育龄妇女的总和生育率分别为1.22、1.33、1.18和1.047。概括而言,这些统计数据显示,中国育龄妇女的总和生育率自20世纪90年代起开始下降到更替水平(约2.1)以下;进入21世纪后,国家统计局的大型调查数据所统计的育龄妇女的总和生育率水平为1.05—1.4。
1.“真实”生育水平的讨论
陈卫和杨胜慧使用P/F方法,对2010年中国育龄妇女的总和生育率进行再估计,研究认为2010年总和生育率为1.66[※注]。陈卫和张玲玲利用国家统计局的人口普查和人口变动抽样调查数据,运用漏报估计、存活率推算等方法对2005—2013年的总和生育率进行再估计,估计结果认为中国近期的总和生育率水平不会低于1.5,很有可能在1.6左右[※注]。赵梦晗的研究也认为,2000—2010年中国育龄妇女总和生育率约为1.6[※注]。翟振武等基于户籍登记数据推断,2008年、2009年和2010年中国总和生育率应该至少在1.66、1.66和1.63以上[※注]。
李英和崔万里结合“五普”和“六普”数据,通过建立人口模拟模型对不同生育方案下两次普查之间各年份的人口总量进行拟合[※注]。该研究指出,由拟合结果来看,2000—2010年中国妇女的总和生育率在1.7以下,2010年在1.6以下。朱勤运用年龄移算方程和存活倒推法对2000—2010年生育水平进行模拟推算,结果表明,2000—2010年中国育龄妇女的总和生育率经历了由降到升再到稳中有降的过程,2000—2009年总和生育率均值为1.48[※注]。王广州和张丽萍利用1985年以来历次全国大型人口抽样调查数据,通过建立随机微观人口仿真模型对育龄妇女生育水平和生育潜力的变化范围进行了估计[※注]。该研究指出,2010年育龄妇女的时期总和生育率在1.44以内,超过1.64的可能性很小。该研究的仿真模拟结果同时显示,目前中国育龄妇女潜在的二孩生育比例不足50%,放开“单独二孩”政策不会引起很大的出生人口堆积。
尽管关于中国育龄妇女“真实”生育水平的争论持续了数十年且不曾间断,不过,到21世纪初,人口统计学界就总和生育率已低于更替水平达成共识。不少人口学者开始讨论过低生育率对人口持续健康发展的不利影响,包括人口快速老龄化、负增长惯性等。在这一背景下,生育政策的调整最终被提上日程。2013年年底,“单独二孩”政策在全国范围内开始启动;随后,“全面二孩”政策于2015年年底开始启动。实践表明,中国人口统计科学研究活动和学科的发展,是中国人口政策出台、实施和历时调整的重要科学基础和实践依据。
2.生育政策调整及潜在“出生堆积”的估计
随着生育政策的逐步调整,人口统计学界关于生育的研究重点开始转向对政策实施效果的评价,以及出生人口规模变动情况的预测。自2014年起,人口统计学家关于“新增出生人口”的估计和预测在生育统计研究中占据了主体地位。这些研究大多从受政策影响的育龄妇女的生育意愿出发,对政策调整可能产生的“出生堆积”效应进行了预测和估计[※注]。
翟振武等利用2005年全国1%人口抽样调查数据推算了2012年0—37岁独生子女数,结合子女—母亲年龄联合分布推导出受政策影响(只有一个孩子)的育龄妇女年龄结构[※注]。在此基础上,假设“全面二孩”政策目标人群的二胎生育意愿将在4年内全部释放,由此预测得出政策调整后的前4年内生育数量将依次上升到3540万、4995万、4025万和3540万,远高于政策调整前的水平(如2012年为1600万左右)。另一研究假定在“单独二孩”政策实行5年之后逐步启动全面放开二孩的政策,研究认为由于累积生育势能的释放,中国总和生育率的峰值将会突破更替水平[※注]。与翟振武等的预测结果相比,该研究认为,出生人口数量的峰值不会超过2100万,随后会迅速回落。
乔晓春结合“六普”数据和2013年8月国家卫生计生委组织的全国29个省(直辖市、自治区)(不包括西藏和新疆)生育意愿抽样调查数据,测算了“单独二孩”政策实施的最初4年内政策新增人口数[※注]。研究认为,政策调整带来的总和生育率的上升幅度每年不会超过0.3,且相应政策效应主要集中在前3年,第4年后影响基本很小。在其另一个研究中,乔晓春指出全国符合“单独二孩”政策的15—44岁有配偶女性人数为1117.7万,按照2013年生育意愿调查的结果估计,这些潜在受政策影响的人群中可能生育第2个孩子的总量为563.3万—755.6万,政策调整前3年新增的出生人口分别为326.2万—437.5万、154.3万—207.0万和82.8万—111.1万[※注]。类似地,罗淳等从生育意愿、生育行为和生育水平之间的差异出发,区分了“单独二孩”政策响应人群分为涉及人群、接收人群、践行人群和兑现人群[※注]。利用云南人口统计资料,该研究推算认为“单独二孩”政策的效应具有短期性,预计云南省因政策调整而新增的出生人口会在2016年达到峰值,之后将明显回落,并于2020年后回到政策调整前的水平,此后继续呈逐年缩减态势。
翟振武等使用分人群分要素回推预测方法,测算从2016年开始全面放开二孩生育将会形成的目标人群以及由此产生的新增出生人口[※注]。在中方案下,2017—2021年将会累计新增出生人口1719.5万,年度新增出生人口数量为160万—470万。研究认为,虽然“全面二孩”政策目标人群规模十分庞大,但其新增出生人口数量却相对有限,中国能够平稳有序地度过“全面二孩”政策累积生育势能的释放期,这与作者之前的研究结论相比有了较大的修正[※注]。此外,全国各地也相继出现关于省级单位的研究[※注]。
除上述利用人口统计模型或模拟技术进行的估算外,随着政策的实施,二孩申请登记的行政数据为评估政策调整效应提供了新的可能。刘鸿雁和黄匡时汇总分析了全国“单独二孩”登记申请情况,汇总结果显示截至2014年年底有106.7万对“单独”夫妇提出二孩申请,2014年下半年全国申请数为68.33万对,2015年上半年为46.34万对[※注]。这些数据为不同估计结果的核对检验和统计反思提供了契机。2017年,国家统计局调查数据显示全国年度出生人口总数为1723万,比2016年(1786万)减少了63万,远低于国家卫计委关于政策调整效应的预期(出生人口在2100万以上)。这些人口统计和分析结果一方面回应了政策调整带来的生育水平变化幅度的争论,另一方面也开启了关于“政策遇冷”的讨论和新的生育研究热点。
3.“低生育率陷阱”与生育意愿的估计
关于中国生育水平的统计研究经过数十年的分析、检验、修正和再检验,人口统计学界已达成一个基本共识,即20世纪末以来中国育龄妇女的总和生育率已下降到更替水平以下;2013年年底开始生育政策的逐步调整并未从根本上改变生育率低于更替水平的现实。由此,中国是否陷入“低生育率陷阱”成为不少人口统计学者分析和论证的重要议题。随着“单独二孩”和“全面二孩”政策的逐步推行,政策调整的效应不断明朗;在这一背景下,关于“出生堆积”的争论落下帷幕,与之相对,关于“低生育率陷阱”的讨论和生育意愿的估计在生育统计研究中不断升温。
李龙和翟振武通过分析城市“单独”育龄妇女平均理想子女数(1.8),认为二孩生育意愿并不低迷[※注]。陈卫基于全国人口普查数据中的年龄分布,利用广义稳定人口模型估计了中国近4次人口普查期间的总和生育率,估计得出1982—1990年、1990—2000年和2000—2010年总和生育率均值分别为2.65、1.68和1.56[※注]。在另一研究中,陈卫认为目前“全面二孩”政策的效果可能是有限的,但从生育水平和趋势来看,“低生育率陷阱”的判断还缺乏说服力[※注]。
王广州等研究指出,长期低生育率已是不争的事实,由此带来的人口负惯性和育龄妇女生育意愿的持续低迷意味着,未来中国的生育率水平有进一步下降的可能[※注]。利用计算机仿真模拟,王广州研究认为,“全面二孩”政策不足以跨越“低生育率陷阱”[※注]。类似地,王军和贾晓菲分析指出,即使实现生育自主,中国生育水平仍面临较大的“低生育率陷阱”风险;该研究警示应对“低生育率陷阱”的地域发展特征予以重视,指出目前中国东北地区的总和生育率基本与上海、北京持平,已成为全国范围内人口生育率最低的地区[※注]。
(二)生育模式的估计
中国生育水平的快速下降,不仅引发了大量关于“真实”生育水平的估计和讨论,也激发了人口学界关于生育水平所隐含的生育模式及其变化规律的深入探讨,这些研究为全面深入地理解时期生育水平的影响机制、预测其变化趋势和长期人口效应提供了重要的视角。这些研究从育龄妇女的年龄结构、婚姻状态与结婚年龄、生育进度和数量等角度出发,运用标准化、因素分解和间接估计等技术,探讨了生育模式的突出特征及其对生育水平和人口变动趋势的影响。
郭志刚通过比较2015年全国1%人口抽样调查数据和以往人口调查数据,研究指出,近年来中国育龄妇女总和生育率的下降主要体现为一孩总和生育率的下降;这一降低具有全面性,晚婚是导致其下降的重要原因[※注]。20世纪90年代以来,中国一孩生育率持续下降,生育旺盛期的育龄妇女未婚比例显著提高,这些特征是决定中国生育率持续处于低水平的重要因素。基于此,该研究强调,提高一孩生育水平是现阶段应对中国生育率过低问题的重中之重。张翠玲等对生育政策调整后山东省二孩生育率的研究同样指出,尽管考察期间山东省二孩生育率强势反弹,但由于一孩生育率的大幅下降,导致政策调整对于提升时期总和生育率的实际效应在相当程度上被抵消,一孩生育率的下降成为制约生育水平回升的重要原因[※注]。
(三)生育分析技术的发展:指标与模型
1.生育统计指标:总和生育率及其他
总和生育率是国际通用的测量生育水平的统计指标。总和生育率指标基于育龄妇女在生殖周期内的生育事件进行计算,反映其按照一定的年龄别生育率度过一生平均生育的子女数。该指标不受育龄妇女年龄结构的影响,其计算过程既可以基于给定队列妇女的真实(完整)生育史,以此反映相应队列妇女的平均终身生育水平;也可能基于特定时期育龄阶段各年龄妇女的生育事件计算,用以反映时期生育水平,即假想队列的妇女按照相应时期的年龄别生育水平度过一生平均所生育的子女数。为便于区别,前者往往被称作队列总和生育率,后者称为时期总和生育率。由于队列总和生育率的计算需要妇女的完整生育史,这样计算的结果时效性较低,因而,在实际应用中,不少人口统计学研究使用时期总和生育率来反映时期的生育水平。
时期总和生育率指标是标准化的生育指标,不受育龄妇女年龄结构的影响。不过,该指标受潜在生育水平、生育模式及其他人口结构特征的影响,存在相对明显的短期内波动,对于小规模的人口尤为如此。为此,了解时期总和生育率水平波动的原因、分解该指标的构成、探讨其背后“隐含”的实际生育水平的高低,成为人口统计学研究的重要内容之一。除此之外,人口学者也对比了总和生育率与其他生育统计指标之间的关系。
20世纪90年代,路磊探讨了总人口与构成该人口的不同分人口中总和生育率之间的对比关系[※注]。研究指出,总人口的总和生育率不仅与各分人口的总和生育率有关,而且因该人口的标准生育模式以及相对年龄分布而异。该研究强调了人口统计分析的标准化技术在比较研究中的重要性。
2.生育模型和间接估计技术
生育模型是对生育行为内在规律的提炼和总结,其发展过程反映了人口统计学对于生育现象的认识在不断提升。生育模型的提出,不仅有助于简化对复杂现实的认识,而且为利用少量的甚至是残缺的统计数据进行估计和预测提供了方法支持。
(四)小结
回顾过去70年的发展历程,中国生育统计的技术、研究内容和研究成果均经历了一个不断丰富和成熟的过程。由早期相对单一的生育水平估计,到生育水平和生育模式的综合考察,多种统计分析手段和技术的应用对分析结果的交叉检验提供了丰富的信息。这一过程中,尽管生育统计的研究争论不断,但这些统计活动和分析成果无疑为准确把握和预测中国生育状况及人口变化规律提供了重要的依据。
三死亡
(一)死亡统计指标与方法的阐释
1.平均预期寿命
关于平均预期寿命的含义及统计规律,人口统计学界进行了重要的科学探讨。乔晓春分析了不同年龄的死亡率对平均预期寿命的影响,论证了低龄组死亡率的波动对平均预期寿命影响更大的结论[※注]。人口统计学指出,一般而言,就同一人口来说,较低年龄的平均预期寿命高于较高年龄的平均预期寿命。不过死亡统计研究也发现,当婴儿死亡率过高时会出现平均预期寿命的矛盾现象,即0岁预期寿命低于1岁预期寿命。围绕这一现象,20世纪80年代一些人口统计学者进行了理论分析和统计推导[※注]。这些研究为正确认识、使用和分析死亡统计指标提供了方法论指导。
2.其他死亡指标以及生命表的编制
平均预期寿命在死亡统计中占据核心重要的位置,不过,该指标的计算是以生命表技术为基础的。作为人口统计学的独特的、核心的工具之一,生命表技术包含了重要的死亡统计概念和指标,如死亡分布系数、各年龄尚存人数函数、人年数等。这些指标的含义和估计方法,对于正确理解和使用生命表技术极为关键。
黄荣清针对生命表中尚存人数函数I(x)与各年龄组平均人数L(x)的计算方法提出了改进的近似估计方法,以提高平均预期寿命计算结果的准确性[※注]。路磊讨论了生命表中死亡分布系数a的概念与几何意义,研究指出,死亡分布系数的选择对计算各年龄的平均预期寿命影响不大,其计算结果相对稳健;不过,人口预测的准确性在很大程度上与死亡分布系数的选择有关,不同的死亡分布系数可能带来较大的差异[※注]。翟振武对比了死亡分布系数a值的不同计算方法,包括简单平均法、寇尔方法、联合国方法等,在此基础上提出了一种改进的迭代计算方法[※注]。黄荣清讨论了a值的意义与一般特征,指出a值的大小依赖于生命表中死亡人数的变化特征[※注]。
(二)死亡率的估计:特征、差异与变化趋势
各时期关于死亡的统计活动和分析,以死亡率水平的估计最为常见。其部分原因在于,与其他死亡统计指标相比,死亡率的估计所需要的基础数据较少、相对易得。对任一人口而言,各年龄的死亡率差异巨大,因而,除粗死亡率指标外,人口统计学关于死亡率的估计更多地使用不同年龄或年龄段的人口死亡率,如婴儿死亡率、5岁以下儿童死亡率、育龄妇女死亡率、老年死亡率等。通常这些年龄段的死亡率水平相对较高,能够反映人口中较为突出的死亡风险水平。
黄维海和袁连生通过分析1990—2010年人口死亡率,发现中国各地区的人口死亡率呈下降趋势,不过,死亡率水平存在明显的地区差异,且各地区人口死亡率下降的速度也并不相同[※注]。成年男女死亡率的地区差异在客观上与生育率、育龄妇女死亡率的地区差异及其历时变化有关。丁海峰等对中国大陆地区2004—2010年孕产妇死亡率的地区差异进行了分析,研究发现,考察期间孕产妇死亡率逐年快速下降,6年间下降超过一半,年均下降3.25/10万;不过,不容忽视的是,现阶段各地区孕产妇死亡率的差异仍很显著[※注]。类似的,李树生和田阳霞的研究同样揭示了人口死亡率的地区差异[※注]。
魏本胜等应用地理信息系统(GIS)技术构建了上海市死亡人口空间数据库,对上海市死亡病例的时空特征进行分析[※注]。研究发现2003年上海市户籍人口总体死亡人数的空间分布呈现市区高于郊区的分布特正,心血管类疾病的死亡率分布特征与之相类似,但呼吸类疾病的死亡率分布特征却与之相反。郝君富和王亚柯从环境污染角度出发考察人口死亡率顺经济周期波动的原因,研究发现,死亡率回归方程加入环境变量后,人口死亡率的顺经济周期波动现象有所减弱,甚至变成逆经济周期波动,该研究推断,环境污染是人口死亡率顺经济周期波动的重要原因[※注]。
王记文利用1981年、1989年、2000年、2010年、2015年的分年龄死亡率数据对中国20世纪80年代以来的死亡率和平均预期寿命进行了分析[※注]。认为中国死亡率在2000年之后下降较快,20世纪八九十年代下降较慢,生存曲线呈现出矩形化的特征;作为死亡率下降和存活曲线矩形化的结果,中国人口的平均预期寿命也在逐渐延长,生命表的矛盾现象在2010年消失。
此外,宋健和周宇香利用“六普”统计的婴儿死亡率以及2000年和2010年育龄妇女平均生育年龄、平均结婚年龄指标,预测了中国父母丧子的年龄概率分布[※注]。研究认为,中国父母需要面临10%左右的丧子风险,丧子概率高于丧女概率,并且丧子的年龄也高于丧女年龄;丧子概率的年龄分布大致呈“L”形——初育第一年失去孩子的概率远高于其他时期,父亲80岁、母亲85岁时略有升高随后又趋于下降;父亲失去孩子的概率略低于母亲。
1.死亡率的估计技术
囿于数据资料的匮乏,从20世纪80年代开始有不少死亡统计分析着眼于引进不同的间接估计技术、探讨其适用性并尝试不同的改进方案。这些研究为死亡统计方法的发展以及死亡统计结果的积累做出了重要的贡献。
在众多的死亡率估计技术中,模型生命表技术是死亡估计的最为常用的方法,该方法基于人类死亡数据的经验规律,将不同人口的死亡模式进行归纳总结,以少量的参数和有限的模型生命表来近似估计不同人口的生命表特征。模型生命表的提出和推广应用,为死亡数据缺失、数据质量较差的国家和地区估计人口死亡状况提供了高效的解决办法。秦芳芳介绍了模型生命表的种类、编制原则及其用途[※注]。李希如在既有单变量模型生命表模型的基础上,介绍了一种新的单参数数学模型,结合中国城乡死亡模式编制了城乡模型生命表,拓展了模型生命表技术在中国死亡统计研究中的应用[※注]。蒋正华利用“三普”数据及一些历史死亡资料,编制了中国分区模型生命表,为中国后续死亡指标的间接估计奠定了重要基础[※注]。路磊在分析既有的Coale-Demeny模型生命表与联合国针对发展中国家编制的模型生命表的特点及其适用性的基础上,介绍了一种新的根据死亡水平与死亡模式估计生命表的方法,以提高模型生命表的适用范围与灵活性,方便完全生命表的编制[※注]。
除模型生命表技术外,人口统计学界也有不少针对特定死亡率提出的估计技术。罗茂初介绍了国外人口统计学界关于婴儿死亡率的估计方法,着重对比了布拉斯(Brass)提出的logit方法和费尼(Feeney)的间接估计技术在婴儿死亡率估计中的应用[※注]。王绍鑫应用Feeney估计方法估算了贵州省1955—1978年的婴儿死亡率,为死亡研究补充了重要的数据信息[※注]。黄荣清提出以I(x)的双对数函数连接的死亡关系模型,并将其与Brass的logit模型进行了对比[※注]。研究认为,在预期寿命较低的情况下,logit体系精度相对较高,而在预期寿命较高的情况下,双对数模型精度相对较高。婴幼儿期死亡率的拟合,logit模型误差较小,而老年期的拟合结果则以双对数模型更优。在其后续研究中,黄荣清构造了两种新的死亡模型,改进了人口死亡间接估计模型[※注];针对Gompertz提出的全年龄死亡模型,讨论了其构建的技术细节、拟合优度和参数要求,并在此基础上尝试了改进的方法[※注]。
张文娟和魏蒙以1981年的中国人口生命表为标准生命表,使用Brass方法对“六普”数据中的死亡模式进行修正[※注]。该研究测算了中国2010年的人口预期寿命,并对20世纪80年代以来人口死亡率的变化趋势以及性别模式进行分析。研究认为,“六普”数据中婴幼儿和老年人口存在严重的死亡漏报,男性老人死亡率下降缓慢,女婴死亡率偏高的问题依旧存在。陈卫用广义稳定人口模型推导出存活概率与人口结构的关系,用Brass-logit变换得到各年生命表中死亡概率与存活概率之比与标准生命表该参数的线性关系,二者联立得到线性回归方程,使用最近四次普查数据得到各普查年间的生育和死亡水平估计[※注]。
除人口统计学的死亡间接估计技术外,也有不少研究将一般的统计学原理与方法应用于死亡统计研究。安洪庆等利用ARIMA模型对中国1991—2009年新生儿死亡率进行拟合分析,研究认为该模型对新生儿死亡率的拟合结果误差较小,可用于外推预测[※注]。黄荣清将贝叶斯估计方法应用于死亡率估计,介绍了该方法在抽样调查数据估计人口死亡率中的应用,估计了1995年中国各省(直辖市、自治区)分性别、年龄别的死亡率和人口预期寿命[※注]。张连增和段白鸽利用广义线性模型中的泊松回归模型、负二项回归模型对0—89岁的死亡率进行拟合,并对两种模型的拟合效果进行了比较[※注]。研究认为,负二项回归模型对死亡率的修匀拟合效果优于泊松回归模型;结合中国分年龄、分性别死亡率的变化规律,该研究论证了基于广义线性模型的动态死亡率修匀方法的适用性。
2.死亡数据的质量评估与修正
黄润龙介绍了不同的死亡率调整方法,包括Brass提出的平衡方程法、Preston与Hill提出的两次普查间生存率调整法、非稳定人口生存率调整法、死亡率登记完整性估计与调整方法等[※注]。翟振武回顾了偏低婴儿死亡率的调整方法,包括删除低质量数据法、调整漏报率法、模型生命表法以及人口回测法(迭代法)等[※注]。李荣敏等提出了一种改进整体参数修匀法,改进了粗死亡率修匀的方法,克服了因数据缺陷而造成的局部死亡率波动现象[※注]。
符文华等介绍了捕获—再捕获方法在人口统计分析中的应用,并以此估计了5岁以下儿童死亡漏报率与死亡率,实践表明其估计结果更接近真值[※注]。与之类似,张书岭等应用捕获—再捕获方法评估死因登记报告系统中死亡统计的数据质量,结合汶上县的全死因登记结果,该研究评估结果显示,使用死因登记报告系统或合并样本资料均会低估全死因死亡率,这一低估问题可以通过使用捕获—再捕获方法得以校正[※注]。张荣艳等利用灰色预测理论,通过建立残差灰色预测模型对2012—2020年中国人口老龄化状况进行了预测[※注]。黄维海和袁连生介绍了基于计量模型预测非普查年份死亡人口特征的方法[※注]。陈威杰和吕盛鸽依据生命表理论,利用联合国平均预期寿命增长模型和年龄移算法对四川省老年人口的变化趋势进行了预测[※注]。孙佳美和郭利涛探讨了Coale-Kisker模型在拟合高龄人口死亡率中的应用,基于经验分析,该研究提出了改进该模型的办法[※注]。该研究认为,在数据质量较为可靠、85岁以上人口的死亡率数据已知的情况下,改进的Coale-Kisker模型拟合效果明显更优。
李成等对“六普”死亡统计数据的评估指出,2010年中国男女两性的婴儿死亡率分别为16.41‰和15.94‰,相应的漏报水平为77.3%和75.5%;老龄死亡概率(60—89岁)男性为0.703、女性为0.595,相应的漏报水平为2.3%和7.0%[※注]。
3.死亡率预测模型:Lee-Carter模型及其改进
吴晓坤和王晓军用泊松最大似然估计方法,使用1994—2010年中国分年龄、分性别单岁组死亡数据,建立中国人口死亡率Lee-Carter模型,并在泊松最大似然估计方法的基础上使用泊松再抽样,对参数模型进行再估计,从而对预测变量进行再抽样预测[※注]。对预期寿命再抽样结果的置信区间完全包含了非再抽样方法,认为泊松再抽样方法所能预见的不确定性超过了非再抽样方法。
张志强和叶崴针对Lee-Carter模型的各种改进方法中同方差假设仍然难以满足的问题,认为这是由于不同年龄组之间过渡所产生的“亦此亦彼”性,即模糊性;为此,该研究建议使用模糊模型,把Lee-Carter模型的3个参数均用模糊集来刻画,提出了死亡率模糊模型的参数估计方法[※注]。对台湾人口死亡率数据的估计显示死亡率模糊模型预测效果优于Lee-Carter模型。
(四)死亡统计的其他维度
1.死亡率下降的理论极限
张震利用中国人口普查资料以及世界人口死亡率和经济发展数据,使用寿命损失指标来考察20世纪50年代以来中国人口寿命不均等的变化历程,并对之进行历史纵向和国际横向比较[※注]。研究发现,在过去半个多世纪中,中国不仅实现预期寿命的持续增长和寿命不均等的大幅下降,并且能在相同的收入水平上把寿命不均等降到全球极低的水平。李婷使用的生命力模型将死亡率分解为内生的“生命力”过程和外生死亡过程,如果外生冲击大于某时点生命力则发生死亡,以此将期望寿命分解为内生预期寿命及其外生损失[※注]。通过分析性别差异、城乡差异并与日本进行比较,研究认为,未来中国预期寿命增长将逐渐转变为以内生因素提高为主的模式。
2.死亡研究中的健康维度
林汉生介绍了模型生命表技术在老龄与健康研究中的应用[※注]。顾大男等介绍了不同的健康预期寿命的计算方法[※注]。李强和汤哲讨论了多状态生命表法在老年人健康预期寿命研究中的应用[※注]。顾大男利用中国高龄老人健康与长寿纵向调查数据,运用多元惠普尔风险回归与曾—顾—兰德改进的多状态生命表方法研究了中国高龄老人生活自理能力预期寿命[※注]。曾毅等在传统多状态生命表中考虑了临终前的自理能力(失能)状况,使得健康预期寿命的估算能够体现更广泛的健康内涵[※注]。李成福等采用健康预期寿命年均增加法、健康预期寿命和预期寿命差值法,对中国2020年及2030年健康预期寿命进行推测,研究结论强调了健康预期寿命的重要意义,建议将健康预期寿命的发展纳入中国2030经济社会发展规划指标,建立中国健康预期寿命的监测指标体系[※注]。
焦开山利用追踪调查数据考察了老年人健康预期寿命的差异,以及其随队列和年龄的变化趋势[※注]。研究发现,较高社会经济地位的老人在健康预期寿命上并不具有显著优势,尽管其预期寿命具有优势;后者主要是由于发生残障后相对较低的死亡率导致。卢敏和彭希哲基于近年来国际人口统计学界讨论的期望余寿,提出如果按照期望余寿15年作为老年的定义标准,老年起点将随着人口预期寿命的持续提高而动态变化,将从2015—2020年的61.5岁提升至21世纪中叶的近70岁;由此估算的老年人口比重的上升幅度和速度明显较低[※注]。
在死亡风险和死因方面,杨磊和王延涛用多种健康指标综合构建中国老年人虚弱指数,并建立增长曲线模型分析了虚弱指数及其队列差异,用Cox比例风险函数分析了死亡风险[※注]。李涌平和韩丽媛从流行病学的疾病谱转变视角来研究中国的死亡水平和死因构成,认为中国死亡率下降符合流行病学中的欧曼转变模式,分疾病类型的死亡水平显示,城市心脑血管疾病和恶性肿瘤影响最大,农村则还包括伤害和中毒[※注]。此外,王磊使用中国多世代人口数据库(双城)的死亡事件,采用事件史分析方法检验了晚清时期婚姻对死亡的保护作用[※注]。王伟进和陆杰华发现婚姻状况和子女居住远近对男性高龄老人有保护性作用,但对女性老年人影响不显著[※注]。邱红等使用2016年吉林省死因监测数据分析了主要疾病对预期寿命的影响[※注]。结果指出,前10位死因的死亡比例占98.94%,前4位死因的死亡人数占总死亡人数的90.9%,影响较大的疾病包括循环系统疾病、肿瘤、呼吸系统疾病、消化系统疾病、内分泌系统疾病等。
(五)小结
过去70年来,中国人口死亡率总体上经历了快速的下降,人口平均预期寿命持续增长。这一过程与世界范围内死亡率下降的一般规律相吻合,反映了社会经济发展和疾病谱转变对生存状况和死亡风险的影响。在死亡率下降的一般过程中,不同年龄、不同性别的死亡风险下降先后有别,速度不尽相同,由此形成了死亡率差异和死亡模式的动态变化。与这些特征相联系,过去70年来,中国关于死亡的统计由相对单一的死亡水平估计,到死亡模式及其动态变化规律的考察,总体上经历了一个不断深入和完善的发展过程。在这一过程中,死亡统计分析的技术和工具不断完善,其中既包括国内学者自主提出的统计方法,也包括从国外引进并不断改进的技术手段。随着学界对经典问题的研究向纵深推进,关于死亡的统计成果从对总体趋势的把握逐步转向精耕细作。这些成果推进了对中国人口死亡状况以及人类生命及死亡规律的一般认识。
除此之外,关于死亡的统计活动和研究开始呈现学科交叉的特点,如精算学、流行病学等,这些研究为人口统计学完善死亡统计的研究思路和方法提供了借鉴与拓展。不过,由于其中一些跨学科的研究对人口发展机理把握不足,研究中出现了一些错误和偏差的结论,由此也引发了关于死亡统计原理和方法的学术探讨,客观上推动了学科的发展。
四婚姻分析
(一)人口婚姻状态
婚姻状态是人口统计学所要研究的重要现象之一,源于婚姻事件,如结婚、离婚、丧偶和再婚等,婚姻状态直接影响妇女生育率和人口出生率、人口迁移,以及妇女的就业等。
1.基本婚姻状况
基于全国人口普查和人口抽样调查数据信息,人口基本婚姻状况主要从未婚、有配偶、离异、丧偶四个方面进行分析。
1982年、1990年、2000年、2010年4次全国人口普查,以及1995年、2005年、2015年全国1%人口抽样调查得到相应时期15岁及以上人口的婚姻状况。总体上,自第三次全国人口普查至2005年,15岁及以上人口中未婚人口所占比重呈下降趋势,2005年后该群体比重有所上升;有配偶人口所占比重呈稳定上升状态,比重均在70%左右;丧偶人群比重稍有降低,而离婚人口比重呈明显的上升趋势[※注]。
具体地,未婚人口比重呈下降趋势。第三次全国人口普查数据中,中国15岁及以上人口中未婚人口为1.9亿,占15岁及以上人口的28.57%,近90%是25岁以下青年,30岁以上的大龄青年和40岁以上的中年未婚者所占比重很小,50岁以上的终身不婚者为1.86%,女性只有0.25%[※注]。1990年未婚人群比例有所降低,男性15岁及以上人口中未婚比重为23.61%,与女性相比高出7.27个百分点[※注]。大龄未婚人口总规模较大,但相应未婚人口在各队列中所占比重很低;男性大龄未婚的风险明显高于女性,且各地区及城乡间相应比率也存在明显差异[※注]。
从历次人口普查、人口抽样调查来看,15岁及以上人口中有配偶人口所占比例相对较为稳定,均保持在70%左右。1982年第三次全国人口普查中中国女性的婚配率比男性高,完婚速度比男性快。20岁的女性中约27.4%有配偶,同龄男性的有偶率为6.54%;22岁的女性中一半以上的人有了配偶,同龄男性的有偶率为23.67%;25岁的女性有偶率已达到87.62%,同龄男性为61.13%;到30岁左右女性的婚姻活动已基本结束,此时有偶率达到98.00%,而同龄男性的婚配活动一直到35岁以后,有偶率最高达到90.83%,可以看出全国第三次人口普查时期中国女性的婚配率比男性高近8%,完婚年龄比男性提前5岁左右[※注]。2000年后,有配偶比重保持在70%以上。在广东省这一人口流入大省,流动人口的婚姻状况发生了重要变化,未婚人口所占比例不断下降,其中女性尤为明显;近年来,男性未婚比例开始超过女性,但已婚有偶和离婚的比例则开始低于女性,流动人口的婚姻状况开始与本地人口趋同[※注]。
总体来看,新中国成立以来,中国15岁及以上人口中有配偶者占主体地位,未婚人群比例有所增大,离异人口比例上升,婚姻稳定性降低。
2.结婚率与离婚率
婚姻状况按照个体是否结婚可以划分为未婚和已婚两大类,其中已婚又分为初婚和再婚两类。结婚意味着建立了家庭,进而生育子女。在一定时期内,结婚的人越多,生育量越大。结婚率是一定时期内的结婚人数和同时期的年平均人口数(或年中人数)之比,通常用千分比表示。
新中国成立前,受传统儒家文化的影响,育龄妇女普遍结婚,且主要为早婚。新中国成立后,1950年《中华人民共和国婚姻法》(以下简称《婚姻法》)颁布,废除了包办、强迫、买卖、童养、重婚、纳妾等封建婚姻制度,15—19岁组育龄妇女的初婚率不断下降;20世纪70年代开始计划生育政策的实施使得初婚年龄进一步提高,15—19岁育龄妇女的初婚率进一步下降[※注]。国家统计局公布的数据显示,1978—1982年中国内地居民粗结婚率总体上呈上升趋势,但不同时期又有明显波动,具体地:1978—1982年粗结婚率逐年上升,1982年达到峰值,约为10.4‰,这可能源于20世纪80年代初期新修订《婚姻法》的颁布使得之前数个可婚队列进入结婚者行列,使中国出现了一次结婚潮;1984—2000年各年份粗结婚率均在8‰左右,2001—2005年粗结婚率为6‰—7‰;2006年开始粗结婚率显著增高,2013年约为10‰;2014年开始又有所降低[※注]。
近年来学者也就离婚人口的特征以及离婚率变化趋势进行了分析。在中国西南地区,1990—2010年离婚率除少数县域上升外,总体呈下降趋势,但离婚性别比总体偏高,且呈上升趋势;受此影响,离婚男性存在较为严重的婚姻挤压[※注]。2005年和2010年北京市离婚登记数据表明,人口年龄、性别结构和年龄别离婚率变动对粗离婚率攀升均有贡献,2010年北京市粗离婚率较2005年上升了0.23个千分点,其中,人口年龄结构变动对粗离婚率上升的贡献率为31%,年龄别离婚率变动的贡献率为69%[※注]。2005年全国1%人口抽样调查数据和2010—2014年家庭追踪调查数据分析表明,性别认同会导致结婚率下降和初婚年龄推迟;背离性别认同的家庭离婚概率随妻子相对收入上升而显著增加[※注]。
总体上,自改革开放以来,粗结婚率在20世纪80年代至2005年均处于7%左右,但存在波动;2006年后有所上升,近5年来有所降低;中国粗离婚率呈逐年上升趋势。
3.初婚年龄
结婚是生育的前提,研究初婚年龄,特别是妇女的初婚年龄的变化对于生育的影响具有重大意义。
进入20世纪90年代后,中国女性人口的平均初婚年龄总体呈上升趋势。1990年、1991年女性初婚年龄尚低于22.5岁;1992年后持续上升,至2001年已提高至24岁。
4.婚姻模式
婚姻模式是婚姻研究的重要议题。婚姻模式的变迁不仅直接影响个体及家庭生活状态,而且对人口构成和人口增长具有重要影响。学者们对婚姻模式的研究主要集中于婚姻匹配和通婚圈两个方面。
从夫妇婚姻匹配看,1970—1990年的夫妇平均初婚年龄差为1.7—2.7岁[※注],夫妇年龄差在夫小于妻1岁到夫大于妻4岁之间最为集中[※注]。陕西农村“夫大妻小”仍是主流婚配模式,平均夫妻年龄差逐渐接近2岁;通婚圈呈扩大趋势,西部农村的初婚模式虽大多保留传统特征,但随着时代的变迁也呈现出新的变化[※注]。四川省晚婚趋势更为明显,婚姻稳定性下降;婚姻同质性趋势明显,婚姻双方教育同类匹配程度高、教育梯度匹配性强[※注]。
总体上,中国夫妇一致延续着男大女小的年龄匹配模式,且夫妇年龄差呈扩大趋势;人口的迁移流动使得通婚圈扩大,婚姻的同质性趋势明显。
(二)人口婚姻状态模型研究
曾毅应用多增—减生命表,利用模型或间接估计的方法估算年离别离婚率与再婚率,构造了中国妇女1950—1970年与1981年婚姻状态生命表,发现99.5%以上的妇女在35岁以前已经结婚;婚龄的提高与死亡率的降低影响了不同年龄婚姻状态的分布[※注]。1988年,曾毅又利用家庭状态生命表模型,分析了中国人口的婚姻、生育、死亡等要素的巨大变动对妇女家庭状态的影响,给出了1950—1970年与1981年水平下,妇女处于“上有老”“下有小”的“超负荷”状态的年数[※注]。
同一时期,屈锡华从未婚分布入手,构造未婚比曲线,考虑未婚及婚恋不确定性,建立未婚与初婚年龄分布的Fuzzy数学模型,并以全国1982年1‰人口生育抽样调查资料34—35岁组的未婚年龄分布为拟合对象,确定拟合曲线,并给出全国1982年1‰人口生育率抽样调查育龄妇女婚姻年龄参数估计及未婚年龄分布[※注]。
蒋耒文等应用曾毅“家庭状态生命表模型”,分析湖南省妇女的婚姻、家庭状态,发现1988年湖南省不同年龄别妇女中早婚现象严重,终身不婚率低,总和离婚率低,家庭稳定性高[※注]。
韦艳等利用“三普”至“六普”数据资料,采用净婚姻表的分析方法构建了1981—2010年男性和女性初婚表,通过初婚概率、未婚人口比例、终身结婚期待率和预期未婚寿命等关键指标,系统地分析和探讨中国初婚模式的变动及性别差异。研究结果表明,虽然初婚概率下降和峰值年龄有所推迟,男女未婚比例均保持较低水平,中国仍然属于普婚型社会;中国初婚模式的变动存在显著的性别差异,男性未婚水平较高的情况一直存在,而女性近年来初婚水平下降非常明显,初婚模式的性别差异正在逐渐缩小;中国初婚模式正处在转型中,其变迁与西方模式和亚洲模式既有相同之处,也存在差异[※注]。
以上可看出,新中国成立以来中国人口的婚姻状况发生了巨大变化,虽然一些学者开发了婚姻状态模型,为家庭婚姻状态的预测提供了方法与工具,但婚姻状态预测模型的发展与应用研究相对较少。适应于婚姻家庭的变迁,这方面研究还有待于加强。
(三)婚姻挤压的分析与预测
婚姻挤压是婚姻匹配不平衡的直接结果。受长期重男轻女观念及其在生育行为中的男孩偏好影响,中国人口的性别失衡,其直接导致中国未来出现婚姻挤压现象。婚姻挤压是婚姻市场性别失衡的一种表现,如果婚姻市场中可供选择的男性和可供选择的女性之间比例失调会导致部分男性或者部分女性不能按照传统的偏好选择配偶,这一现象即为婚姻挤压。中国强烈的男孩偏好和女性低下的社会地位导致了对女孩的歧视,在人口学上表现为偏高的女孩死亡水平和出生性别比,从而使婚姻市场上男性过剩,产生了男性的婚姻挤压[※注]。
现有研究对婚姻挤压规模的估算主要采用以下三种测度方法:一是同龄性别比法,假设男性或女性只与同龄的异性婚配,夫妇年龄差为0,同龄男性和女性之间的数量差异被视为婚姻市场过剩人口;二是相对性别比法,假定男性与年龄差相差几岁的女性结婚,两者数量上的差异被视为婚姻市场过剩人口;三是婚配性别比法,按照一定的婚配模式所确定的年龄差为标准,将某年龄组的男性与期望可结婚的女性进行匹配,其人数之间的差值即为婚姻市场过剩人口。出生性别比、死亡率性别差异、人口迁移、夫妇年龄差偏好、年龄结构变动、再婚、历史婚姻拥挤的传递和个人性格相貌与社会经济条件等均会对婚姻挤压产生影响[※注]。
不同学者利用相应的婚姻挤压预测方法得出了不同的结论,但总体上,不同时期中国的婚姻挤压程度不同,婚姻挤压主要表现为男性婚姻挤压,且农村男性婚姻挤压更为突出。
1.不同时期中国婚姻挤压的程度不同
2.不同时期婚姻挤压的影响因素不同
中国强烈的男孩偏好和女性低下的社会地位导致了对女孩的歧视,在人口学上表现为偏高的女孩死亡水平和出生性别比,从而使得婚姻市场上男性过剩,产生了男性的婚姻挤压[※注]。特别是2000年以来的高出生性别比的影响,未来40年会产生严重的男性婚姻挤压现象,且农村的男性婚姻挤压程度大于城市。婚姻挤压问题产生的最主要原因是出生性别比偏高,而出生性别比偏高又与计划生育政策的实施密不可分。有学者指出,2020年以后,中国婚配年龄人口差异程度开始持续增大,而造成这一问题的原因正是计划生育政策实施后出生的人口开始进入婚姻市场,而计划生育政策实施前出生的人口开始离开婚姻市场[※注]。刘爽和蔡圣晗认为,导致大龄未婚问题的主要原因在于两性社会经济特征的结构性失衡,而非队列性别比失衡[※注]。
姜全保和李树茁从婚姻挤压的本源,即中国人口性别失衡问题出发,分析了中国历次人口普查、生育节育调查等显示的出生性别比的变化趋势、1980—2010年失踪女性,以及由此产生的男性过剩人口状况,提供了两种可以用来度量婚姻挤压的模型,通过预测指出,从2016—2046年,过剩男性人口为120万—150万,在2027年达到峰值,为143万—185万;在2060年平稳之后,年过剩男性人口在50万人上下[※注]。
婚姻匹配是个体主观偏好和客观婚姻市场共同作用的结果,婚姻挤压本质上是人口性别年龄结构问题,宏观的性别和年龄结构是影响婚姻挤压的前置因素,个体的家庭与社会文化背景、经济基础、工作情况等社会资本才是影响婚姻挤压的根本原因[※注]。但择偶不仅受经济因素的影响,还受到伦理道德、心理、宗教、种族等多种因素的影响[※注],现实中夫妇婚龄差、通婚圈的逐渐扩大以及“单独二孩”政策的实施会在一定程度上减缓未来婚姻市场的潜在择偶压力[※注],有关婚姻挤压的研究也需要考虑诸多社会、经济因素。
(四)计划生育统计
计划生育政策的实施也在一定程度上促进了人口统计指标的发展与统计实践。已婚育龄人群是计划生育政策的重点影响人群,三十余年独生子女政策的实施形成了众多独生子女,为此,此处仅从已婚育龄妇女人数和独生子女领证情况对有关计划生育统计研究加以阐述。
1.已婚育龄妇女人数
结婚年龄和已婚妇女比例是生育率水平最基本的决定因素。统计数据表明,1996年至2012年,中国已婚育龄妇女人数呈上升趋势,从1996年的约2.4亿上升到2012年的约2.78亿;2013年开始,中国已婚育龄人口数减少,至2017年年底降至约2.67亿人[※注]。
2.领取独生子女光荣证人数
中国从1980年开始在城乡实行严格的独生子女政策,独生子女领证率反映的是在生育一个孩子后不再生育第二个孩子的育龄妇女的比例。即已生育一孩且不再生育第二个孩子的领取独生子女证的育龄妇女占当年已婚育龄妇女总数(孩子年龄在14岁以内)的比重。在实行独生子女政策时期,独生子女领证率指标是考核独生子女政策实施效果的主要指标,也在一定程度上反映了新增独生子女的数量与变化趋势。
五出生性别比估计
出生性别比是度量人口性别结构的一个重要指标,指一个时期内活产男婴和女婴的数量之比,通常用每100名活产女婴所对应的活产男婴的数量表示。根据国际上的统计,正常的出生性别比应为105—107[※注]。
依据中国1960—2016年总人口出生性别比数据[※注],1953年和1964年的0岁性别比分别为104.88和103.83。它们虽然不是严格意义上的出生性别比,但能间接表明中国20世纪五六十年代的出生性别比是正常的[※注]。根据国家计划生育委员会1988年中国2‰人口生育节育抽样调查原始数据汇总结果,20世纪70年代出生性别比为106.05,在正常范围内。1970—1980年总人口出生性别比基本在正常范围内。自20世纪80年代以来,伴随计划生育政策的严格执行,中国出生性别比持续偏高:1982年第三次全国人口普查的出生婴儿性别比为108.5,偏高初露端倪,1987年全国1%人口抽样调查为110.9,1989年为111.3[※注]。90年代继续攀升,1990年第四次全国人口普查时上升到111.3,1995年全国1%人口抽样调查为115.6,而2000年第五次全国人口普查则已达到119.92,超出国际公认正常范围约10个百分点。2000—2010年均在120左右波动;2010年后总人口出生性别比有所降低。有学者指出,随着性别鉴定技术的普及,以及生育政策对于生育数量的限制,人们通过技术手段流产女婴来满足男孩偏好[※注]。由于对生育第一孩的性别比的直接干预,才促使了出生性别比持续升高和高孩次生育性别比及高孩次生育率的下降[※注]。
出生性别比的估计有两种方法,即点估计和区间估计。人口出生性别比的估计一方面能揭示人口出生性别比变化的趋势与差异,同时,也可为治理人口出生性别偏高、相应人口政策的调整提供决策基础。
(一)出生性别比估计方法
人口出生性别比作为一个相对指标,需要较大的出生样本。马瀛通等以中国1988年2‰人口抽样调查为主要数据,分析了中国人口出生性别比变化的规律和特点,认为人口出生性别比是条件随机事件,这为突破传统分析人口出生性别比的简单方法,深入探索中国人口出生性别比升高问题,深刻认识人口出生性别比的变化规律和监测人口出生性别比的动态变化过程奠定了基础[※注]。总体上,出生性别比的估计主要存在点估计和区间估计两种方法。
1.点估计
点估计即在一定样本群体内,用活产男婴数与活产女婴数直接估计或计算出生性别比。乔晓春指出,点估计中如忽略样本量、方差和置信区间等有可能得出错误的结论,提出计算特定区域某一年的人口出生性别比的出生孩子数应该在3000人以上,人口总体应在30万人以上[※注]。
2.区间估计
(二)中国出生性别比水平估计
出生性别比升高是中国人口年龄性别结构转变的主要特征之一,学者们利用不同数据和方法对中国自20世纪80年代以来的出生性别比水平进行了估计。陈卫和翟振武通过教育数据调整的普查低年龄组性别比发现,中国实际的低年龄组性别比要比普查反映的水平低5—9个百分点,2000年普查的出生性别比高达117,但估计出的数值约在110,实际的出生性别比显然要低得多[※注]。王军等使用人口普查、户籍登记和住院分娩三种数据,对中国出生性别比的估计和近年变化形势的预测研究表明,2010年中国出生性别比水平在118左右,2010年以来中国出生性别比存在下降的可能,生育政策逐步放开后中国出生性别比将呈下降趋势,中国出生性别比恢复正常至少需要15年左右[※注]。
特别地,有学者指出,在使用区间估计法估计出生性别比时,如果观测值落在正常的出生性别比置信区间内,则不能判断该出生性别比异常[※注];比较出生性别比观测值的置信区间和正常出生性别比(如106或107),如出生性别比落在置信区间内,则不能判断该出生性别比异常[※注]。姜全保和李树茁对中国城镇出生性别比的估计发现,样本量较大时正常置信区间长度较小,1982年、1990年、1995年、2000年、2005年、2010年和2015年中国城镇出生性别比均偏离正常水平;尽管如此,样本量较小时,1991年、1997年、2002年和2004年的城镇出生性别比仍高于置信区间的上限,相应年份出生性别比偏离正常值;一些年份,如1994年的城镇出生性别比落在置信区间内,但因为样本数量小,置信区间长,难以判断出生性别比是否处于正常范围[※注]。
2016年中国开始实行“全面二孩”政策,生育政策的调整在影响人们生育行为的同时,也会使中国出生性别比呈现新的态势。这些还需要借助第七次全国人口普查数据、生育调查数据,以及教育统计、出生人口等级数据等继续加以分析、估计和监测。
六人口迁移流动研究
迁移流动是改变中国人口分布格局的重要力量。改革开放以来,人口迁移流动成为人们熟悉的社会现象。中国流动人口从1982年的700万增长到2017年的2.44亿。中国人口迁移流动政策经历了从自由迁徙阶段(1949—1957年)、严格控制阶段(1958—1983年)、逐步开放阶段(1984—2002年)、公平理念的提出及贯彻阶段(2003—2012年),直至党的十八大以来全面推进市民化阶段五个阶段。党的十九大以来,中国人口发展的历史进程也从以出生、死亡以及由其决定的自然变动主导的阶段转变为向以人口迁移流动为主导的阶段。
作为经济和社会双重转型条件下的重大现实问题,大规模的乡城人口迁移流动与快速城市化,对社会经济的发展产生了深远的影响,中国人口迁移流动研究也取得了引人注目的进展,在此主要从迁移流动调查、迁移流动态势和迁移流动模型三个方面加以具体分析。
(一)20世纪80年代至今人口迁移流动的主要调查
1.1982年第三次全国人口普查
本次调查中流动人口指户口登记状况(调查项目六)为“常住本地一年以上,户口在外地”,以及“人住本地不满一年,离开户口登记地一年以上”两类人。
2.1986年74城镇人口迁移抽样调查
本次调查由中国社会科学院人口与劳动经济研究所主持进行,是中国历史上第一次专门针对人口迁移的全国性调查,共对全国15个特大城市、6个大城市、12个中等城市、10个小城市和31个镇的23895个家庭户和1643个集体户的100267人进行调查[※注]。这次调查比较全面地收集了这些城镇新中国成立以来的迁移人口总量、迁移率、性别、年龄、受教育水平、婚姻状况特征,以及人口迁移与生育、人口迁移与就业、人口迁移与城市化的关系等方面的信息,为分析新中国成立以来中国城镇人口的迁移变动提供了宝贵的数据资料。
3.1987年全国1%人口抽样调查
4.1988年全国生育节育抽样调查
本次调查由国家计划生育委员会组织进行,调查覆盖全国30个省(直辖市、自治区)(不含台湾省),调查总规模为2152044人[※注]。该调查收集了被调查者的“出生地”,迁移人口“来本样本点(调查登记地)的原因”“最后一次来本样本点的年月”,跨省迁移人口的“最后一次省际移动的原因”“最后一次省际移动的年月”“移出地”等,提供了非常丰富的人口迁移信息。
5.1990年第四次全国人口普查
本次普查收集了5岁及以上被调查者“1985年7月1日常住地状况”和迁移人口的“迁来本地的原因”[※注],主要从流入地角度收集了流动人口信息。
6.1995年全国1%人口抽样调查
本次调查中,设置了以下人口迁移项目:“何时来本县、市、区居住”“从何地来本县、市、区居住”和“1990年10月1日常住地”。但1987年全国1%人口抽样调查和1990年第四次全国人口普查中使用的“迁移原因”项目被取消了。利用这次调查的数据,可以分析20世纪90年代前期中国的人口迁移和流动状况[※注]。
7.2000年第五次全国人口普查
2000年第五次全国人口普查中在以户为单位的信息中,收集了“本户户籍人口中外出不满半年人数”“本户户籍人口中外出半年以上人数”和“暂住本乡镇街道但离开户口登记地不满半年人数”等信息[※注]。本次人口普查以半年为基准,调查了流入和流出人口信息。
8.2005年全国1%人口抽样调查
根据2005年全国1%抽样调查项目,流动人口是指“调查时点居住地”在本调查小区,但“户口登记地情况”为本乡(镇、街道)以外的人口,同时剔除了市内人户分离人口。本次调查进一步明确了流动人口的概念,更确切地统计了流动人口的数量。
9.2010年第六次全国人口普查
10.2015年全国1%人口抽样调查
11.全国流动人口卫生计生动态监测调查
国家卫生与健康委员会实施的流动人口动态监测调查始于2009年,至今已连续进行了10次调查。调查主要涉及流动人口生存发展状况、迁移特征、就业收入、居住情况、社会融合、心理健康、基本公共服务、基本社会保险、健康状况等内容。该调查为掌握中国流动人口数量、分布及流动迁移等情况提供了丰富的数据信息。
12.农民工监测调查
为全面、及时、准确地反映农民工数量、流向、结构、就业、收支、居住、社会保障等情况,根据国务院颁发的《国务院关于解决农民工问题的若干意见》(国发〔2006〕5号)为指导,国家统计局于2008年年底建立了农民工统计监测调查制度。目前,已初步建立起以一体化住户调查为基础,以农村劳动力从业统计为核心,以举家外出调查为补充的调查体系,并辅之以必要的专项调查。
13.第三期妇女地位调查
本调查由全国妇联组织实施,调查问卷中专门设置了“受流动影响人员附卷”,涉及妇女的外出经历、外出的工作与收入、同行亲属情况等,为分析妇女流动经历及其家庭地位等提供了数据基础。
另外,除全国性迁移流动调查外,一些省区、研究机构也基于区域发展的需要与研究需要进行了区域性的流动人口调查,在此不再赘述。
(二)人口迁移流动态势
中国的人口迁移流动大致经历了从新中国成立至改革开放前(1949—1960年)的持续增长阶段、稳定减少阶段(1961—1978年)和加速增长阶段[※注](改革开放后40年的快速增长)3个主要阶段。
1.持续增长阶段(1949—1960年)
1949年至1952年年底是中国整个国民经济的恢复期,为彻底完成民主革命任务,尽快恢复和发展工农业生产,为经济建设做好准备,政府实行了自由迁徙的政策,农民进城或沿传统路线“闯关东”“走西口”。但这一时期国家正在进行一系列的整顿和改革,人口迁移量并不大[※注]。
1953—1960年是新中国成立以来人口迁移的猛增时期,制定了国民经济发展第一个五年计划,拉开了全国大规模经济建设的帷幕,国家有计划地改变中国的工业格局,把沿海大批科研机构、工业密集工厂内迁到西北、西南边疆省区,大批新建企业也设置在安全区域。大批农民被征调进入城镇、矿山当工人,大批职工家属也随迁。1952年全国全民所有制工业部门职工为510万,至1958年增至2316万,新增职工绝大部分来自农村[※注]。为了支援边疆建设,山东、河北等人口稠密地区的农民集体移民边疆开荒垦殖,国家还组织了大量的知识青年支边。据统计,1954年迁出迁入量各为2200万,到1960年达3300万,迁移人口6年猛增2200万,成了规模空前的从沿海向内地和边疆的迁移流[※注]。从1958年起人口迁移的数量大幅度上升,与1957年相比,1958年的迁移人口总量增加了17.3%。到1960年人口迁移总量达到6515万人,如果只考虑户籍迁移人口而不考虑无户籍迁移人口,1960年的人口迁移数量是新中国成立以来的最高纪录[※注]。
在这一阶段,中国人口流动主要从沿海流向内地和边疆,从农村流向城镇。另外,考虑工业发展的布局,这一阶段的流动大多由政府主管部门有计划有组织地进行,人口迁移流动也为国防安全、工业发展和边疆建设做出了巨大贡献。
2.稳定减少阶段(1961—1978年)
1959—1961年困难时期以及自20世纪60年代起中苏关系紧张,大量因备战而搬迁的工厂无法运转,使得此期间的人口迁移规模减小。资料显示,1962年中国人口迁移总量是4436万人,1963年已下降至2695万人。“文化大革命”期间,以学生录取分配和生产经营活动为主要原因的正常迁移人口减少,1700万上山下乡的知青和1000万下放干部成为迁移人口的主体。1967—1969年迁移人口降为500万—600万人,是新中国成立以来的最低点。1970年前后,大批知青上山下乡和干部下放劳动使迁移量有所回升。总之,20世纪60年代除两年有少量净迁入外,其他各年多为少量的净迁出,只有1961年和1962年两年有超过10万人的净迁出;20世纪70年代的人口迁移统计数字逐年上下波动,每年均为净迁入,最低的年份总量只有27人,最高时达164万人;且主要从城市流向农村,受自然灾害等影响,人口迁移流动也呈无规律状态[※注]。
3.加速增长阶段(1979年至今)
(1)改革开放后流动人口普遍化,流动人口规模呈扩大趋势
1982年第三次全国人口普查数据显示,中国迁移流动人口总数约为657万人;1987年上升至1810万人,1990年第四次全国人口普查时期突破2000万人,随后迁移流动人口规模逐年扩大;1995年全国1%人口抽样调查时约为7073万人,2000年第五次全国人口普查时已达到10229万人,2005年全国1%人口抽样调查发现迁移流动人口已上升至14735万人,2010年第六次全国人口普查时约为22143万人,2015年年底增长至2.47亿[※注]。改革开放以来,流动迁移人口的总规模处于持续增长的态势。预计2020年之前,流动迁移人口(包括乡城流动、城城流动及新落户城镇的农业转移人口)每年增长600万—700万人;2020年之后,流动迁移人口每年增长渐减至500万以下;到2020年、2025年、2030年,中国流动迁移人口将逐步增长到2.82亿、3.07亿、3.27亿[※注]。
(2)流入地分布沿海化,中西部特大城市和城市群承载更多省内流动人口
另外,城市群将成为东部地区流动人口集聚的主要空间形态。东部地区的大规模流动人口主要集中在长三角、珠三角、京津冀三大城市群等特大城市群地区。这些城市群依然是中国经济增长的引擎,在科技创新、交通通达、信息交流、国际竞争、文化影响、人力资源等方面仍具有强大优势,将继续保持对流动人口的强大吸引力和吸纳能力。同时,北京、上海等特大城市正在主动疏解人口、产业、功能等,这些将使得周边城市和区域直接获益。随着长江经济带、长江中游城市群、成渝城市群等国家级规划的相继出台,中西部城市群成为全方位深化改革开放和推进新型城镇化的目标,中西部省会等特大城市和城市群将成为省内流动人口的新兴聚集地。
(3)人口流动趋于稳定化和家庭化
流动人口中女性流动人口、已婚流动人口和举家迁移的比例呈上升趋势。自20世纪80年代以来,流动人口中女性流动人口的规模也从1982年的357万增长到了2005年的7000万,相应比例也逐步升高,从1990年的44.45%上升到2005年的49.71%。1982年,已婚人口比例达到63.45%,1987年该比例达到68.37%,1990年下降到59.73%,2000年又攀升到64.84%,2005年则达到68.41%;与此相反,流动人口中未婚者的比例由1990年的36.1%下降到了29.1%[※注]。
(4)人口流出和回流的态势长期存在
流动人口的家庭化趋势加大了留守妇女、留守儿童、留守老人的随流比例,在一定程度上增大了人口流出规模。加之对城市生活的向往、受城市更多发展机会的吸引,农村人口外流比例会长期呈现增长趋势。农村、小城镇和中小城市人口的大比例流出态势不会改变,而会持续强化。与此同时,当前乡村振兴计划的实施,国家和地方政府均在大力推动流动人口回乡创业就业,并出台了相应的支持政策;加之多数举家流动家庭,特别是流入一线大城市的家庭,缺乏定居流入地的能力,仍将有较大比例的流动人口选择回流,返乡创业,或回到家乡附近的小城市务工、定居生活。这种人口流出和回流的状况将在较长时期内并存。
(5)国际迁移时代的到来
(三)人口迁移流动模型
中国自改革开放后迁移流动人口快速增加,对城乡社会经济发展的影响愈来愈突出,诸多专家、学者借助于迁移流动模型,解释中国人口迁移流动的空间分布特征、迁移流动原因、影响迁移流动的因素,以及人口迁移流动的发展趋势。
1.迁移流动人口的空间分布及趋势预测
李南和ShripadTuljapurkar将带有年龄结构的人口迁移模型由只包含迁入地推广到了迁入和迁出地,讨论了迁移对迁入及迁出地年龄结构的影响,提供了研究区域内部迁移的框架,如城乡迁移等[※注]。
黄建元和刘洋在分析各种流动人口模型适用性的基础上,构建了先采用Logistic曲线拟合法进行拟合修正,再应用拟合修正后的数据,通过等维递补灰色预测法进行流动人口预测的预测模型,并利用上述模型尝试对江苏省2010年、2015年、2020年流入人口的低中高方案进行预测,取得了较好的效果[※注]。刘汝良等求出了Keyfitz模型和Rogers模型的理论解,并以Rogers模型为例,对人口迁移模型进行了改进,使之适用范围更广,进而建立了系统动力学模型,并对江西省的人口迁移问题进行了仿真预测,模拟出了江西省农村人口、城镇人口及城市化率的变化趋势,即到2050年江西省城镇化率将高达85%,城市化建设将基本完成[※注]。
米红等引入地理信息系统中的人口分布重心和经济重心的概念,对传统的人口迁移重力模型进行了修正,并将其应用在农村人口向城市的迁移中,在此基础上,以系统动力学为主要方法,结合人口分要素预测与迁移模型,对未来中国人口的迁移规模和城市化率进行了预测,认为未来中国农村人口将持续减少,城市人口将持续增长,2013年城市人口超过农村人口,城市化水平将不断提高,按照现有模式发展,2050年估计能达到64.1%。随着农村与城市人口的此消彼长,每年迁移到城市的人口将逐渐减少,从2010年的1000多万降低到2050年的300多万;城市化速度也由每年提高0.8个百分点降低到每年0.2个百分点[※注]。夏永祥和魏玮依据中国特殊的城乡和区域双重二元经济以及城乡二元社会结构下人口流动的特殊性,对传统人口流动模型进行修正,建立了新的人口流动模型,并以此分析中国产生民工荒现象的原因[※注]。
刘欣和蔡婧将灰色模型与径向基函数神经网络模型相结合,针对人口迁移行为中的合力效应提出新的人口迁移预测模型[※注]。朱江丽和李子联通过构建异质性人口跨期流动模型,动态分析了户籍改革对区域经济与人口格局的影响效应及其传导机制,发现:第一,经济体长期均衡过程中,价格指数效应、前后向关联效应以及竞争效应都将影响企业家和农村劳动力的地区分布;第二,户籍改革促进在城市工业部门务工的农村劳动力市民化,户籍人口城镇化率将先经历快速上升而后减速增长,直至达到相对稳定;第三,户籍改革引致农村劳动力与企业家的比例以及农村劳动力迁移成本双双下降,扩大地区竞争效应与后向关联效应,影响地区经济与人口格局,探索户籍改革对地区发展的影响并提供了一个可行的分析框架,反映了不同条件下户籍改革效应的不同表现以及制衡因素的作用[※注]。
郭志仪和刘红亮指出,利用人口年龄结构数据中死亡率相对稳定的特点和线性回归方法,可以对历史时期内特定区域中人口的迁移流动做出较为精确的估计,并利用甘肃省1990年以来普查数据和历年统计公报人口数据,在建立多维自适应计算模型的基础上,对甘肃省1978年以来总人口中跨省迁移人口的规模做了尝试性分析,指出如果使用普查年数据对跨省迁移人口的规模做简单线性回归,可能会带来较大误差[※注]。
2.迁移流动的原因及影响因素
还有研究运用人口迁移模型,考察了气候变化、高铁发展、城市公共服务水平、商品房价格,以及行政等级等社会经济和制度因素对人口流动的影响[※注]。这些研究不仅对揭示人口流动的一般影响机制具有理论价值,而且呈现了当前中国社会经济发展的具体背景下人口流动变化的具体机制。
迁移流动对人口及社会经济的效应。迁移流动不仅是人口变动的核心组成部分,而且对人口变动的其他要素以及社会经济发展具有重要的影响。2018年,关于迁移流动效应的研究主要包括:重新实证检验了流动事件对生育水平的影响[※注],探讨了迁移流动对人口空间格局的影响[※注]、对老龄化区域不均衡的效应[※注];考察了人口迁移的地区经济增长、住房价格变化等社会经济状况的影响[※注]。这些研究认为,人口流动降低了社会的总体生育水平,在加速流出地人口老龄化的同时,缓减了流入地的人口老龄化程度。通过对劳动力的配置效应,人口流动对经济发展产生了重要的促进作用,与此同时,也在不同程度上推高了流入地的住房价格。
七人口预测与其他间接估计
(一)人口预测技术
在介绍和应用既有的人口预测方法的同时,也有不少学者针对传统预测方法的假设、数据要求等方面的局限性,尝试改进人口预测工具和技术。朱悦新将现代控制理论中关于系统辨识的原理与方法应用于人口系统,提出了按龄留存率的解析式,将参数估计问题转化为优化问题,为中国当时数据资料有限条件下辨识人口模型参数提供了一种有效的方法[※注]。张天岭和杜闻贞介绍了英国人口学家Akkerman考虑家庭因素的人口预测方法,并根据中国具体情况对该模型进行改进;改进后的非稳定性人口模型可以预测中国人口总数、自然增长率、年龄结构、家庭户数、不同户主年龄特征的家庭的平均人口数等指标,为预测以家庭为单位的消费需求等内容提供了重要的手段[※注]。王广州借鉴地理信息系统中指数空间变异函数模型,改进人口空间间接估计方法[※注];其后续研究改进了利用一次人口调查数据对以往人口年龄结构估计的存活倒退法,提出了运用两个时点的人口数据,对两时点之间的人口年龄结构进行估计的方法[※注]。
王广州从冈波斯(Gompertz)和逻辑斯蒂(Logistic)基本预测模型出发,介绍了经典的队列要素人口预测方法和孩次递进生育人口预测模型[※注]。在此基础上,以1990—2010年3次全国人口普查数据为基础检验了孩次递进生育预测方法在人口结构预测中的可靠性。王广州系统回顾了人口预测的历史,介绍了主要的预测方法及软件技术,并结合实际预测案例阐释了人口预测方法和技术的应用[※注]。贺小林在回顾生命表方法、布拉斯模型logit转换等研究方法的基础上,构建了基于年龄移算法的多要素人口预测模型[※注]。通过将该模型在1990—2010年观测人口数据中的推演检验,预测了2010—2020年人口发展趋势,得出模型对短期人口预测较为精准的结论。郭雪峰等对传统灰色模型使用自适应滤波法进行残差修正,并使用改进后的模型对流动人口进行预测,研究发现,改进后的模型能够根据历史信息对残差权数进行动态修正,预测精度更高,实用性和可行性更强[※注]。
(二)人口预测方法的应用
1.总人口预测:规模与结构
张车伟和蔡翼飞使用队列要素法进行人口预测,并通过逐年推算预测新增劳动力规模和学历结构;参考发达国家的规律设定了就业弹性,得到了劳动力需求预测;需求与供给相比确定了缺口总量,并用统计数据分解出年龄、学历及农民工等结构特征。结果表明,“十三五”时期,劳动供求基本平衡,但就业的结构性矛盾不断加大,结构性失业问题比较突出[※注]。
向华丽和吴云程基于联合国生命量表和寇尔—德曼生命量表中不同模型生命表,分析了人口预测中不同模型生命表的选取对未来人口死亡模式、老龄人口预测结果的影响。研究指出,不同死亡模式的设置对老龄人口的预测结果具有明显差异,因而死亡模式的选择是科学预测、提高预测精度的前提[※注]。
2.迁移流动和区域人口预测
童玉芬和王莹莹采用系统动力学方法,对北京市人口进行了动态模拟。通过政策模拟,考察经济发展、产业结构升级、户籍制度放开等政策导向对未来北京市人口增长趋势的影响[※注]。米红和杨明旭也在考虑迁移的情况下,以浙江省宁波市为例进行区域人口预测[※注]。通过“五普”年龄移算与“六普”实际人口数挤出各年的年龄别净迁移模式,用迁移率、出生率和死亡率进行随机预测,研究发现净迁入能延缓人口总量下降,但在低死亡率和低出生率作用下人口老龄化仍将加剧。
劳昕和沈体雁综合考虑地级市城市体系,使用城市体系演化预测方法,根据均衡条件对全国的人口迁移进行迭代推演[※注]。并按照不同政策导向设置情景分别预测了城市等级结构。研究的优点是系统考察迁移,缺点是没有考虑人口自身老化、出生等自然变动,仅设置自然增长率来反映自然增长。
另外,曾永明用“五普”和“六普”分县数据做人口密度的概率分布函数,并通过预测均值和标准差进行外推预测。不过,在标准差预测中,标准差不断放大且预测的决定系数很低,以此类推预测也就决定了预测中的主要结论即两极分化,预测本身需要更多依据[※注]。
3.其他人口预测应用
王广州将普通高等教育年龄人口定义为18—24岁,借鉴使用生育研究中孩次递进人口预测模型来预测人口总量和结构等人口基数[※注]。考虑到受教育的递进属性,使用与育龄妇女总和生育率计算方法类似的总和受教育年限指标作为教育总体水平的代表。通过假定年龄别在校模式不变,可以将总和受教育年限推算为年龄别在校率,而后在对2050年总和受教育年限的假设之上,估计年龄别在校人口数。人口预测结果显示,预计今后高等教育年龄人口规模将持续稳定下降,受“全面二孩”政策的影响,预计2035—2040年高等教育年龄人口规模开始回升;在校规模预测结果显示,2020年之前处于下降趋势,但规模降至3000万以下的可能性不大,虽然误差会随着外推而增大,但高等教育在校人口规模持续提高的可能性很小。该研究是灵活运用经典人口模型的一个范例,同时也展现出人口预测对中国各项事业发展的指引作用。
(三)人口预测结果的评估与检验
石人炳和陈宁回顾评估了近几十年来的人口预测研究成果,指出目前人口预测存在“重结果预测,轻结果检验”“重未来描述,轻过往总结”的问题[※注]。通过选取2010年以前学界相对权威的、全国性、中长期的预测成果,研究认为,以往这些人口预测的中短期趋势基本符合实际,但长期来看其预测结果差异较大,且存在普遍偏高的问题。造成这一结果的原因包括基础数据、参数设定和模型选择3个方面的问题。具体而言,现有多数人口预测研究中普遍存在生育参数设定高于实际统计水平,甚至是修正后的生育水平,死亡参数设定高于实际死亡水平;不同预测对基础数据的处理和评估缺乏统一的标准。这些因素共同决定了既有预测结果之间的差异。
概括而言,过去几十年中国人口预测技术的发展大致经历了由简单到复杂、逐步发展和完善的过程。20世纪80年代以前,主要的人口预测技术以单因素、简单的趋势拟合方法为主;20世纪80年代初,随着第三次全国人口普查以及一些大型专项抽样调查的出现,人口统计学界涌现了一大批关于人口预测方法的研究,其中既包括对国外人口预测技术的引进,也有中国学者自主研发的人口预测模型。这些预测方法与日益丰富的人口统计资料相结合,带动了人口预测方法和应用的繁荣。人口要素预测法逐渐替代简单的趋势外推方法成为人口预测的主要选择,这一发展意味着人口预测开始反映人口变动的内在机理和规律。随着人口统计数据的不断积累以及计算机技术的发展,人口预测方法朝着精细化、复杂化的方向不断发展。生育预测方法不仅考虑育龄人群的年龄、婚姻状况等特征,而且将孩次、性别、间隔等因素纳入预测模型;死亡预测方法将不同健康和疾病状态的转化纳入预测模型;人口规模的预测不仅考虑不同的人口变动因素,而且将这些变动因素之间的相互作用纳入模型。简言之,近几十年来中国人口预测方法通过不断修正和放松不切实际的假设条件、改善预测算法,提高了进行人口预测的能力和效率。
第三节总结与展望
在过去的70年里,中国人口统计学研究走过了引进、消化吸收和创新发展的历史进程,既有很多科学研究值得总结,也有很多经验教训需要汲取。
第一,在基础数据收集方面,中国人口统计科学研究主要围绕人口普查数据的调查方法、数据质量和调查改进进行了积极的探索。伴随着人口普查内容丰富和调查方法的完善,中国人口普查的重大意义不言而喻,特别是1982年第三次全国人口普查,开创了中国人口普查数据质量、数据收集和存储的新时代,对全面、科学记载,安全、可靠保存以及丰富和发展中国人口统计历史资料具有重大意义。2000年以来人口普查调查方法和数据质量面临的问题和挑战,对中国人口调查方法和人口统计科学研究提出了更高的要求,同时,也对各类人口抽样调查提出了新的课题。
第二,在生育和计划生育问题研究过程中,中国人口统计科学研究发挥了重要的历史作用。为深入研究中国人口发展的特点、进程和科学预测中国人口的变动趋势,对研究成果科学性、可靠性进行不断的努力,既有中国学者创建的符合中国人口和计划生育以及人口客观规律的模型和方法,也有科学的前瞻性研究成果为科学决策提供依据。期间涌现出许多为解决中国人口实际问题,科学分析人口发展的研究成果,特别是在生育政策制定、实施的过程中,中国人口统计科学研究为正确判断中国人口形势和政策的影响扮演了维护人口统计科学研究尊严和去伪存真的角色。当然,也存在一些严重的误判和误导,需要在未来的研究过程中引以为戒。
第四,在人口迁移流动的研究过程中,中国人口统计科学研究还比较薄弱,这一方面是受数据收集的及时性、可靠性影响,另一方面是受基础信息处理能力和面临困难的影响。人口迁移流动迅速变化的不确定性除了来自区域社会经济发展的不确定性,迁移流动的多状态、可逆性也决定了研究的复杂性,目前的研究能力和信息收集水平,对科学、系统研究人口迁移流动问题还是一个严峻的挑战。
科学的进步就是不断解决更复杂的问题,人口统计科学的发展也不例外。在过去的70年里,中国人口统计科学发展实践检验表明科学理论、研究基础和规范研究具有重大意义。未来的中国人口统计科学发展也必然向有坚实的科学基础和丰富的科学积累的方向发展。随着中国现代科学的发展和完善,任何业余的、没有经过严格专业基础训练、不能把握科学发展方向和不能适应科学发展潮流的研究队伍都将被迅速淘汰。
随着大数据时代的到来,传统人口统计基础研究面临重大的发展机遇和严峻的挑战。发展的机遇在于如何深入理解实时人口大数据所揭示的客观人口规律。随着年轻一代研究人员的专业素养、数学基础和计算机软件开发技能的提高,原创性重大研究成果必然层出不穷。然而,大数据时代人口统计科学研究的挑战在于大数据资源获得障碍和非专业人员掌握资源的研究“结果”也会层出不穷,但相信随着创新激励和实践检验,数据垄断的壁垒和伪科学必然越来越难以生存。因此,在机遇和挑战面前,既要继承传统人口统计科学的历史积累,也要与时俱进,开拓创新,对历史赋予和积淀的丰富的数据资源充分发掘、挖掘,体现人口统计科学研究的专业基础和科学研究能力。
总之,总结和回顾中国人口统计科学发展70年的历史,涉及对许多中国重大人口科学发展规律和问题的再认识,特别是因研究者的局限,可能对某些原创性研究成果的搜集、总结不到位,甚至存在疏漏。同时,因人口变动的长周期、不可逆及研究者自身也处于周期之中,对某些研究成果的总结和认识也可能产生误解或存在偏颇。