中国家庭追踪调查:理念与实践

北京大学的中国家庭追踪调查(ChinaFamilyPanelStudies,以下简称CFPS)3作为一项全国性、综合性的社会跟踪调查项目,它的开展正是以采集动态经验数据、记录当前中国的社会变化为目的,意在为现在及将来的研究者提供了解和研究当今中国最为翔实、客观的一手数据。CFPS长期跟踪收集个体、家庭、社区三个层次的数据,其调查内容包括村/居概况、家庭关系、人口流动、家庭经济、居住与设施、工作与收入、教育、婚姻、健康、态度观念、认知能力和社会交往等诸多主题。自2010年正式实施基线调查起,迄今为止CFPS已采集三期数据,具备了开展跟踪分析的数据基础,并开始为学术研究和公共政策提供数据支持。4

为了让研究者对该项目的背景和特色有更多了解,本文将从设计理念、调查实施过程、内容特色、数据结果四个方面对CFPS展开全面介绍。

尽管CFPS以社会变迁这一宏大议题为出发点和研究目的,其研究设计和采集数据的落脚点仍是具体的个人。如前所述,个人是反映人类社会变异性的最基本单元,许多社会现象,如社会不平等、人口素质、生活质量、社会心理和文化等,最终都会具体化为个人层次的收入、职业、教育、健康、幸福感及态度等;社会的变迁,如代际流动、人口结构的改变、家庭制度的演变等,最终也可以通过个人层次的变化体现。所以,要了解社会,就必须先了解社会中不同个人在角色、地位、行为和态度等方面的差异。正因如此,CFPS最基本、最重要的调查和研究单元是社会中的个人,其长期跟踪的对象也是个人。

中国社会具有多层次结构,这体现为个人嵌套在层层的社会组织(如工作单位、村庄、家庭等)中。在这一嵌套结构中,家庭是最基础和最直接影响个人角色、地位、行为和态度等的社会组织。

综上所述,对中国社会的了解与研究不可能脱离对家庭这一社会细胞的研究,而家庭也正是CFPS一个重要的研究和调查单元。CFPS采用了可明确定位家庭成员间关系、描述家庭结构网络的方法,对家庭关系和家庭成员信息展开全方位的深度调查;同时,它也详细采集了家庭层次经济社会生活的各方面数据。家庭数据的收集丰富了经验资料的层次,为研究者分析中国社会提供了更多有价值的信息。

社会是一个庞大而复杂的动态系统,它的复杂性首先体现为社会现象的多层次性,且不同层次紧密相扣,不可割裂。例如,宏观的国家政策和经济环境会影响微观的个人收入,而微观的个人行为的集合也会引起宏观变化。社会系统的复杂性还体现为社会现象的多维度性,不同维度紧密联系和互相影响。例如,个人的职业会影响到其收入和社会关系网络,进而又会影响其健康和生活满意度等。

针对社会系统的复杂性,CFPS开展了多层次和多维度的全方位调查。社区、家庭和个人是CFPS调查的三个重要层次。在每个层次上,CFPS均从多个维度采集信息:在社区层次调查社区的政治环境、村/居面貌、基础设施、人口、资源、交通、医疗卫生和财政收支等;在家庭层次调查家庭的结构与成员关系、生活条件、社会交往、收入支出和资产状况等;在个人层次调查个人的教育、职业、收入、婚姻、心理与生理状况、观念与态度等。通过这一设计,调查对象不再是孤立的,个人、家庭和社区三者可以在数据上关联起来。

CFPS项目由北京大学中国社会科学调查中心(以下简称“调查中心”)实施。基线调查于2010年4月开始,2011年2月结束。2011年7月到2012年2月,调查中心进行了以样本维护和测试调查为目的的小规模追访。首轮全部样本的追踪调查在2012年7月到2013年3月进行。CFPS调查的全部实施过程,从抽样到实地访问,从初访到追访,均由调查中心团队独立完成。下面我们将介绍数据使用者最关心的抽样设计、历次实地访问情况和追访原则。

CFPS分6个独立子抽样框抽取样本,相应得到6个子总体。其中,上海、辽宁、河南、甘肃和广东5省市构成了5个独立子样本框(称为“大省”)。CFPS对“大省”均以过度抽样的方式抽取样本,因此其样本具有地区的独立代表性,可以用于省级推断和地区比较。每个“大省”目标样本规模为1600户。另一个独立子样本框由其他20个省、直辖市、自治区共同构成(称为“小省”),目标样本规模为8000户。因而CFPS总的样本规模为16000户。5个“大省”经二次抽样后获取的样本与“小省”样本框中的样本共同构成具全国代表性的总样本。8

CFPS抽样设计的另一特点是打破了农村与城市分开抽样的传统,采用城乡一体化的抽样方式。这样设计主要是因为官方对农村与城市的行政划分已难以及时反映中国快速城市化的现实。因此,CFPS样本的城乡属性不再是依据事先由城乡行政划分的抽样框来鉴别,而是依据社区、家庭以及个人问卷中关于村居属性、农业与非农活动、户口等多个变量来判断。

CFPS2010对全国完全样本和全国再抽样样本分别计算了家庭问卷、成人问卷和少儿问卷三个数据库的权数。11权数的计算包括抽样设计权数、无应答调整权数、事后分层调整权数的计算以及对权数的极值调整。其中,抽样设计权数为三个阶段抽样概率的乘积的倒数,并对再抽样样本考虑了从第一阶段所抽取的样本区/县中再抽取再抽样样本区/县的概率。无应答调整权数的计算在家庭层面上采用了加权组调整的方法,综合考虑了家庭成员问卷完成的数量占村/居样本中所有家庭样本数量的比例,以及完成家庭成员问卷的家户中完成家庭问卷的家户数与需作答家庭问卷的家户数的比例;在个人层面上则采用了基于Logistic模型的联系层次上(相对于无联系样本)的应答倾向概率和拒访层次上(相对于非拒访样本)的应答倾向概率作为调整系数。事后分层调整主要在个人问卷层面进行,以性别、年龄和城乡作为主要分层变量。极值调整主要是将权数控制在一定的范围内,其目的是控制权数方差,保证估计效率。12追访数据将同样提供家庭和个人问卷的权数,但个人问卷的权数仅针对基因成员,在计算时将在2010年个人权数的基础上考虑其在调查当年被成功追访到的概率。

2010年CFPS基线调查共发放样本19986户,13涉及25个省、直辖市、自治区的162个区/县的649个村/居,最终完成了635个村/居的14960户的访问,共界定出基线基因成员57155位。其中,42590位基因成员完成了2010年的个人访问(成人33600位、少儿8990位)。此次调查在家庭层面的累积应答率为81.3%,在个人层面应答率为84.1%。14

CFPS2011年的调查规模较小。出于样本维护的目的,同时作为对2012年全部样本追踪调查前的一次预调查,2011年CFPS仅计划访问基线调查中的部分样本。考虑到青少年在身心发育、学校教育和行为态度等方面变化较快,相对密集的数据采集将对青少年开展研究更有利,2011年CFPS将调查对象锁定为基线调查中完访的青少年(至2011年年龄为18岁及以下)基因成员,同时对基线调查中完访的家庭进行了家庭层面的追访。对18岁以上的成年基因成员、新出现的家庭成员和新组成的家庭没有采集信息。在家庭层面,2011年共完成访问13130户家庭,追踪成功率为89.1%。15在个人层面,共完成访问8803位基因成员(成人1279位,少儿7524位)。16其中,在2010年完访且满足2011年访问年龄条件的9701位基因成员中,共有7696位基因成员在2011年成功访问,追踪成功率为88.8%。17

为了在保证研究需求的前提下尽可能降低成本和提高访问效率,CFPS在2012年的调查中对家庭成员性质进行了分类:将基因成员所在家庭中的所有与基因成员有父母、子女、配偶关系的非基因成员视为调查当年该家庭的核心成员,将基因成员与核心成员以外的家庭成员视为非核心成员。其中,基因成员与核心成员需要回答完整的个人问卷(也称“长问卷”),非核心成员则只需回答简短的个人问卷(也称“短问卷”),或者仅通过他人代答的方式采集少量的关键变量信息。通过这样一种设计,我们既可以收集到最重要的一部分家庭成员的详细资料,又可以了解到相对次要的家庭成员的基本背景,从而帮助研究者了解基因成员所处的家庭环境及成员关系。不过,与基因成员不同,核心成员与非核心成员不是CFPS长期追踪的对象,他们与基因成员的家庭关系一旦断裂(即不属于基因成员所在家庭的成员),对他们的调查将终止。此外,CFPS规定,调查时出境、出家、入狱或参军的基因成员在调查当年无需进行个人访问。

为了描述出一个完整、精确的家庭结构网络,经过2008年和2009年预调查的尝试后,CFPS在2010年的基线调查中创造性地采用了一套T表系统来采集家庭关系与家庭成员信息。

与传统社会调查相比,使用T表采集家庭关系的优势总结为三点:第一,传统社会调查通常以家庭中的某一位受访者为核心采集其他家庭成员的基本信息及其与受访者的关系。这种做法假定家庭关系中只有受访者一个核心,该核心通常是采用随机抽取的方式或以人为指定“户主”的方式来确定。但无论采取哪种方法,关于核心(尤其是单核心)的假定都把家庭关系理解得过于简单,因为逻辑上家庭中的每一个人都可以作为家庭关系的核心,家庭关系应该是由多个核心连接起来的树状网络(familytree),而从单一核心出发(如户主或随机抽取的受访者)的辐射状结构仅仅是树状家庭网络中的一小部分,因而只能采集到每个(或几个)家庭成员与受访者之间的关系,却无法获知除受访者以外的那些家庭成员之间的关系。CFPS的T表设计突破了单一核心的限定,允许每一名家庭成员轮流成为家庭关系的核心。因此,研究者不仅可以知道家庭成员之间直接的父母、配偶、子女关系,还可以推断出一些间接亲属关系,比如,继父母—子女关系、跨代的祖父母—孙子女关系、同辈的兄弟姐妹关系等。

第二,针对传统社会调查中同一家庭不同成员信息收集不完整、不对称的问题,T1表用代答的方式采集了无论老幼所有家庭成员的基本信息,这一信息采集不受限于具体家庭成员是否接受个人访问的影响。不仅如此,通过T3表,研究者还可以得到与受访者不同住的父母、配偶、子女的一些基本社会人口信息,这弥补了传统调查中由于分家导致重要亲属信息缺失的问题。24

第三,T表建立的个人编码体系可以对家庭成员进行准确定位,解决了传统社会调查无法将受访者填写的家庭关系与具体的个人联系起来的问题。唯一的个人编码为后续的追踪访问奠定了基础,也让研究家庭成员边界的持续变动(如子女离家、父母迁入子女家庭养老等)成为可能。

综上所述,T表的设计克服了传统社会调查收集的家庭关系不明确、信息不完整的问题,为研究者掌握家庭关系全貌、了解全部家庭成员信息、匹配家庭成员数据等前沿研究的需求提供了难得的资料。

前文提到,CFPS采用了城乡一体的抽样方式。反映在问卷设计上,CFPS采用了城乡整合的问卷,不再像传统调查一样分城市和农村两套问卷进行调查。

传统社会调查分城乡两套问卷的做法主要是鉴于中国过去城乡间制度上的巨大差别。但是,由于近年来中国快速的城市化进程,对农村与城市的行政划分已难以及时反映城乡边界的实际变化。而且,随着农村的现代化发展和城乡人口、资源、信息流动的日益频繁,城乡家庭和个人在许多重要特征上的界限也在不断模糊,而城市内部和农村内部个体间的异质性却在扩大。因此,城乡使用不同问卷经常会出现问卷对于地区、家庭或个人不适用的情况,整合城乡问卷变得很有必要。

为避免上述问题,CFPS选择的调查对象既包括流出地家庭外出但尚未在外安家的个人,也包括流动到外地安家的流动者,这为研究流动的选择性、比较流动者与非流动者间的差异提供了条件。通过对相同样本的长期追踪,CFPS收集到受访者一生的居住地址的变化情况,这让流迁经历的数据更完整、更准确。而且,将流迁信息与历次追访收集的其他数据相联系,研究者还可以分析流动前后的变化,从而更好地研究流动与其他事件或状态之间的因果性。此外,CFPS每年均从上次调查时的家庭入手来调查家庭内部成员的出入状况,因而能够更有效地捕捉到个人的去向和联系信息。最后,电访、网访有效提高了流动样本的应答率。即使在本人面访、电访或网访都不成功的情况下,其他家庭成员为其完成的代答信息也可以一定程度上弥补缺失。

CFPS调查的一个特色内容是对所有10岁及以上的少儿和全部成人的认知能力发展状况进行长期的测试与评估。目前CFPS共拥有两套测试题,其中一套由识字题和数学题组成,测试受访者的识字水平与数学计算水平,使用于2010年和2011年;另一套由记忆题和数列题组成,测试受访者的长短期记忆能力和算术推理能力,使用于2012年。

CFPS准备长期轮换使用上述两套测试题。研究者利用CFPS的认知测试数据可以了解受访者认知能力的长期发展情况。借助CFPS其他方面的详细信息,研究者也可以研究影响受访者认知能力的因素、认知能力对个人成就的影响,以及认知能力与行为、态度之间的关系。

少儿的成长与发展是一个重要的研究主题。少儿时期的成长和发展对人成年以后的社会经济成就、行为、态度均有持续性影响。但是,国内大多数关于家庭的社会调查或综合性社会调查仅以成人为受访对象,缺少针对少儿成长与发展的调查内容,更没有可以从总体上反映少儿从出生起的整个成长过程的追踪数据,而关于少儿的专题调查又缺少完整的家庭背景信息。相比之下,对少儿建立专门的数据库,同时又有翔实的家庭背景信息可供综合分析,这是CFPS独有的优势。

CFPS采用独立问卷长期跟踪少儿的成长与发展状况。在调查对象上,基因成员与核心成员中所有少儿(16岁以下)都将接受调查。其中,10岁以下的少儿问卷全部由父母(或监护人)代答;10岁及以上少儿问卷既有父母(或监护人)代答部分,也有少儿自答部分。对于历次调查中的新生儿,研究者可以得到其从出生开始的完整成长信息。

在调查内容上,少儿问卷收集了少儿成长过程中各个方面的信息,包括早期发育、学校教育、认知能力、个性特征、心理素质、生理健康、学习与日常行为习惯等,这些对研究少儿的成长与发展、少儿阶段特征的持续影响具有非常重要的价值。

CFPS的追踪设计和内容特色最终会体现为引导有潜力的经验研究及获得有价值的数据发现。虽然CFPS目前只积累了三期调查数据,数据的开发和使用仍处在初期阶段,但我们的团队已经从初步的使用中得到有意义的发现。我们将以基于CFPS数据的几个研究为例,26向读者展示CFPS数据的开发潜力。

经济不平等是经济学和社会学长久讨论的议题,以往许多官方和学术机构的数据已为收入不平等和贫困研究提供了丰富的经验证据,但CFPS作为新的追踪数据为这一旧议题的讨论提供了新视角和新发现。研究者不仅可以利用CFPS数据检验以往数据发现的可信度,还可以通过追踪数据观察到收入流动、贫困流动等这些在截面数据中无法观察到的动态过程。

CFPS以回顾性问卷和追踪调查的方式收集的婚姻史数据为描述中国社会婚姻的变迁提供了难得的资料,下面我们将以结婚、离婚和同居三个例子来说明这些事件史数据的价值。

婚姻变迁是目前人口学、社会学分层领域和女性学领域学方兴未艾的研究方向。中国的婚姻变迁研究以前主要受到数据的限制,尤其缺乏反映整个婚姻历程及其细节的数据。CFPS的婚姻史模块将回顾性和追踪性设计相结合,全面反映每段婚姻的过去、现在和将来。其对同居、相识方式、配偶信息等数据的收集也为婚姻研究提供了更多可供分析的细节。

在调查中引入认知能力的测试是CFPS的特色之一。目前国内的研究很少使用认知能力这一变量。此处,我们对认知能力测试的内容进行评估,并简要报告使用认知能力变量的初步发现。

以上对经济不平等、婚姻变迁与认知能力三个主题的介绍很好地反映了CFPS数据的研究潜力。更多的数据发现不在此处一一展示,我们希望有更多的研究者能够使用和开发CFPS数据,并据此作出更有意义的研究,得到更有价值的结论。

CFPS是目前中国规模最大和内容最全面的社会跟踪调查项目。为了让广大研究者对该项目及数据有更多了解,本文介绍了该项目的设计理念、实施过程、内容特色,并以个别领域的数据发现为例展现了该数据运用于社会科学研究的潜力。

本文开篇时提到,中国目前经历的这场社会变迁史无前例。社会科学研究者应该客观、全面地记录这场变迁的过程,深入细致地研究变迁的机制和后果,为学术知识的积累和社会的改革与实践作出贡献——这是学者的使命也是时代的使命。收集高质量的社会变迁数据仅是一个开始,而更多的学者能够利用这些数据作出有意义的研究和得到有用的结论才是CFPS的真正价值所在。

注释

3.CFPS的中文曾用名为“中国家庭动态跟踪调查”。该项目由北京大学985项目资助,北京大学研究团队设计,北京大学中国社会科学调查中心实施。

5.CFPS将2010年基线调查界定出来的所有家庭成员及其今后的新生血缘/领养子女视为基因成员。

8.该样本也称再抽样样本或整合样本。5个“大省”未经二次抽样的样本与“小省”样本合并后的总样本称为完全样本。CFPS数据提供了识别再抽样样本的变量。

11.全国完全样本的权数为5个“大省”和1个“小省”共6个子总体的全部样本的权数的合并,全国再抽样样本的权数为5个“大省”经再抽样后的样本的权数与“小省”样本的权数的合并。

13.CFPS2010年基线调查实际样本的规模参考了2008年和2009年预调查所得的预估应答率,采用按应答率比例扩大样本规模的方法,以保证获得预计的有效样本家户数量。

15.计算中排除了219户不需访问家庭的影响。其中,212户为2011年不要求访问的搬迁或疑似搬迁家户,7户为全家去世家户。

16.2011年对访问时不在家青少年基因成员尝试性地使用电访、网访与邮寄问卷相结合的方式进行了异地追访。但由于此部分的数据清理工作尚未完成,本文中关于2011年的联系结果统计均未考虑此部分数据。

17.此处仅计算了面访的追踪成功率(原因参见上文)。计算中排除了1036位不需面访的基因成员的影响。其中,24人为死亡以及调查当年无需访问的出境、出家、入狱、参军的基因成员,1012人为需要异地追访的基因成员。

18.读者需要注意,CFPS追访调查中的“新家庭”(也称新组家庭或另组家庭)是相对于CFPS原有家庭样本而言的。它并不一定是新建家庭,而可能是本来就存在的家庭,由于第一次进入CFPS调查,因而也称为“新家庭”。

19.其中,50665人为原有基因成员(含639位去世人员),1671人为新生/领养基因成员。

20.计算中排除了死亡人员(408人)和出境、出家、入狱、参军四类在调查当年不需要访问人员(40人)的影响。

24.但是,在2010年基线调查的实地访问中,由于没有完全按照原设计执行,T3表中的部分去世人员(尤其是父母)的信息没有被采集。为弥补这一缺陷,我们在2012年的调查中对所有个人问卷的成人受访者补问了其父母的出生年月、教育、职业和政治面貌。

26.此处所列研究发现的详尽分析和解释可参见《中国民生发展报告2013》相应章节。

THE END
1.青年婚恋观调查问卷11. 您觉得婚姻是两个人的事,还是两个家庭的事? A.完全两个人B.两个人75%,两个家庭25%C.两个人50%,两个家庭50%D.两个人25%,两个家庭75%E.完全两个家庭 12. 您对大学生谈恋爱的态度如何? A.大学恋爱是正常的身心要求,无可厚非B.无论结果如何都是一种经历,应该体验一次C.纯洁的恋情,应该有https://www.wjx.cn/xz/247813751.aspx
2.当代青年婚恋观调查问卷您好!非常感谢您百忙之中抽空填写本次问卷调查。本次问卷调查青年家庭中婚姻状况及青年人的婚恋观念,采用不记名方式,您的问卷结果对本调研具有重要意义,请如实填写!由衷感谢您的支持与合作!*1. 您的年龄是? 18岁以下 18~24岁 25~30岁 31~35岁 35-40岁 *2. 您的性别是? 男 女 *3. 你当前的https://www.wenjuan.com/s/vyYVbqZ/
3.《关于青年婚姻生育及家庭观念状况的调查分析报告》4000字.docx关于青年婚姻生育及家庭观念状况的调查分析报告目录 TOC \o 1-2 \h \u 19772 关于青年婚姻生育及家庭观念状况的调查分析报告 1 12024 一、 调查目的 1 13064 二、 调查对象 2 6504 三、 调查方式 2 21090 四、 问卷调查结果 2 12565 四、问卷结果分析 4 20043 (一)结果分析 4 2087 (二) 思考与建议 https://m.book118.com/html/2023/0503/6110101214005123.shtm
4.法律顾问调查问卷16篇(全文)法律顾问调查问卷(精选16篇) 法律顾问调查问卷 第1篇 关于农村法律意识的调查问卷 调查地区:您好!我们是西安医学院、西安工业大学、陕西科技大学法律社团的学生,为了获取真实的社会信息,了解当下农村法律意识的整体情况,开展相应的调查研究,我们将对您进行社会调研,请根据您的实际情况,在横线上填写答案。我们保证为您保https://www.99xueshu.com/w/file4wqo04pk.html
5.质量意识调查问卷模板(精选6篇)三、您对婚姻及家庭的认知 7.对于农村常见的早婚现象,您个人怎样看待? A.正常,当地都是这样的情况B一、问卷调查基本情况 本次问卷调查通过天津市生态道德教育促进会会员单位发放和回收, 调查地点包括天津主要原因是由于一些不法商家利益熏心,不但利用老年人“花钱买健康”的观念,为谋取不正当利益,处处设置https://www.360wenmi.com/f/filejvnaj09v.html
6.问卷问卷(www.wjmgzx.com)为你提供各行各业免费的问卷调查知识,教你多维度多角度设计一张高质量的问卷调查表.http://www.wjmgzx.com/
7.相貌价值观对婚姻质量的影响——基于2017年中国社会心态数据的分析假设6:主观社会阶层调节关系流动性对婚姻质量的影响。 基于上述论述,本文的研究框架如图1所示。 三、变量与研究方法 (一)样本选取 本文研究数据来源于2017年社会心态调查,该调查由中国社会科学院社会学研究所社会心理学研究中心编制,于2016年8月到2017年4月通过智媒云图研发的问卷调研App“问卷宝”向在线样本库的全国https://www.163.com/dy/article/HQBB2GKC0516CCR1.html