CFPS在2012年和2016年使用的B套问卷包含记忆测试和数列测试,这套问卷的设计原型来自于美国健康与退休调查(HealthandRetirementStudy,HRS)。在记忆测试中,访员给受访者读出10个在生活中常见的词语(山、米饭、河流等),受访者在听完全部10个词语后立即回忆访员读出的词语,此次回忆所得分数称为即时记忆得分。再过五分钟后,访员会要求受访者再次回忆刚才听到的10个词语,此次回忆所得分数称为延迟记忆得分。在计算得分时,答对的词语总数为记忆得分,不对回忆词语的顺序做要求。
Q:我下载的Stata数据打开为何会出现乱码?
A:x项目组在2019年末更新了数据平台的所有数据集,除2011年为Stata13版的数据,其他数据均为Stata14版本。
Q:为何2014年数据库里没有“金融知识”模块的数据?
A:“金融知识”模块的内容属于合作单位的搭车模块,应合作方要求延期发布。
Q:为何某变量出现大量的“-8”(不适用)?
Q:多选题对应的变量如何理解?
A:例如2010成人卷的qa7“您参加了以下哪些组织”,该问题包含14个备选项(可多选),故设置qa7_s_1-qa7_s_14。其中,qa7_s_1为用户选择的第1个组织,qa7_s_2为用户选择的第2个组织,其他选项依次类推。
Q:问卷中“过去12个月”与“过去一年”的提问有什么区别?
Q:问卷中有自答、代答、面访、电访多种问卷,为何在数据库中找不到代答和电访的某些变量?
A:CFPS发布的数据已经经过清理,我们会综合考虑自答、代答、电访、面访的问卷问题统一相同问题的变量名,一般会优先采用面访自答的变量名。
Q:家庭关系库样本数量为何大于成人库于少儿库之和?
A:在实地调查中,由于被访者拒答或者其他原因可能造成没有个人问卷的情况,故家庭库样本数与成人和少儿之和不相等。
Q:为何同一个pid会在不同的家庭里出现?
A:这种情况只会在2012年及之后调查的家庭关系库中出现,说明受访者与原家庭经济上独立,归属到另一个家庭了。详细情况可以查看CFPS2012的清理报告。
Q:家庭问卷中,如何确定户主?
A:CFPS中每个样本的家庭成员都是同等的,没有户主的概念。研究者可根据特定的研究需要结合数据库中的其它变量进行相应的处理。
Q:我在网上看到了2008、2009、2010、2011、2012、2014年的数据,为什么没有2013年的数据?2015年的数据何时发布?
小贴士1:如何快速找到需要的变量
地址:北京大学理科5号楼四层总机:(010)62767908电子邮件:isss.cfps@pku.edu.cn