摘要:农业农村农民问题是关系国计民生的根本性问题,是社会科学研究中国发展最显著的解释变量。三农社会科学研究要立足中国本土、乡土或城乡空间,遵循“八股”范式。即围绕科学理论和三农实践需求提出问题,展开文献综述、找出“文献缺口”,基于理论框架分析构建假说,对应框架内容确定素材,脚踏实地进行资料采集,使用实证研究方法,得出具有稳健性的结论,进行三农政策设计。扎实地学习中国国情,借鉴世界先进的研究方法,讲述好中国故事,可以作为新时代三农社会科学研究者共勉的技术路线。
关键词:三农问题;社会科学范式;实证研究;方法论;
哲学社会科学是人们认识世界、改造世界的重要工具,是推动历史发展和社会进步的重要力量。作为认识和改造经济社会现象的科学,社会科学中被解释现象的重要程度及其影响直接决定了理论解释对社会的贡献。农业农村农民问题是关系国计民生的根本性问题,是解释中国发展最显著的解释变量。农业是人类衣食之源、生存之本,中国是世界第一人口大国,14亿人民的衣食住行和自然休闲活动需要依靠农业;农村在空间上占国土面积最大,农用地与非城镇的建设用地之和为674.79万平方公里,这就意味着广大农村地区占中国国土面积70%以上;在广大农村地区生活着5.90亿人口,即便将来城镇化率达到70%,届时仍将有4亿多人常住在农村。以国民经济中的重要地位、空间规模和人口数量论,三农社会科学研究在社会科学中也应当具有重中之重的地位。
也就是说,为什么要做这个研究研究意义的提出非常重要。农业农村领域的社会科学研究,是在中国三农发展实践基础上凝练具有一定普适意义的科学问题加以研究,增添经济、政治、文化、历史、社会、法律等大学科在农业农村场景下的应用。例如,三农经济问题研究,就是要不断丰富农业经济学、发展经济学、制度经济学、劳动经济学、环境经济学、资源经济学等细分学科的知识体系。
整个叙事的背景,要有比较高的站位。习近平总书记要求哲学社会科学工作者要“立时代之潮头,通古今之变化,发思想之先声”。对整个科学研究的背景,国家自然科学基金委员会提出“六期叠加”的概念:即全球新科技革命和产业变革的历史交汇期、中国经济和产业提质增效升级的全面转型期、国家发展跨越中等收入陷阱的战略突围期、创新型国家建设的关键决胜期、科技体制和创新体系的深度调整期、基础研究从量变到质变的重要跃升期。黄宗智和彭玉生(2007)将整个农业农村发展面临着的三大历史变迁概括为,即农村人口大规模非农就业,城乡人口自然增长减慢,农业生产结构转型及食物消费结构升级。如果具体到“十三五”“十四五”交汇这一个小时期,那么就是“两个百年目标”交接、精准脱贫与乡村振兴衔接、农业供给侧结构性改革深化等“五期交汇”。
文献综述是惯常的叫法。实际上,叫做“文献评述”更为合适,因为文献回顾要做述中有评。新闻需要“综”述,而文献需要“评”述。文献评述的一般步骤是选择主题、文献搜索、展开论证、文献分析、文献批评、评述撰写。
文献主题的选择实际上是有公式可以遵循的。公式很简单,就是y=f(x)。y为因变量文献;x为自变量文献;f为“求解”即研究思路的文献。例如:研究的题目是《农业补贴对农户生产经营行为的影响:基于农户模型的实证分析》,其中,“农业补贴”就是自变量,“农户生产经营行为”就是因变量,“农户模型”和“实证分析”就是求解,可以围绕上述主题分解来搜索文献。
建议用Noteexpress或Endnote等文献管理软件来整理文献,这样做最大的好处是能形成大量的长期性文献积累。这些文献管理软件都可以在Word当中加载插件,很方便地实现文档中插入格式化的参考文献信息,并且可以根据文献发表或提交的取向进行自动化修改。高校和科研机构图书馆一般都会提供中国知网、Elsvier、Jstor、Wiley-Blackwell等文献数据库的查询。国家图书馆也可以提供每天一定数量的中外文献下载。上述文献数据库都会提供文献管理格式文件的下载,可以很方便地导入数据库。
黄宗智先生给青年学者的读书建议中提到:第一步,阅读文献的摘要、论文的引言、专著的第一章或导论;第二步,阅读论文的结论、专著的最后一章;第三步,快速阅读中间部分,专著的每一章也可以按照这样的顺序阅读;第四步,一句话提炼核心观点;第五步,记录如何连接理论与经验证据。实际上,真正掌握一篇好的文献,还可以想办法再现研究的过程,进行“逆向工程”。例如:对于值得参考的消费行为、公司财务等领域的实证研究,可以把研究方法等套用到三农社会科学的某一主题。
理论框架要沿袭研究范畴、研究范式与学术传统。以农业经济学为例,近年来倾向于用产业组织理论研究范式来分析农业生产与市场,或者以发展经济学研究农村发展问题,或者采用动态优化模型研究农业农村资源环境。在理论框架分析的基础上,一般会提出假说来揭示变量之间的因果关系。这一过程需要内部逻辑自洽,而且理论及其推论必须经得起经验证据的检验。理论框架要取得逻辑自洽,必须依靠理论分析。这对研究者的理论功底要求较高,需要培养深厚的经济学、社会学、管理学素养。
研究假说和研究假设是完全不同的两个概念。假说(Hypothesis)是要验证的问题,例如诱致性制度变迁假说等。假设(Assumption)则是分析的前提和基础,如经济学中理性人假设等。实际上,假说推导而出的前提是假设。
某些情况下,研究框架用数学符号、公式推导证明等方法来表述三农各变量之间的关系。一个比较简单的例子是柯布道格拉斯生产函数,Q=AKαLβ,两边取对数可以得到:logQ=logA+αlogK+βlogL。这样就可以说资本和劳动力投入对产量的影响是正向的。而且,用资本和劳动力解释之后,还会剩余有一部分变化,可以用技术进步等去解释。上文提到的陆铭的文献,就是一个典型的数理经济学比较静态分析得出研究假说的例子。
某些情况下,研究框架用学理性的图形分析来构建。例如,在经典的农户模型分析中,一个简单图形分析就分析出了农户在农产品消费、其他产品消费和闲暇之间做选择的过程。实际上,关于农户模型的分析,更为详尽的要数中岛千寻对农户模型多维度的分析。
还有些情况下,研究框架用语言逻辑演绎来构建。例如,林毅夫根据威廉姆森、诺斯、速水和拉坦的诱致性制度变迁假说,提出理论命题,主要是农村要素市场这个制度的发育与农户边际产值差异有关。然后从这个理论命题中演绎出明确的假说,农户家庭劳动力、土地、资本增加,其劳动力、土地市场供给增加,雇佣劳动力、租入土地、租用机械和畜力的需求相加。顺带着,林毅夫还用Hausman检验验证了技术的内生性,直接把计量经济学和技术内生性连接了起来。
一般而言,理论框架里面要把意欲验证的符号“正负”讲清楚。但是,也可以说得比较模糊。甚至,部分研究可以把两个或更多竞争性假说放在一起。如彭玉生在研究宗族网络对企业创业及发展影响时,根据逻辑演绎的第一个假说相对比较清晰,宗族网络有助于私营企业创业与发展;第二个假说则是建立两个竞争性的假说,假说2a:宗族网络有助于集体企业的发展;假说2b:宗族网络无助于集体企业的发展。最终,实证研究验证的是假说2b,宗族网络既无助于集体企业创业,也与集体企业壮大没有显著关系。
根据研究主题来确定统计指标的有用性,无论研究的主体部分使用何种素材,各类统计年鉴和数据库提供的数据总能够在交代背景、提出问题等方面发挥不可取代的作用。诸如《中国统计年鉴》《农业统计年鉴》《农村住户调查年鉴》《农产品成本收益调查资料》、国研网、中经网、国泰安、农业普查综合资料、人口普查与抽样调查资料、经济普查资料、各类价格调查材料,等等。此外,省(自治区、直辖市)也有统计年鉴,县(市、区)也有自己的统计年鉴。
统计年鉴的数据总是有不能覆盖研究所需的所有变量,那么研究者自行组织的调查因其灵活性,成为可以选择的一个方式。实地调查研究可以形成案例资料,也可以形成供定量分析的数据库。
信息化发展给三农社会科学研究带来了一系列机遇和挑战。研究所依据的资料,更加具有样本量大、实时性、多元性、完备性等特征。但是三农社会科学研究者,要以脚踏实地的研究为己任,还是需要坚持进村入户的调查。通过“下村看实际,入户话家常”,发现趋势性苗头性的问题,掌握更为纵深的信息,是必须坚持的研究方式。
实证方法是连接经济学理论与经验证据的工具,必须基于理论和经验证据的连接,才能得出结论。第一个需要明确的是,方法只是工具,现实问题、经济学理论、经验证据才是研究的本体,不能陷入“为了方法而使用方法”的怪圈。即便并不是进行严谨的学术研究,学习各种社会科学研究方法,并正确地使用它们,也将掌握认识世界的工具,从而有利于从事各种工作。第二个需要明确的是,各种经济学研究方法并没有孰优孰劣之分,不能因所谓的“技术含量”“逻辑层次”等,而歧视任何一种研究方法。实际上,各种研究方法经常综合交叉应用,形成对彼此的补充。
通过对三农领域某一主题有关历史资料进行科学的整理和分析,详尽描述其历史沿革、如何发展到现状,并就这一主题对农业生产、农村发展、农民经济社会行为变迁进行研究。农村改革每到一个标志性的节点,都会有一系列回顾性的文献问世。例如,根据改革40年的经验,可以发现农村制度创新、农业技术进步、农产品市场化改革和农业生产力投入是农业增长的主要驱动力。[24]历史分析方法的形式通常有两种:一种是对一段历史时期的某一方面的农业农村制度、制度绩效等进行全面描述和整理,结合制度经济学、农业经济学等理论进行分析,这种研究多见于对建国以来或改革开放以来的研究;另一种则是对某一农业方面的问题及其影响进行深入历史分析,这种研究更多地见于历史学方面的著作。例如,黄宗智的两本著作《华北的小农经济与社会变迁》和《长江三角洲小农家庭与乡村发展》都有针对农村商品化及其与农村发展关系的分析。
结合三农研究实际,以典型案例为素材,并通过具体分析、解剖,展现特定的情景和过程,建立一种“实践感”,从而寻求解决问题的方法。在很多社会科学研究中,研究者几乎无法对研究对象进行控制,只能对具体的情景材料进行收集整理,所以案例分析在这种情况下尤为重要。实际上,案例研究经常作为定量研究的先导或者稳健性检验。[26]而且,案例研究中也会用到一些定量的描述。然而,很多情况下,案例研究本身就能形成一个完整的社会科学研究。案例研究不一定是针对一个个案,也有可能是多个个案的比较研究。例如,研究中国农村城镇化进程中的改革问题,就需要对多个案例分析,从而检视区划、土地、行政和户籍政策,并从改革试点中得出“撤乡并镇”“以地换地”“股份合作”“人口搬迁”等经验与启示。[27]三农研究中经常写的调查研究报告就是案例研究方法的一种应用。
统计图表就是典型描述性统计方法的应用。描述性统计方法一般会与其他研究方法相结合,在使用计量模型分析之前,往往会对使用的变量进行描述性统计。最起码,应当展示变量的均值和标准差。常用的统计学指标包括均值、方差、标准差、中位数等,可以求助于任何一本统计学教材。根据研究需要,研究者可能还会构建自己的一系列描述性统计指标。例如,CR4是行业前四名市场份额集中度指标,勒纳指数和赫芬达尔—赫希曼指数可以用以度量农产品或农资市场中垄断力量的强弱。近年来部分文献对农产品流通的各个环节进行描述性统计分析,研究诸如利润分配、流通费用的问题,也对政策有重要的指导意义。
习近平总书记在哲学社会科学工作座谈会上指出:“对现代社会科学积累的有益知识体系,运用的模型推演、数量分析等有效手段,我们也可以用,而且应该好好用。”当前,应用计量经济学模型研究三农社会科学问题的文献可谓汗牛充栋。本文的篇幅依然有限,穷尽不了所有的数量分析方法,仅仅做一个抛砖引玉。虽然经验研究总是有这样或那样的局限性,但经验研究还是规范化的标志。立足中国现实,用现代方法研究中国问题,用国际语言讲述中国故事,三农社会科学研究仍然任重道远。
违背回归分析的几个经典假设会相应地派生出很多新的方法。
奇异值的英文名字非常有意思,叫做outlier,字面翻译是“躺在外面的那位”。但是,这个“躺在外面的那位”却经常导致估计的系数不稳定。近年来普遍的现象是受过大学教育的人回乡创业,假设他从事了粮食生产,那么在控制其他规模性的变量之后,他还是难以获得比较高的收入,于是这个奇异值就导致教育的系数偏小。处理奇异值的方法有三种:第一种比较简单,观察数据结构,将奇异值删除,比较极端的是对自变量进行截尾处理,如将最大的1%和最小的1%全部删除。但是这是万不得已的选择,因为奇异值的产生可能反映了一种社会科学现象,例如受过高等教育的人回到农村从事农业生产。第二种是进行缩尾处理。例如将落于如1%分位点到99%分位点之外的观察值分别替换为1%和99%分位上的数值。第三种,也是比较好的办法,是稳健回归,很多计量经济学软件,例如stata可以很简单地实现。
回归经典假设之一是回归模型中的残差必须相等。否则,t检验会没有意义,而且模型的预测作用也会遭到破坏。比较常见的异方差处理方法是加权最小二乘回归,即将因变量赋予某一个权重,例如用因变量除以一个自变量等。
在回归分析中,如果将非线性关系误当做线性关系来估计,那么会得到错误的回归系数。因此,在回归分析之前,做自变量和因变量关系的散点图就尤为重要。常见的处理方法是将自变量取对数,有时候因变量也会取对数。如果回归方程两边都取了对数,那么估计的系数也就被赋予了弹性这一经济学意义。有些情况下,也会对自变量取平方等,也就意味着因变量与自变量的关系出现了“U形”或者是“倒U形”。
(2)两阶段最小二乘法。简单一点描述,就是将工具变量方法推广到了多工具变量的阶段。
(3)双重差分法。或称倍分法。在某项农业政策效果分析中,这一方法经常使用。有时候,简单的双重差分法实际上就是设置交乘项,对该变量的系数进行估计。例如,研究户籍制度改革对农村劳动力流动的影响,可以根据户籍改革省份不同的推进年份设置交乘项,从而估计户籍制度改革的影响。
(4)倾向值匹配法。在政策效果分析中,这一方法也比较常用,通过对各观察样本特征进行分析,将最为相似的样本匹配在一起,通过对享受政策与否的样本进行比较,得出政策效果。实际上,目前为止最趋向完美的倾向值匹配法可能就是同卵双胞胎数据。因为同卵双胞胎在家庭背景、颜值、智商甚至大部分后天能力等方面是比较相似的,因此,使用这样一种“近乎完美的”倾向值匹配后的数据进行回归,可不用担心遗漏变量造成的内生性。中国学者最早使用过同卵双胞胎数据,分析教育差异对收入的影响。
(5)断点回归。前提是识别一个断点,例如测算新型农村社会养老保险的影响,如果只有年满60周岁的参保人才能够领取养老金,那么60岁就是断点。当然由于政策执行严格的程度,这个断点也有可能是“模糊断点”。
(6)合成控制和回归控制。例如,研究撤县设区的经济影响,构建的假说是:撤县设区增加劳动力转移就业的机会,这样就可以选择一个近期撤县设区的“A区”,用其他与其状况相似的没有撤县设区的县的特征,用主成分分析合成或回归分析方法拟合出来一个“A县”,比较这个“实际存在的A区”与“合成的A县”二者在劳动力转移就业上的差异。
(7)面板数据分析。这对数据要求较高,必须获得连续多年的追踪数据,而且很多农业经济变量年际之间差异较大,所以这一方法使用的前提是获得高质量连续多年的追踪数据。通常的情况下,经济学的分析中,选择面板数据固定效应模型的较多,这是因为随机效应经常出现有偏估计。
在农产品流通的实证分析中,经常遇到这样的因变量,其取值大量为零。例如:一个农产品加工企业可能大量出口,也有可能不出口,那么这就导致因变量大量为零,本来这需要使用受限因素模型——Tobit模型。[35]但是,企业出口可能有自选择效应和内生性,因此,就需要选择性模型——Heckman模型。该模型实际上是进行了两阶段的估计,仍然以农产品加工企业是否出口为例,第一个阶段解决是否出口的问题,第二阶段解决出口多少的问题。如果上述第一步,由“是”“否”变成了大于两种选择,例如有的企业只做内销,有的企业出口到欧美,有的企业出口到日韩,有的企业选择第三世界国家市场。那么,就可以选择多元选择性偏误修正模型。
分位数回归提供了对解释变量和被解释变量的分位数之间线性关系的估计方法。例如,在分析农村人居环境质量的时候,有些自变量,例如村庄规划,对于农村人居环境质量较低和较高的村庄促进效果存在差异。分位数回归可以衡量出这种差异。
将研究对象进行随机分组,同时对对照组和试验组实施不同干预并比较干预效果。社会科学里面很难做实验,但是20世纪90年代中期,随机试验法开始在发展中国家被应用于政策评估。2019年诺贝尔经济学奖就是授予经济学随机试验方面的前沿经济学家AbhijitBanerjee、EstherDuflo和MichaelKremer,以表彰他们“在减轻全球贫困方面的实验性做法”。
在机器学习这个大门类下,Lasso系列的惩罚回归在分析高维数据上具有优势,决策树在预测方面效率较高,支持向量机是比较优秀的分类器,随机森林可以用于模型变量选择,等等。在大数据和人工智能的时代,三农社会科学研究者需要紧跟时代,强化学习,克服“本领恐慌”。
结论部分一般就是证明或者证伪假说,从而对理论框架进行验证。很重要的一步是稳健性检验。如果几种研究方法综合应用结论“打架”,甚至得出与中国现实不符的结论。那么,必须回过头去求助于社会科学理论,或者检视研究方法是否应用正确,或者寻找新的经验证据。稳健性检验之后的文字性的结论,实际上是很简要的。主要目的在于重述整个研究,强调一下研究的贡献,指出一些研究的未尽之处。
建立竞争性的假说,或者使用不同的方法,来检视一下结论是否仍然成立。经验研究中,可能稳健性检验要占到很大的篇幅。计量经济学分析来进行稳健性检验,需要尽可能引入控制变量,使用各种方式减轻内生性影响。或者换一种方法,也就是说第六股中的研究方法都可以用于稳健性检验。还有一些常用的稳健性检验方法,包括剔除样本、替换变量、变换样本、工具变量、距估计方法,等等。实际上,具有典型意义的案例、全国或更大范围的统计数据、来自其他国家和地区的经验等,也可以作为稳健性检验的手段。
这个研究提出了一个什么样的问题,围绕这个问题本研究在文献体系中的地位如何,或者找出了哪些文献缺口。为此,本研究设定了什么样的研究目标,构建的是什么假说。为了研究目标设计研究内容,构建理论框架,对应着研究内容需要什么样的素材,采集哪些数据和资料。对应于数据和资料采用一系列怎样的研究方法,得到什么样的结论,而这些结论又具有什么样的意义。实际上,有时候结论部分容易写成摘要。区别在于,摘要更加简洁,结论可以发挥的篇幅略大,而且经常要引发今后的研究。马克思主义认识论告诉我们,认识要螺旋状上升,即调研生发问题,文献校准问题,实证得出结论,再调研校准结论并生发新的问题。实际上就是,行万里路,读万卷书,写万言文,不断地循环这一个过程。
政策设计是三农社会科学研究学以致用的体现。在当代中国亟需完善制度顶层设计和政策分层对接的背景下,由科学规范的研究得到科学的结论,为政策设计提供决策参考,甚至可以作为研究的主要目标之一。
研究结论推导不出来或者引申不出来的政策启示不要体现。例如,上文提到的,我们发现村庄规划对人居环境质量影响是正向的,那么一条政策建议就可以是“完善村庄规划,促进人居环境质量提升”。但是,如果得出“村庄规划中提出未来20年的明确目标,能够促进人居环境质量提升”这样的政策建议,虽然有一定的道理,但是并不是实证研究结果明确发现的。
实地调研的重要性就凸显出来了。例如,“发动和依靠群众,坚持矛盾不上交,就地解决”的“枫桥经验”,就写入了十九届四中全会《决议》。实际上,当下的农村改革试验有很多。很多案例和综合的素材,可以用社会科学研究方法来集成研究,之后提出来有意义的决策参考、示范经验,为政策分散风险、分解困难。
可计算一般均衡模型或局部均衡模型为我们提供了有力的动态分析工具,模拟的情景经常包括不同的经济增长速度、不同的城镇化速度,实际上政策设计也可以作为一种情景放入这种“大模型”进行预测。
习近平总书记在哲学社会科学工作座谈会上指出:“要按照立足中国、借鉴国外,挖掘历史、把握当代,关怀人类、面向未来的思路,着力构建中国特色哲学社会科学,在指导思想、学科体系、学术体系、话语体系等方面充分体现中国特色、中国风格、中国气派。”这就告诉我们,要扎实地学习国情,培养对中国问题的敏感度。然后创造一切条件,踏实学习社会科学研究方法,进而研究中国的问题,讲述好中国故事。从历史和现实、理论和实践相结合的角度深入阐释如何坚持中国道路、弘扬中国精神、凝聚中国力量。7这也是新时代三农社会科学研究者值得共勉的技术路线。
(作者彭超系农业农村部管理干部学院乡村振兴研究中心主任、研究员;朱守银系中共农业农村部党校副校长、农业农村部管理干部学院副院长、研究员;朱信凯系中国人民大学党委常委、副校长,中国人民大学农业与农村发展学院教授、博士生导师,长江学者特聘教授)