②“上山下乡”运动的要求是当时城市在读的初、高中学生及部分滞留在校的初、高中毕业生到农村去上山下乡插队,其中当时滞留在校的初、高中毕业生是“老三届”,具体是指由于“文革”爆发初仍滞留在校的1966届、1967届、1968届三届初、高中毕业学生。
综上,本文基于中国家庭追踪调查数据(ChinaFamilyPanelStudies,CFPS),以“文革”时期的“上山下乡”政策作为青少年成长环境的外生冲击,将经历过“上山下乡”运动的个体在1977年恢复高考中的表现结果作为高压环境产生的特殊认知能力的体现,首先利用工具变量(IV)、断点回归(RD)及断点-差分(RD-DD)的方法来评估青少年在高压环境下的压力价值;其次,在考虑出生季度、地区异质性、多项式阶数的选择等多种情况下进行稳健性检验;最后,探究了激发经历过“上山下乡”运动青少年的特殊识别能力形成的可能潜在路径及历经“上山下乡”高压环境所形成的其他可能优势。
首先构建线性概率模型(LPM)①模型为:
其中,Yi是二值变量,取1表示在1977年恢复高考之后该个体成功考入大学,即获得了高等教育的机会,取0表示该个体未能把握住1977年恢复高考的时机而没有获得高等教育的机会②;UMTCi是二值变量,取1表示该个体经历过“上山下乡”运动,取0表示该个体没有经历过“上山下乡”运动;Xi是指同时影响核心解释变量(即是否有“上山下乡”经历)与被解释变量(即能否抓住1977年恢复高考)的控制变量,这里包括个人特征、家庭特征及教育特征;εi表示随机扰动项。
综上,本文选取出生在1947年9月-1963年8月(即队列1947-队列1962)之间的所有个体作为总体研究样本。其中,实验组是“上山下乡”组(S),即出生在1947年9月-1959年8月之间的个体,意味着该个体被迫长期处于高压的环境下③;对照组是非“上山下乡”组(NS),即出生在1959年9月-1963年8月之间的个体,这些个体虽受到当时整个时局的波动影响,但其生活环境相对稳定。
1.IV的识别策略。
其中Ti是二值变量,取1表示个体在“上山下乡”组中①,取0表示个体在非“上山下乡”组中;Ui是二值变量,取1表示在12岁时拥有的户口状况是非农业户口,取0表示其在12岁时拥有的户口是农业户口。
另外,由前述可知加入农村样本后的估计模型虽在一定程度上缓解了组群偏差,但由于“上山下乡”组(S)和“非上山下乡”组(NS)是以出生队列为划分依据,但两组的个体出生年代差距较大,可能会存在属于年代特征属性的因素混杂其中,从而使得属于时代特征的不可观测因素影响其认知能力及其压力价值。本文的解决思路是,在已有估计方程的基础上加入出生队列的虚拟变量从而排除出生队列效应的影响,并通过“上山下乡”组与城市组的交互项作为工具变量来识别有无“上山下乡”经历对个体能否抓住1977年高考恢复的机会成功考入大学的影响效应,以此来评估高压环境下形成的特殊认知能力所体现的压力价值。那么该IV模型为:
其中,λc表示队列固定效应。值得注意的是,式(3)的估计表达式可以视作是DID的估计形式,其兴趣参数β1是测度青少年时期高压环境下的压力价值,能识别在目标群体②中的平均处理效应(ITT),而不是实际经历过“上山下乡”个体的平均效应。式(3)通过比较“上山下乡”组城乡之间关于1977年恢复高考后表现的差异与非“上山下乡”组城乡之间的关于1977年恢复高考后表现的差异,判断是否经历“上山下乡”会激发青少年某项特殊认知能力,并得到其在1977年的恢复高考后高考表现的差异,从而评估青少年时期高压环境的压力价值。
②基于式(3)的表达式,以DID的估计方法为视角出发,可直观上看出,城镇地区的所有出生队列在队列1958之前的个体都是“上山下乡”政策的目标人群。
2.RD的识别策略
由前述可知,“文革”期间的“上山下乡”运动只在城市地区造成混乱,那么将研究的样本限制在12岁时的户口状况为非农业户口的个体。那么,RD模型的第一阶段估计为:
另外,可能会存在一些个体通过故意伤害自己或者终止学校的学业避免“上山下乡”,那么Ti在断点处很有可能并不是从0到1的严格的跳跃变化,而是增加Ti取值为1的概率。因此,本文采用的RD估计方法是模糊断点回归估计(FRD)。相应地,该RD的简约方程估计为:
由式(4)和(5)可知,该RD模型的估计系数也许会捕捉到断点处与“上山下乡”经历无关的队列效应和同时期发生的大饥荒的影响①,那么RD的估计系数为${\dot\gamma_{RD}}=({\beta_1}+\varphi_c^{{c_0}})/({\alpha_1}+\varphi_c^{{c_0}})\approx{\beta_1}/{\alpha_1}$。由于只有城市受到“上山下乡”的影响,那么在估计RD时只采用城市的样本。
①这里使用$φ$cc0表征断点处的队列效应和同时期发生的大饥荒效应。
3.RD-DD的识别策略
那么,其相应的简约方程的估计为:
1.密度检验
2.先决变量的检验
通过比较IV、RD和RD-DD两部分的估计结果,可发现尽管这三种方法得出的回归系数的真实含义有所差异,但是其基本结论是一致的,充分表明了本文研究结论的可靠性和可信性。也就是,“文革”中的“上山下乡”经历对其在1977年恢复高考后的获得大学入读资格具有1%的统计意义上显著的正向影响,从而证实了高压环境确实能够激发青少年的特殊认知能力的形成。
①由于本文分析的样本有限,根据最优带宽原则选择的带宽已超出本文分析的样本范围,故本文只有通过对不同带宽下的断点附近样本进行局部线性非参数估计。