城乡社区社会管理湖北省协同创新中心研究信息中心

摘要：本文从动态同化(assimilation)的新视角，研究了农民工与城镇职工的工资差距。文章针对该问题特有的数据结构，构建了一种新的非线性工具变量回归方法，对移民工资同化研究中固有的内生性问题进行了纠正。实证结果显示，农民工在城镇每多待一年，其相对工资将增加1.4%。这表明不同初始工资的农民工需要经过10—58年后才能达到与城镇职工同等的工资水平。高学历不会显著增加农民工的工资同化速度，只是增加了其初始工资水平，培训和社会关系对农民工的工资同化速度有显著影响。本文的研究结论表明，农民工不仅初始相对工资低，而且工资同化速度慢，因而在城镇劳动力市场上将长期处于劣势地位。这反映出改善农民工务工环境、消除工资歧视的迫切性。同时，本文也揭示了增加社会培训在农民工中的覆盖范围和加强农民工就业指导服务将对“农民市民化”的进程有极大的促进作用。

关键词：农民工，工资差距，动态同化

一、引言

随着城镇化进程的推进，农民工已经成为城镇地区劳动力市场的主力军之一，是我国城镇化发展进程中不容忽视的一部分。国家统计局的数据显示，2012年全国农民工总量达到26261万人；其中，外出农民工达到16336万人。在这样的背景下，农民工进城后的生存状况日益受到重视。特别地，尽管同处于城镇劳动力市场上，农民工与城镇职工却存在着明显的工资差异。积极推进城镇化，为农民工营造更加公平的就业环境需要全面了解农民工与城镇职工收入差距的现状，深入分析形成该差距的原因。总体而言，上述问题可以从如下两个角度进行分析：(1)从静态的角度来看，农民工与城镇居民工资差距有多大(包括其时序变化)，导致这一差距主要原因是个体差异还是市场歧视？(2)从动态的角度看，农民工与城镇居民的工资差距是否会随着移民持续时间的增加逐渐减小？如果会，又是哪些因素会影响农民工工资向城镇居民工资收敛的速度？

既有的国内研究大多针对上述第一个角度展开：或在既定时点上，或利用多年数据对农民工与城镇职工的工资差距进行计量测度及成因分析。虽然此类研究有助于细致理解农民工与城镇职工的收入差距，但忽略了更为重要的一面，即上述农民工与城镇职工工资差距的第二个角度。它是劳动力市场机会公平和农民工生存环境的测度。它回答了在农民工的生命周期中，是否有可能实现与城镇职工“同工同酬”。也就是说，给定由于教育质量较低等原因导致初始工资低于城镇职工的现实，农民工的工资是否可以通过移民后的人力资本积累等措施逐渐向城镇职工同化(assimilation)，从而最终与城镇职工享受同等的工资待遇？如果在足够的移民持续时间下，农民工能够实现他们的“城市梦”，达到与城镇职工相同的工资水平，这无疑意味着鼓励农民工增加移民持续时间将有益于“农民市民化”的进程。

从实证研究的角度看，上述问题的解答可以基于扩展的明瑟方程。^①具体而言，可以在明瑟方程的基础上加入农民工虚拟变量及移民持续时间，从而允许农民工有区别与城镇职工的初始工资和增长速度(Chiswick，1978)。然而问题的复杂性在于，农民工返乡的决策与影响工资的不可观测的因素(如个人能力等)密切相关，由此产生的样本选择问题会导致移民持续时间这一变量存在内生性，进而导致低估或高估农民工工资向城镇职工工资同化的速度(Hu，2000)。同时，传统的工具变量回归方法在该问题特殊的数据结构下，不仅会严重丢失有效信息，而且第一阶段的回归假设并不符合现实，因此难以解决该内生性问题。针对上述情况，本文提出了一种新的非线性工具变量回归方法。该方法充分利用数据结构与样本信息，通过构建一个计数变量的样本选择模型，得到潜在移民持续时间的无偏估计量，进而获得农民工工资同化速度的一致估计。基于此，本文考察了农民工工资同化速度的主要影响因素。

二、文献回顾

经济学中关于移民的工资同化问题的研究最早可追溯到Chiswick(1978)。他认为尽管与当地居民相比，移民的初始工资较低，但他们将经历快速的工资增长过程，并在10—15年以后最终赶上甚至超过当地人的工资。早期研究主要集中在对工资同化速度(assimilation rate)的准确估计上。如Borjas(1985)提出，利用横截面数据进行简单回归得出的工资同化速度实际上包含了群组效应(cohort effect)：越早期的移民群组其质量就越高，由此估计出的群组内工资同化速度将显著下降。此后，Borjas(1992)又利用美国国家青年追踪调查(National Longitudinal Survey of Youth)的数据证实，尽管内部移民初始工资低于当地人，但是二者的工资差距会在数年内消失。

随后的研究转向对移民工资同化机制的探讨。部分研究指出，移民对于人力资本的再投资是促使移民相对工资增加的主要因素之一。例如，Friedberg(2000)基于以色列的移民数据发现，移民后进行的人力资本投资不仅能增加外地移民的工资，还能增加他们在移民前已获得的人力资本的回报率。由此得到的推论是，移民时年龄越小的人越有激励去进行人力资本再投资，从而获得更高的工资增长率。Wilkins(2003)利用澳大利亚的数据证实了这一推论，发现移民时年龄处于14岁以下的人初始工资最低，而工资增长率最高。另一部分文献则认为移民工资同化机制的现象是由于移民在初期无法找到与自己能力相匹配的工作，只能从事较为低级的职业；而随着对当地劳动力市场越发熟悉，他们能够逐渐寻找到更好的工作，从而获得更高的工资。这部分研究以Chiswick(2005)为代表。他构建了一个移民的职业选择模型，并利用澳大利亚的数据实证得出，随着时间的增加，移民的确会找到更好的工作。Eckstein & Weiss(2004)则将移民工资增长的原因进行了分解，并且发现，人力资本回报率的增加、积累的工作经验的增加以及找到更好的职业是以色列移民工资持续上涨的三个主要因素。

当然，在不同国家背景下，移民的工资同化现象及机制也是不同的。Antecol et al.(2006)对美国、澳大利亚及加拿大三个国家的移民工资同化情况进行了比较，结果发现总体而言，美国移民收入同化现象最为明显，加拿大其次，而澳大利亚则最少；其中，美国移民的收入同化主要是由工资同化引起的，而澳大利亚的收入同化则几乎可完全被就业同化所解释，加拿大则处于两者之间。Lam & Liu(2002)则发现，从1981年至1991年间，香港的移民与当地居民的差距不但没有减小，反而从11.3%增加到了25.5%。对此，他们做出的解释是，香港经济的结构转型导致了对技能偏向型劳动力的需求增加，由此不仅导致不同技能的回报率差距增大，而且使得不同来源的技能回报率同样存在差异。

值得注意的是，Hu(2000)指出，移民回流现象(out-migration)会导致对工资同化速度的估计存在偏差。他根据美国健康与养老追踪调查(HRS) 1951年至1991年的面板数据重新估计了美国移民的工资同化速度，结果发现美国移民的工资的确会随着移民持续时间的增加显著向当地居民同化，然而同化的速度低于基于横截面数据估计出的结果。由于移民的面板数据较为匮乏，因此，关于移民工资同化问题的绝大部分研究(包括上述文献)都坦承无法考虑样本选择问题，更无法对其造成的偏差进行校正。

由上文的分析可以看出，国外探讨移民工资同化问题的文献大多以跨国(地区)移民为对象，基于内部移民的研究并不多。而对于以内部移民，即农村到城市移民为主要移民群体的中国而言，更是鲜有相关研究以其为背景展开。

如引言所述，对于我国农民工与城镇职工工资差异现象的现有研究，基本集中于证实农民工的低工资现象，并进一步探究农民工与城镇职工工资差距的成因。如Meng & Zhang(2001)利用上海市的数据发现，农民工与城镇职工在职业获得和工资收入上有显著的差异，并且这种差异并不是由于二者的生产率不同引起的。王美艳(2005)则指出，总体上城市本地劳动力平均小时工资比外来劳动力高40.74%；并且外来劳动力与城市本地劳动力工资差异的59%是由就业岗位间的工资差异引起的，剩余41%是由就业岗位内的工资差异引起的。邓曲恒(2007)基于CHIP2002年的数据，采用Oaxaca-Blinder及分位数回归分解得出，流动人口的小时工资仅为城镇居民的61.67%；且平均而言城镇居民和流动人口收入差异的60%应归结于歧视，而对处于收入的条件分布最高端的10%人群而言，流动人口与城镇居民之间的收入差距主要是特征效应所致。邢春冰(2008，2009)则指出，农民工与城镇职工的小时工资收入的差异主要是由劳动者的特征差异造成的，价格差异所导致的收入差异仅为10%；在所有的分解结果中，教育水平始终是造成两者收入差距的最主要原因。唯一与本文研究角度相近的是Zhang et al.(2010)，他们对我国的农民工工资同化情况进行了分析，发现农民工与相应的城镇职工的工资差距确实会逐渐缩小。然而，他们的研究并没有对样本选择问题进行校正。因此，他们的估计结果很有可能存在偏误，从而并不能够准确地反映出我国移民工资同化的实际情况。

本文在三个方面对现有文献有所贡献。(1)提供了一个新的视角，从动态的角度来分析农民工与城镇职工的工资差距问题，考察该差距是否会随着移民时间的增加逐渐缩小，并且对影响该差距缩小速度的影响因素进行了深入分析。(2)对于移民工资同化的文献来说，本文不仅以中国为背景进行了新的探讨，而且对以内部移民为对象的研究进行了有益补充。(3)提出了一种新的非线性工具变量回归方法，对此类研究中普遍存在的样本选择问题进行了校正，由此得到了农民工工资同化速度的一致估计。

三、模型设定

(一)基准模型设定

根据文献中的一般做法，我们通过下面的回归方程研究农民工的工资同化问题：

lnwage_i=δ₀Mig_i+δ₁M_ig_i×ysm_i+r₁E_i+r₂E_i2+X_iθ+u_i (1)

其中，wage_i是小时工资；M_ig_i为指代农民工的虚拟变量，M_ig_i=1代表样本为农民工，M_ig_i=0代表样本为城镇居民；ysmi测度了农民工的移民持续时间；E_i代表工作经验；X_i则代表一组影响小时工资的控制变量，包括学历、性别、婚姻状况、省份、民族、家庭中学龄前儿童数量、家中在校学生数量和健康状况。值得注意的是，我们并没有控制样本所处行业的信息，这是由于农民工与城镇居民工资差距随移民持续时间减少的一个重要原因便是农民工能够逐渐进入收入更高的行业(Chiswick et al.，2005)。ui是残差项。

δ₀测度了刚进城的农民工与具有同样控制变量特征的城镇居民之间的平均工资差距，这种差距可能来自于农民工在农村的教育质量低于城镇(Friedberg，2000)，或者农民工进城前的生产技能无法在进城后完全转化成生产力(Borjas，2013)，或者农民工对城镇当地劳动力市场不熟悉，无法找到匹配的工作(Yamauchi，2004)。δ1则衡量了除经验增加引起的工资上涨外，农民工在城镇多待一年，小时工资“额外”上涨的幅度。这种“额外”的时间效应可能来源于农民工进城后的人力资本投资(Eckstein & Weiss，2004)，或是农民工对当地劳动力市场更加熟悉，从而找到更加匹配的工作(Borjas，1992)。因此，δ1反映了随着移民持续时间增加，相对于相同特征的城镇居民，农民工的相对工资增长速度，即农民工的工资向相同特征的城镇居民同化的速度。②根据上述的分析，我们预期δ0为负，而δ1为正。

(二)样本选择问题

在式(1)的设定中，样本选择问题会使得移民持续时间(ysm)与影响工资的不可观测的因素(个人能力等)存在相关性，从而使得移民持续时间内生，导致模型估计存在偏差。一方面，个人能力较低的农民工收入水平也较低，这可能使得他更快离开城镇返回农村。这意味着Cov(ysmi，ui)＞0，那么OLS估计得到的工资同化速度将大于真实值(Hu，2000)。另一方面，个人能力较高的农民工能够在较短的时间内在城镇积累足够的资本，从而选择回乡工作或是创业；同时进城务工的农民工并非农村居民中能力最高的那部分劳动者(Zhao，1999；Knight & Song，2003；Guan g &Lu，2005)，这将引起移民持续时间与个人能力的负相关，即Cov(ysmi，ui)＜0，从而使得OLS估计得到的工资同化速度小于真实值。

解决内生性问题的一般做法是寻找合适的工具变量，采用两阶段最小二乘法(2SLS)进行参数估计。假设Z1i为一组与ysmi相关，但与ui不相关的外生变量。定义Zi=(Z1i，Ei，Xi)。根据两阶段最小二乘原理，在第一阶段回归中先将ysmi表示成Zi的函数：

ysmi=g(Zi)+ζt

其中，g(·)是一个关于Zi的函数，ζi是残差项。真实的农民工工资同化速度可以通过以下第二阶段的回归估计得出：

lnwagei=δ0Migi+δ1Migi×g(Zi)+r1Ei+r2Ei2+Xiθ+ui (2)

在两阶段最小二乘回归中，g(·)通常是一个线性函数。

然而，在我们的问题中，使用传统两阶段最小二乘将面临如下问题。首先，内生变量ysm仅定义在农民工群体上，对于城镇劳动者而言，ysm取值为0。因此对城镇居民样本而言，第一阶段回归缺乏明确的经济含义。其次，只使用农民工样本估计g(Zi)将严重丢失有效信息。将农村个体的样本(包括农民工样本与农村居民样本)看作一个整体，到城镇工作的农民工实际上是农村居民群体的一部分。这意味着对g(Zi)的估计实际上也必须考虑样本选择问题：仅对于目前在城镇打工的个体我们能够观测到其移民持续时间，而对于未外出打工或是已经返乡的个体我们无法观测到其移民持续时间。最后，对g(Zi)进行线性设定的假设也与现实不符：在数据中，农民工的移民持续时间ysm是一个取整数值的计数变量(count data)。

为解决上述问题，本文从一个新的视角寻求ysm内生性的解决方法。考虑不存在样本选择时的理想情况，此时ysm是任意一个农村居民在城市务工的潜在持续时间。它的一个无偏估计是具有相同个体特征的农村居民群体(包括农民工)在城市务工的预期持续时间：^③

如果能得到，可以在式(1)使用代替ysm。由于此时不存在内生性问题，最小二乘估计就可以得到参数δ₁的一致估计量。具体而言，本文解决内生性问题的方法是：在第一阶段使用农村居民和农民工数据，估计一个计数变量的样本选择模型，进而获得给定观测变量Z下农民工进城务工的预期持续时间；然后在第二阶段回归中使用代替ysm，使用普通最小二乘估计式(1)获得参数δ₁的一致估计。

上述方法实际上是将传统两阶段最小二乘估计中第一阶段的线性回归用一个非线性模型代替，同时根据本文的研究目的使用了不同的样本构成。该方法与传统两阶段最小二乘相比具有如下两个优势：(1)充分利用可获得的样本信息，考虑了样本选择问题，保证了结果的有效性；(2)第一阶段回归获得的内生变量预测值不仅有统计意义，更重要的是具备了明确的经济含义，使得后文对实证结果的解释清晰明了。这是本文在实证方法上的创新之处。

作者： 西南财经大学经济与管理研究院陈珣西南财经大学经济学院徐舒 来源： 《经济研究》2014年第10期