摘要:文章运用面板数据模型以31个省(市、区)为研究对象,分析1998—2012年间旅游业发展水平、工业化及城镇化的空间关联性,探讨在全国城镇化进程中旅游业发展、工业化增长对城镇化建设的作用。结果表明:城镇化与旅游业发展水平、城镇化与工业化之间存在长期均衡关系;在滞后期为2时,工业化、旅游业发展水平为促进城镇化建设的原因,城镇化的完善又能进一步推动工业化与旅游的发展。由此建立面板数据回归模型,模型显示:1998—2012年各省(市、区)工业化、旅游业发展水平对城镇化的促进作用呈现出明显的地区差异,所以各个省(市、区)应该采取不同的产业政策促进城镇化的建设。
关键词:城镇化,旅游业发展水平,工业化,面板数据模型
0 引言
目前,加快经济发展推进城镇建设成为我国重要任务,城镇建设需依靠产业经济发展和结构升级,工业作为第二产业的支撑产业,旅游业作为第三产业的重要组成部分相继成为国家研究和发展的重点,相关部门和学者也开始着眼于论证工业与城镇化,旅游业与城镇化的关系。现阶段学者的研究大多集中在工业发展与城镇建设或者旅游发展与城镇建设方面,而对城镇建设与工业发展,旅游发展三者的关联研究还有待深入。为此,本文运用计量经济学理论,以31个省(市、区)为研究视角,通过单位根检验、协整检验、因果关系检验,最终构建新型城镇化与工业化以及旅游业发展水平的面板模型,研究工业化、旅游业发展水平对城镇建设的促进作用,并进一步分析不同地区工业化、旅游业发展水平对城镇化贡献的空间差异性。
1 数据和方法解析
1.1 数据来源
本文采用原始数据包括省(市、区)城镇人口和总人口、省(市、区)第二产业生产总值和国内生产总值、省(市、区)旅游总收入,这些原始数据来源于的《中国人口统计年鉴》、《中国旅游统计年鉴》、《中国工业统计年鉴》以及各省的统计年鉴和统计公报等。
本文选取的指标为城镇化、工业化、旅游业发展水平,这三个指标的数值是由所查找的原始数据计算得来的,三个指标的计算过程如下:
本文用城镇人口比重来反映城镇化水平,这也是当前关于城镇化研究中最常采用的指标,城镇化指标记为czh。
计算公式为:czh(城镇化)=省(市、区)城镇人口/省(市、区)总人口数。
现阶段普遍认为工业化即工业产值的提高及工业从业人员的增多,因此本文用第二产业生产总值占GDP的比重作为体现工业化发展水平指标记为gyh。
计算公式为:gyh(工业化)=省(市、区)第二产业生产总值/省(市、区)国内生产总值(gdP)。
本文采用旅游业总收入与gdP的比值作为旅游业发展水平的解释性指标,旅游业发展水平指标记为lyfz。
计算公式为:lyfz(旅游业发展水平)=省(市、区)旅游总收入/省(市、区)国内生产总值(gdP)。
1.2 面板数据模型
面板数据和时间序列数据一样,构建模型之前为了证明模型估计的有效性和获取更全面的样本信息,需要首先对数据进行单位根检验、协整检验和因果关系检验。
1.2.1 面板数据单位根检验、协整检验与因果关系检验
面板数据单位根检验本质是数据的一阶自回归过程,数学表达式如下:
i代表个体,t代表观测期,Zit为外生变量,Vi是外生变量的回归系数,Pi是自回归系数。
如果所检验的数据为同阶平稳的序列,则可以进一步进行协整检验,协整检验不同于VAR模型,它是一种静态的检验,协整检验有两种方法分别是一步法和两步法,一步法即面板数据Johansen协整检验,两步法即首先Engle检验然后在此基础上对Engle检验残差进行单位根检验,两种方法的目的为检测变量间是否存在长期的静态协整关系。
若数据通过协整检验,则可通过格兰杰因果检验确定变量之间的因果关系及影响方向,这里的因果关系是从统计角度而言的,即通过某一类的分布函数或者数据的概率值展现:在系统环境和其他影响Y变量的因素不变的前提下,假如一个变量A发生了变动,另一个变量B也随之发生变动;或者说如果A保持不变,B也保持不变,那么我们便可以说A是B发生变动的原因,Granger检验可以通过eviews软件进行,检验结果用F-统计量来分析检验A的滞后值是否显著影响B;如果影响F检验的P值不显著,则A不是B的“格兰杰原因”,如果P值通过检验即影响显著,确定A是B的“格兰杰原因”,以此步骤检验A是否是B的格兰杰原因,如果两次都通过检验那么变量A和B则互为因果关系,如果两次都不通过检验,那么两者之间不为因果关系。
1.2.2 面板数据模型估计
面板数据模型构建时需要考量解释变量的系数和截距项,根据这两方面的不同,面板数据的模型可分为3类:变系数模型(不同截面成员的解释变量前系数不同)、变截距模型(不同截面成员截距项不同)和混合回归模型(不同截面成员解释变量前系数和截距项是相同的),对于变截距模型和变系数模型其中根据个体影响的不同形式,可将变系数和变截距模型分为固定效应模型和随机效应模型。
模型形式设定检验过程:F检验确定面板数据模型,在确定面板数据模型的基础上分析选用哪种个体影响形式。
F检验原理:假设H0:该模型为解释变量的系数对截面成员不变但是截距变化的模型即变截距模型;假设H1:该模型为截距变量的系数与截距项对截面成员都不变的混合回归模型。F统计量:
其中T为每个截面上的样本观测时期数,M为截面的个数,W为非常数项解释变量的个数,X1、X2、X3分别是变系数模型、变截距模型、混合回归模型的回归残差平方和。
模型选择检验过程:由eviews软件得到X1、X2和X3,代入公式(2)、公式(3)得到统计量F2、F1;根据查找5%检验水平的F统计表得到F2与F1的临界值,若统计量F2小于给定检验水平下F分布临界值,则不能拒绝假设H1,且无须.再检验原假设H0,说明选用混合回归模型是合理的;否则,拒绝原假设H1,并进一步比较统计量F1与其临界值,若统计量F1小于给定检验水平下F分布临界值,则不能拒绝原假设H0,说明选用变截距模型是合理的;否则,拒绝原假设H0,并采用变系数模型。
2 实证分析
2.1 单位根检验
依据自回归系数的不同,面板数据各截面序列既可能存在相同单位根也可能存在不同单位根,所以需要分别进行检验,相同单位根过程下的检验一般采用LLC检验方法,不同单位根的检验方法有IPS检验、Fisher-ADF检验、Fisher-PP检验等。为提高单位根检验结果的可靠性,对面板数据变量城镇化(czh)、工业化(gyh)、旅游业发展水平(lyfz)采用以上4种方法进行单位根检验,检验结果如表1所示,lyfz、czh、gyh的P值在五种检验方法下均小于0.01,即在1%的置信水平下通过检验,拒绝原假设:序列至少有一个单位根,即变量均平稳,也即lyfz、czh和gyh是平稳的,可以对他们进行协整检验。
2.2 协整检验
单位根检验表明czh、gyh、lyfz变量序列都是0阶单整序列,为了避免出现伪回归,需要进行协整检验,判断lyfz、czh和gyh两两之间是否存在长期均衡关系,只有存在协整关系的两个序列,建立计量经济模型才能避免伪回归。运用Kao检验、Pedroni检验、Johansen检验对各省的城镇化、工业化、旅游业发展水平进行协整关系检验。Kao检验下:城镇化与旅游业发展水平的协整系数P值为0.0000表明在1%的水平上显著,城镇化与工业化的协整系数为4.248933,P值小于0.01,通过1%置信水平的检验;Pedroni检验:Panel rho-Statisti、Panel PP-Statistic、Panel ADF-Statistic、Grou-Prho-Statistic、GrouP PP-Statistic、GrouP ADF-Statistic的P值均通过1%的检验,Panel v-Statistic在旅游业发展和城镇化协整检验的P值为0通过,在工业化与城镇化协整检验的P值为0.7640没有通过检验,即Pedroni检验的城镇化与工业化、工业化与旅游化在1%的水平上大部分通过检验存在长期均衡关系;Johansen面板协整检验结果:原假设为None即没有协整关系时,P值都小于1%,所以不接受原假设,原假设为At most 1即至少存在一个协整关系时,P值都大于5%接受这一假设;综上三种检验结果的结论是城镇化与工业化、工业化与旅游化在1%的水平上大部分通过检验存在长期协整关系。
2.3 因果关系检验
单位根检验表明lyfz、czh和gyh序列都是平稳序列,协整检验表明lyfz、czh和gyh之间存在长期均衡关系,为了便于构建面板数据模型,还需要对数据进行Granger因果关系检验,对两组面板数据进行格兰杰因果检验使任何一组数据都可以作为自变量或者因变量,检验回归方程为:
Yi和Xi两个随机误差项之间是不相关的,因果关系检验依赖于回归模型中的滞后长度,因此对面板数据变量lyfz、czh和gyh分别选取滞后期1、2、3、4进行面板数据格兰杰检验,其结果见表2。
由表2可以证明,在5%置信水平下:原假设为czh不是引起gyh的原因,在滞后期为1、2、3、4时P值分别为0.0025、0.0031、0.0001、0.00000053,拒绝czh不是引起gyh原因的假设;原假设为gyh不是引起czh的原因,在滞后期为1、2、3、4时P值分别为0.0022、0.00001、0.0007、0.0050,拒绝gyh不是引起czh原因的假设;所以通过格兰杰检验得出的结果表明城镇化与工业化之间是互为因果的关系,即工业化与城镇化互为因果关系。
城镇化和工业化在滞后期为1、2、3、4时均表现为显著地双向因果关系。在我国改革开放初期直到现代,在大部分地区工业化是城镇化建设的主要动力,同时也是城镇化稳步发展的先导产业,工业发达的地区可以为城镇化提供了强大的经济、人力和技术保障,是地区城镇化建设的加速器。反过来,城镇的人口集聚为工业化进程提供了必要的人力支撑;城镇的交通条件为工业进步创造了发展基础;城镇的完备服务设施可以吸引更多工业企业的驻足,进而促进工业部门间的交流,提高工业的质量与水平;所以城镇为工业化成长提供空间。总之,在一定时期内,全国层面上工业化和城镇化呈现明显的相互促进作用。
由表2可以得出,在5%置信水平下:原假设为lyfz不是引起czh的原因,在滞后期为1、2、3、4时P值分别为0.7143、0.0461、0.4598、0.7155;原假设为czh不是引起lyfz的原因,在滞后期为1、2、3、4时P值分别为0.0127、0.4677、0.00003、0.00005。滞后期为1、2、3、4时城镇化都是引起旅游化的原因,滞后期为2时旅游业发展为引起城镇化的原因,即在滞后期为2时城镇化和旅游业发展互为因果关系。
旅游业对城镇化呈现促进作用只在2阶时比较显著的原因:首先,选取的指标存在一定的偏差性,旅游业发展水平选取的是旅游总收入对gdP的贡献率,这在一定程度上具有很大的局限性,因为简单的旅游总收入占gdP的比重不能完整地解释旅游业发展水平所表示变量的意义;其次,我国存在城镇化水平和旅游业发展水平都较高的地区(1区)、城镇化水平高旅游业发展水平低的地区(2区)、城镇化水平低旅游业发展水平高的地区(3区)以及城镇化水平低旅游业发展水平低的地区(4区)四种地域非均衡的状态,因此就全国而言存在显著的地区差异,理想假设1区情况为正,4区情况为负,且两者中和结果为零,而2区和3区两者情况皆为零,因此如果从全国角度出发,我们就可以得到1区、2区、3区、4区相加的结果为零,杨勇(2006)在研究旅游业与我国经济增长关系时也得出了旅游业的发展和我国经济增长不存在明显因果关系的结论,对此杨勇的解释之一即不同地区的中和作用或者是具有明显正相关关系的地区和具有负相关关系地区的相互抵消作用。同样在全国区域内看城镇化与旅游业发展的现状,最终综合为零的情况也是影响因果关系检验的主要原因之一。
2.4 面板数据模型估计
基于以上的单位根检验、协整检验、格兰杰因果检验,对存在长期因果关联的变量建立面板模型,估计城镇化与工业化、旅游业发展水平的相关参数。F检验结果是F2=3.195>F(0.95,90,372)=1.298,可以拒绝原假设H1:该模型为混合回归模型,认为模型中不同个体的截距项不同;F1=4.135>F(0.95,60,372)=1.355,可以拒绝原假设H0:该模型为变截距模型,所以全国31个省(市、区)构成的样本数据选择变系数模型。
对于固定效应模型和随机效应模型的选择,有时可以采用hausman随机效应检验,但是当模型确定为变系数模型时,则首先考虑样本容量问题,对于截面数据为31观察期为15的矩阵宜采用固定效应模型,所以最终构建固定效应变系数模型。
采用加权与广义最小二乘法进行估计,F统计量为4.671620,其P值为0,D. W.统计量为2.099425,回归标准误差0.790361值比较小,R2大于0.5,说明本文选择广义最小二乘法进行的模型估计是有效的。另外,由于截面样本数较多,所以有少数样本系数不通过显著性检验不代表面板模型的无效。
从工业化变量系数和旅游业发展水平变量系数解释变量的显著性来看(见表3),大多数省(市、区)都通过了显著性检验(P值小于0.1)。所以,从省级区域层面上看,工业化和旅游业发展水平都是影响我国城镇化的重要因素。具体而言,工业化的系数在30个省(市、区)都为正的只有在浙江省为负,这表明工业化拉动了城镇建设;工业化系数在21个省(市、区)都是显著的,在10个省(市、区)是不显著,在影响显著的省区中,吉林和云南在10%水平上显著,其余19个省(市、区)的显著水平都达到了5%。旅游业发展水平系数在30个省(市、区)为正,重庆系数为负,这说明在大部分省(市、区)旅游的发展拉动了城镇化的建设;旅游发展系数在20个省(市、区)是显著的,其中在影响显著的省(市、区)中,吉林、甘肃、新疆、贵州在10%水平上显著,其余16个省(市、区)的显著水平都达到了5%。
3 结论
(1)从国家层面上看,在1998—2012年间,旅游产业和工业产业的发展加快了城镇化建设,所以推动城镇化的建设,应该从旅游发展和工业发展两方面着手。
(2)从东部、中部、西部层面上看,各省份旅游发展、工业化对城镇建设的作用呈现出明显的地区差异。
(3)从省域层面看,各省(市、区)因区位条件、资源禀赋、发展阶段等不同,城镇化水平及其影响因素存在明显差异,因此需要有针对性地采取措施。可依据当地的优势与特色资源,选择发展势头好的产业与旅游产业进行产业融合形成新的产业增长力,以新产业带动传统产业由低成长性、低附加值向高成长性、高附加值转变,提升区域产业的整体竞争水平,推动新型城镇化进程。
参考文献:
[1]张春燕.旅游产业与新型城镇化的耦合评价模型[J].理论新探,2014,(7).
[2]洪名勇.城镇化与工业化协调发展研究[J].贵州大学学报(社会科学版),2011,29(6).
[3]张长学,王琦.吉林省城镇化与工业化的相互作用分析[J].产业与科技论坛,2013,12(3).
[4]谭鑫,朱要龙.西部地区城镇化与工业化协调发展实证研究[J].学术探索,2014,(5).
[5]王兆峰,余含.张家界旅游产业发展与小城镇建设耦合发展研究[J].经济地理,2012,32(7).
[6]张英,陈俊合,熊焰.旅游发展与城镇建设耦合协调研究—以黔东南苗族侗族自治州为例[J].贵州民族研究,2013,34(153).
[7]贾发现.河南典型资源型城市城镇化与旅游互动发展研究[J].中国管理信息化,2013,16(1).
[8]钟家雨,柳思维,熊曦.旅游业与城镇化协同发展的区域差异分析[J].经济地理,2014,34(2).
[9]高铁梅.计量经济分析方法与建模—EViews应用及实例(第二版)[M].北京:清华大学出版社,2009.
[10]樊欢欢,张凌云.EVIEWS统计分析与应用[M].北京:机械工业出版社,2009.
[11]王宝民,李劲为,田华.中国城镇化发展现状与发展趋势[J].地区经济,2010,(18)
[12]何永芳.中国改革开放以来的工业化进程分析[J].广东社会科学,2009,(2).
[13]王德刚.新型城镇化为旅游业带来新机遇[N].中国旅游报,2014年3月24日.
[14]杨勇.旅游业与我国经济增长关系的实证分析[J].旅游科学,2006,20(2).
作者简介:张广海(1963—),男,山东临沂人,教授,博士生导师,研究方向:旅游开发规划与管理、区域经济。李晶晶(1989—),女,山东淄博人,硕士研究生,研究方向:旅游规划与管理。
作者: 中国海洋大学 管理学院 张广海 李晶晶 来源: 《统计与决策》2016年第21期