五、数据和模型估算结果 (一)数据 本文使用109个非经合组织国家或地区从1960年到2013年54年的相关 数据。我们排除了经合组织国家,是因为截至20世纪60年代,经合组织国 家已基本完成了城市化进程。三个单一城市国家或地区——中国香港、中国 澳门和新加坡一一也被排除在外。本文数据主要来源于:世界银行世界发展 指标数据库(WDI),世界电信/ICT指标数据库(ITU)的ICT数据,Barro- Lee受教育程度数据库(BL)3的教育数据,世界道路交通统计数据库(WRS) 的道路密度数据。表2中列出了每个变量的定义和来源。
表3汇报了变量的描述性统计,有几点值得注意。首先,数据观察值的多少因变量而异,特别是道路密度和短信的样本体积远远小于其他指标。其次,城市化率的变动范围很大,最小值为3. 13% ,最大值为99.06%,标准 差为22.5%。城市化率比较高的国家主要集中在拉丁美洲和加勒比海地区、 北美洲和欧洲以及一些资源出口国(UN, 2014; Gollin 2016)。因此,后文将用分区域样本来估算回归模型,以检验基准模型的稳健性。最后,本文中的数据包括一些异常的观察值,例如战争期间,GDP增长下降65% ,人口增长为负。在估算基准模型时,没有剔除这些观察值,因为我们认为这些宏观因素不会显著影响信息对城市化的效应。但我们在稳健性检验部分将考虑这些异常值的问题。
(二)基准模型结果
在进行模型估计之前,我们先进行面板单位根检验。表4中的结果表明, ADF和ADF-PP的检验结果均拒绝了变量存在单位根的零假设。表4的最后一行中,基准模型的残差(对应于表5中第(3)列的模型)是平稳的,因而 排除了伪回归的可能性。
基准模型如表5所示。表5的上半部分(A组)报告了主要变量的系数估算结果,下半部分(B组)报告了年度虚拟变量的系数估算结果。为了节省空间,表5中只列出了 1990年起的结果。第(1)列只包含“推拉”控制 变量,第(2)列包括了所有的控制变量,第(3)列是加入了信息代理变量后的回归结果。
表5的第(1)、(2)列确认了传统的城市化模型无法解释城市化的加速, 因为对应于这两个模型的所有年份虚拟变量的系数都正显著,且随时间单调 增加,从11.7增长到18. 02%与此恰恰相反,第(3)列的结果显示,互联网 的作用显著为正,表明信息对城市化的促进作用,这印证了理论模型的结果。 同时,对应于第(3)列的年度虚拟变量的系数大部分都不显著,且估算值比较稳定。这说明,信息变量可以解释城市化加速这一重要现象。
使用表5下半部分报告的年度虚拟变量的系数估算值作图(见图2),可以 更为直观地获得本文的关键发现与结论。点线和虚线对应表5中的第(1)和第 (2)列,曲线大体上呈单调递增趋势。实线对应包含了信息变量的模型(表5 的第(3)列)。可以看出1990年以前实线与点线、虚线基本平行,但加入 1990年后的互联网变量后,实线变得较为平稳并接近于零。
就控制变量而言,人均GDP、经济增长和教育的结果与预期一致,工业化水平不显著,道路密度仅在列(3)微弱显著,而贸易指标在列(2)、(3) 显著,符合预期。
(三)IV固定效应模型结果
城市化和信息之间可能存在反向因果关系,即城市化水平越高的国家, 其互联网普及程度越高,因为城市通常比农村更能提供较多较好的服务,包括基础设施如互联网%内生性也可能由第三方因素引起,即可能存在的遗漏 变量同时促进城市化和互联网普及率。这样的因素可能与技术进步或经济增长相关,比如随着经济的发展,越来越多人迁往城市,同时经济水平的提高也增加了人们对互联网的需求(Czernich成笊.,2011)为了解决这些潜在的内生性问题,本文借鉴Czernich et al. (2011)的研究成果,依据技术扩散理论,构造互联网普及率的工具变量(IV)。
本文工具变量(IV)的构造基于这样一个事实,即在20世纪90年代初 互联网的使用依赖于固定电话网络,人们使用配线架并通过所谓的拨号接入 互联网服务提供商(ISP)。换句话说,使用互联网需要访问与互联网无本质 关系的、早先就已经独立运行的语音电话网络。基于Griliches (1957)有关技术创新过程的开创性研究,Czernich et al. (2011)将一个国家互联网普及率的最大值
,设为互联网存在之前的固定电话普及率
的线 性函数:
其中,
和
为参数,
为1989年每百人中的固定电话用户数。观察 到的互联网普及率inter可以表示为
和时间t的逻辑方程(见Comin et al., 2006; Geroski, 2000):
其中,参数
和
分别是是式(11)技术扩散曲线的速度和拐点,
为误差项。 将是式(11)带入是式(10)可以得到一个完美由外生变量决定的非线性模型,用于估算互联网普及率,并作为信息的工具变量:
表6汇报了IV模式式(12)的估计结果,分地区回归拟合度较好,
高达0.81和0.91
表7报告了 IV固定效应回归的结果。根据联合国2014年的数据(UN, 2014),亚洲和非洲的城市化速度明显快于其他地区,所以使用亚洲、非洲和其他地区(欧洲和美洲)三个子样本来估算IV模型。回归结果与表5中的基 准结果基本一致,特别是B组里的大部分系数变得不太显著且更平稳。这证实了互联网普及率能很好地解释城市化的加速。
|