四 回归分析结果
( 一) 基准回归结果
在进行 RD 估计之前,我们首先绘制核心变量在分界线附近的散点图和拟合曲线。 图3 显示空气污染和刑事逮捕率在秦岭-淮河分界线处出现明显断点。 具体来说,集中供暖政策对空气污染的局部处理效应为0.2ug / m3 左右,对刑事逮捕率的局部处理效应为0.5 人/ 万人左右,证实集中供暖政策是造成南、北方空气污染差异的重要因素之一,且可以进一步使用 RD 方法对断点处的局部平均处理效应进行估计。
具体回归结果见表3。 其中Panel A 和Panel B 分别为式(2)、(3)的估计结果,表明集中供暖政策对刑事逮捕率和空气污染均有显著影响。 模型(6) 表明,在控制城市固定效应、时间固定效应并引入控制变量后,集中供暖政策使得北方城市的PM2.5 浓度平均比南方城市高约0.425 ug / m3 ,而刑事逮捕率则比南方城市高出0.4 人/ 万人,回归结果均在1% 的水平上显著。 Panel C 报告了2SLS 的估计结果,表明空气污染显著提升犯罪率。 模型(1)-(6)逐步加入相应控制变量,回归结果均至少在10% 的水平上显著。 引入所有控制变量的回归结果显示PM2.5 浓度每增加1% ,城市犯罪率会增加0.926% 。
说明:图中实线为各变量的拟合曲线,虚线为 95% 的置信区间,下图同。 小圆圈在左图代表每100公里内各城市 PM2.5 平均浓度,在右图代表各城市平均刑事逮捕率。
此外,我们发现失业率对犯罪率的影响显著为正,与现有研究结论一致( 陈刚等, 2009)。 失业率越严重,社会秩序也越不稳定,人们的犯罪倾向越严重。 人口更集中的城市容易滋生犯罪,而城乡收入差距扩大凸显出更多社会问题,容易导致犯罪率上升。提高教育水平有利于改善人们的生活环境,提高自身道德标准,具有一定程度的犯罪抑制效应。
( 二) 稳健性检验
1.带宽敏感性。 RD 估计结果的有效性易受带宽选择的影响。 带宽越小,断点两侧的影响因素越相近,遗漏变量对因变量的影响越小,因而可以更准确地估计断点处的处理效应,减轻内生性带来的估计偏误。 但过小的带宽也会带来样本量的过度损失从而导致结果的有偏性。 根据均方误差( Mean Squared Error,MSE) 最优带宽选择方法,我们测算出刑事逮捕率和刑事起诉率的最优带宽分别为 161 8 公里和 217 1 公里。 由于带宽越小,其拟合形式越趋近于线性函数形式,因而在不同的带宽选择下我们对执行变量的阶数进行相应调整。 回归结果显示在不同带宽和多项式选择下,空气污染与犯罪率之间的因果关系未发生显著变化。
另外,我们选择250 公里与1000 公里之间的不同带宽( 以每10 公里为增量),在不同的带宽下对式(4) 进行 RD 估计,图4 描绘了相应结果。 图4 Panel A 显示了每个带宽下的估计系数与所对应的 95%置信区间,可以看出回归系数的整体波动幅度较小,进一步证实估计结果对带宽的改变并不敏感。 Panel B则报告了每一次回归对应的 P 值( 虚线表示 P 值为0.05 的临界线),容易看出在大多数带宽选择下,回归结果都至少在5% 的统计水平上显著,整体回归结果非常稳定。
2.RD 回归的有效性检验。 使用RD 方法需满足两个前提假设:(1) 除了选定的处理变量外,其他所有相关因素在断点处呈平滑变化,以避免捕捉到其他因素的断点效应。 图5 证实我们选取的所有控制变量在分界线处均呈连续变化。 (2) 执行变量不存在潜在的人为操控问题。 RD 回归的先天优势在于所选样本都能进行精确定位,执行变量的密度连续性能得到保证( Keele and Titiunik,2011)。 实际上,中国政府之所以选择秦岭- 淮河分界线作为南、北方分界线,主要原因在于沿着该分界线 一月份的平均地理温度为 0℃ , 而非出于其他行政或经济目的( Chen et al ,2013),已有多篇文献证实本文执行变量的选择并不存在人为操控的问题( Almond et al ,2009;Li and Zhang, 2019;李卫兵和张凯霞,2019)。图 6 绘制了执行变量的密度函数分布,可知执行变量在断点处呈平滑变化,进一步表明执行变量的选择是不存在人为操控的。
3.不同类型犯罪率和不同空气污染物指标。 考虑到空气污染对不同类型的犯罪行为可能有异质性影响( Edlund et al ,2013;Herrnstadt et al ,2016),我们分别探究空气污染对暴力犯罪、经济犯罪和腐败犯罪的影响,重新进行 RD 估计。 回归结果如表4 所示,模型(1)-(4) 分别报告了空气污染对暴力犯罪率和经济犯罪率的不同影响。具体来说,PM2.5 浓度增加1% ,暴力犯罪率会增加3.946% -5.168% ,而空气污染对经济犯罪行为并不存在显著影响,证实了 Herrnstadt and Muehlegger(2015) 的研究结论。此外,模型(5)(6) 显示空气污染对腐败行为也不存在显著影响。 腐败作为一种高技能犯罪,犯罪者往往处于某种有影响力的地位,这使他们在面对空气污染的负面影响时能更清醒地做出决策,不易受其影响。我们的回归结果揭示出空气污染引发的犯罪行为偏向于非智力犯罪。
此外,考虑到燃煤取暖会排放多种污染物,为了更全面地探索空气污染与犯罪行为之间的关系,我们进一步选取了不同的空气污染排放物( Dust,SO2 和 AQI) 作为空气污染的衡量指标进稳健性检验。 回归结果表明不同空气污染物指标的系数均显著为正,即空气污染越严重,城市犯罪率越高,进一步支持了前文的结论。 这表明本文的核心结论对不同空气污染指标的选取并不敏感,这也意味着其他环境污染物都存在社会道德成本问题,因而政府应该投入更多的资源用于保护环境,以更全面、长远的眼光重新审视环保政策的成本收益问题。
4.非参数检验。 为确保核心结论的可信性,我们利用非参数估计重新进行回归, 结果如表5 所示。 其中,PanelA 报告了 MSE 最优带宽选择下三种核回归( 三角核回归,Epanechnikov 核回归和均匀核回归) 的结果,Panel B 则报告了覆盖错误率( Cover⁃ age Error Rate,CER) 最优带宽下的回归结果。 第一阶段回归结果说明集中供暖政策作为空气污染的工具变量是有效的,两者之间显著正相关,所有回归结果均在 1% 的水平上显著。 第二阶段回归结果表明,在不同带宽选择和核回归下,集中供暖政策对城市犯罪率的处理效应都是显著的,证实空气污染越严重的城市犯罪率越高。 对比非参数估计结果与基准回归中的参数估计结果可以发现,两种方法估计的系数非常接近,表明核心结论是稳健的。
5. 随机性检验。 限于数据的可得性,本文仅搜集了 118 个地级市的犯罪率数据作为样本分析,其中位于南方的城市有 74个,北方城市有 44 个。 我们以城市人均GDP 的平均值作为基准将所有样本分为经济发展良好的城市样本和发展缓慢的城市样本,统计发现共有28 个北方城市的经济发展良好,占全部北方城市样本的比重为63.63% 。 此外,有 42 个南方城市经济发展良好, 占全部南方城市样本的比重为56.76% 。 总体来看,本文所选的南、北方城市样本在经济发展程度上的差异并不大。
为了避免样本选择的非随机性所致的估计偏误,确保本文捕捉到的确实是空气污 染对犯罪率的影响,我们参考 Baker(2015) 的处理方式进行安慰剂检验,即随机分配每一个样本到秦岭-淮河分界线的距离( 由 Stata 软件在一定带宽范围内随机赋值), 据此确定执行变量( Lc ) 的取值并重新进行 RD 估计,然后使这个随机过程重复 1000 次。 如果这1000 次估计的核心系数 β1 和0 无显著差异,则表明本文的估计结果并非由样本选择的非随机性所致。 图7 描绘了1000 次估计中空气污染对刑事逮捕率和刑事起诉率回归系数的核密度分布,可以看出两组结果均为以0 为中心并呈对称的倒 U 型分布,十分接近于标准的正态分布,表明1000 次随机过程中的估计系数的确都集中分布在零附近,因此可以排除基准估计结果来源于样本选择的非随机性偏差的可能性,反向证明本文的研究结果是可信的。
6.以经纬度为执行变量。 为了更精确地控制地理因素所造成的区域差异,我们以经纬度为执行变量,从多元维度重新进行 RD 估计。 我们分别考察了新执行变量的不同阶数下空气污染对刑事逮捕率和刑事起诉率的影响,结果一致表明空气污染导致犯罪率增加,且至少在10% 的水平上显著。 与以距离为执行变量的基准回归结果进行对比,我们发现两组结果存在一定差异,这可能是因为多维 RD 多项式( 经纬度) 相比于一维 RD 多项式( 距离) 而言可能存在拟合过度的问题,因为多维多项式会占用更多的自由度( Dell et al ,2018)。 但整体而言,回归结果稳健。
7.增加控制变量。 考虑到地区公共服务水平和社会治理差异可能对犯罪率造成潜在影响,我们进一步加入相应的控制变量进行检验。 一方面,福利性财政支出有利于民生改善,而较高的宏观税负水平会增加居民的生活压力,这些因素可能会对潜在的犯罪率产生影响;另一方面,公共服务水平越高的地区居民的生活幸福感会越高,这有利于降低犯罪率。因而,我们在基准回归的基础上进一步加入财政层面( 人均福利性财政支出、宏观税负水平) 和公共服务层面( 公共服务综合指标) 的变量作为控制变量进行稳健性检验( 指标测算方式见表 1) 。 我们发现,在加入上述控制变量后,空气污染对刑事犯罪率( 包括刑事逮捕率和刑事起诉率) 的估计结果仍然至少在5% 的水平上显著为正,且空气污染显著提升了暴力犯罪率,但对经济犯罪率没有显著影响,所有估计系数和基准回归结果非常接近。 此外,为了保证 RD 估计的有效性,我们还考察了新增的控制变量在断点处的变化情况,发现空气污染并未捕捉到其他变量的断点效应。 综上,控制其他潜在影响犯罪率的因素后,本文的回归结果仍然稳健。
|