山东财经大学经济学院;山东财经大学财政税务学院;加拿大多伦多大学经济系;
在倾向得分匹配-双重差分模型(PSM-DID)的应用中,面临原本适用于截面数据的倾向得分匹配(PSM)运用到面板数据中的挑战,传统基于面板数据转化为截面数据再匹配的方案和基于面板数据逐期匹配的方案,容易产生"自匹配"现象或匹配对象在政策前后不一致的问题。为克服上述问题,本文对传统的逐期匹配方案进行了如下改进:一是对匹配变量进行区分,并由特殊类变量和倾向得分值(ps值)共同控制匹配;二是匹配方式由原来ps值点对点匹配,改进为ps值序列间的整体匹配。更进一步,在应用实例中显示,当对照组与处理组差异较大且存在特殊类变量时,利用改进后的PSM-DID模型可以更加有效地识别出政策产生的效应。
12,485 | 232 | 66 |
下载次数 | 被引频次 | 阅读次数 |
[1]邓柏峻,李仲飞,张浩.限购政策对房价的调控有效吗[J].统计研究,2014(11):50-57.
[2]何靖.延付高管薪酬对银行风险承担的政策效应———基于银行盈余管理动机视角的PSM-DID分析[J].中国工业经济,2016(11):126-143.
[3]郝项超,梁琪.李政融资融券与企业创新:基于数量与质量视角的分析[J].经济研究,2018(6):127-141.
[4]贾俊雪,宁静.纵向财政治理结构与地方政府职能优化———基于省直管县财政体制改革的拟自然实验分析[J].管理世界,2015(1):7-17.
[5]贾俊雪,李紫霄,秦聪.社会保障与经济增长:基于拟自然实验的分析[J].中国工业经济,2018(11):42-60.
[6]李兵,李柔.互联网与企业出口:来自中国工业企业的微观经验证据[J].世界经济,2017(7):102-125.
[7]李静,杨娜,陶璐.跨境河流污染的“边界效应”与减排政策效果研究———基于重点断面水质监测周数据的检验[J].中国工业经济,2015(3):31-43.
[8]刘瑞明,赵仁杰.西部大开发:增长驱动还是政策陷阱———基于PSM-DID方法的研究[J].中国工业经济,2015(6):32-43.
[9]毛其淋,许家云.中国企业对外直接投资是否促进了企业创新[J].世界经济,2014(8):98-125.
[10]毛其淋,许家云.政府补贴、异质性与企业风险承担[J].经济学(季刊),2016,15(4):1533-1562.
[11]聂辉华,江艇,杨汝岱.中国工业企业数据库的使用现状和潜在问题[J].世界经济,2012,35(5):142-158.
[12]盛丹,陆毅.出口贸易是否会提高劳动者工资的集体议价能力[J].世界经济,2016(5):122-145.
[13]孙文凯,王乙杰.父母外出务工对留守儿童健康的影响———基于微观面板数据的再考察[J].经济学(季刊),2016,15(3):963-988.
[14]田利辉,王可第.社会责任信息披露的“掩饰效应”和上市公司崩盘风险[J].管理世界,2017(11):146-157.
[15]万海远,李实.户籍歧视对城乡收入差距的影响[J].经济研究,2013(9):43-55.
[16]王永进,盛丹.地理集聚会促进企业间商业信用吗?[J].管理世界,2013(1):101-114.
[17]王庶,岳希明.退耕还林、非农就业与农民增收———基于21省面板数据的双重差分分析[J].经济研究,2017(4):106-119.
[18]许家云,毛其淋.生产性补贴与企业进口行为:来自中国制造业企业的证据[J].世界经济,2019(7):46-70.
[19]徐志刚,宁可,钟甫宁,等.新农保与农地转出:制度性养老能替代土地养老吗?[J].管理世界,2018(5):86-97.
[20]张俊.高铁建设与县域经济发展———基于卫星灯光数据的研究[J].经济学(季刊),2017,16(4):1533-1562.
[21]Ashenfelter O,Card D. Using the Longitudinal Structure of Earnings to Estimate the Effect of Training Programs[J]. Review of Economics and Statistics,1985,67:648-660.
[22]B9ckerman P,Ilmakunnas P. Unemployment and Self-assessed Health:Evidence from Panel Data[J]. Health Economics,2009,28(1):1-19.
[23]Derrien F,Kecskés A. The Real Effects of Financial Shocks:Evidence from Exogenous Changes in Analyst Coverage[J]. Journal of Finance,2013,68(4):1407-1440.
[24]Fowlie M,Holland S P,Mansur E T. What do Emissions Markets Deliver and to Whom? Evidence from Southern California’s NOx Trading Program[J]. American Economic Review,2012,102(2):965-993.
[25]Heckman J J,Ichimura H,Todd P E. Matching as an Econometric Evaluation Estimator:Evidence from Evaluating a Job Training Programme[J]. Review of Economic Studies,1997,64:605-654.
[26]Heckman J J,Ichimura H,Todd P. Matching as an Econometric Evaluation Estimator[J]. Review of Economic Studies,1998,65:261-294.
[27]Heyman F,Sj9holm F,Tingvall P G. Is There Really a Foreign Ownership Wage Premium? Evidence from Matched EmployerEmployee Data[J]. Journal of International Economics,2007,73:355-376.
[28]Melitz M J. The Impact of Trade on Intra-industry Reallocations and Aggregate Industry Productivity[J]. Econometrica,2003,71(6):1695-1725.
[29]Rosenbaum P R,Rubin D B. The Central Role of the Propensity Score in Observational Studies for Causal Effects[J]. Biometrika,1983,70(1):41-55.
[30]Rosenbaum P R,Rubin D B. Constructing a Control Group Using Multivariate Matched Sampling Methods that Incorporate the Propensity Score[J]. American Statistician,1985,39(1):33-38.
(1)PSM模型基于条件独立假定(CIA),具体如下式所示,当条件概率p(x)相同时,结果变量y0和y1独立于政策P。(y0,y1)⊥P|x(y0,y1)⊥P|p(x)
(2)处理组与对照组中结果变量y均值的对比,可以估计出政策的处理效应,也就是受处理个体的平均处理效应(Average treatment effect on the treated,简称ATT)。
(3)“1∶1最近邻”匹配的核心思想可以归结为,在对照组中为处理组个体i在ps值上寻找最接近的1个个体j,然后依据此标准将i与j匹配在一起。
(1)对于“双平衡”面板数据而言,所有个体均不存在不同时期分别属于处理组和对照组的情况,因此,匹配当中并不会出现“自匹配”现象。邓柏峻等(2014)便是采用(b)类“双平衡”面板数据,研究了限购政策在房价调控上的有效性。
(1)B9ckerman和Ilmakunnas(2009)在研究员工失业与其健康状况的关系时发现,将面板数据直接当作截面数据进行匹配存在局限性,并最终选择了逐期匹配;毛其淋和许家云(2016)同样意识到将面板数据识别为截面数据时,可能会出现不同时期的同一家企业被视为不同企业而相互匹配的问题。
(2)在定量研究中,研究人员收集到的数据通常存在质量差异,其中类变量一般都较为准确,如企业所在行业和所有制性质以及个人职业等;而连续变量尤其是财务变量则较为可疑,企业基于避税的目的或者个人基于隐私的目的,都将会调低其各项财务指标(聂辉华等,2012),如企业的营业收入和净利润以及个人的可支配收入等。
(3)稳定的对照组是DID模型进行有效识别的前提,即便是模糊双重差分(fuzzy-DID)依然要求对照组应具有稳定性(Chaisemartin和D’Haultfuille,2018)。
(1)在部分研究中,可能并不存在特殊类变量,此时便可采用传统的PSM模型进行识别。
(1)在实际应用中,一般由研究目的和数据样本量来决定特殊类变量xs的种类和数量。
(1)上市公司的部分营业收入可能来自海外子公司,因此,本文依据上市公司年报对该部分营业收入进行剔除。
(2)最终形成“双平衡”面板数据的原因来自两个方面:一方面是由于最近几年刚上市的企业,其财务数据波动较大,不适合作为研究对象,将其剔除后样本数据变为平衡面板数据;另一方面是由于在构建处理组与对照组时,均依据样本期内的平均营收占比,故企业在处理组或对照组中的位置并不会发生变化,进而形成了“双平衡”面板数据。
(1)因篇幅所限,部分变量的构建和计算方法以附表1展示,见《统计研究》网站所列附件。下同。
(2)因篇幅所限,在计算距离时,取中国货运吞吐量TOP30的港口进行测距,具体的港口信息以附表2展示。
(3)因篇幅所限,在数据检验中,行业间的研发强度(rd)存在明显的差异,具体的检验结果以附表3展示。
(1)感谢匿名审稿人关于补充平衡性检验的宝贵建议。
(2)因篇幅所限,标准化偏差的计算公式和具体的检验结果以附表4展示。
基本信息:
DOI:10.19343/j.cnki.11-1302/c.2021.02.011
中图分类号:F224;F832.51
引用信息:
[1]谢申祥,范鹏飞,宛圆渊.传统PSM-DID模型的改进与应用[J].统计研究,2021,38(02):146-160.DOI:10.19343/j.cnki.11-1302/c.2021.02.011.
基金信息:
国家社会科学基金重点项目“‘逆全球化’的政治经济学分析与中国的应对方案研究”(18AGJ001); 泰山学者工程专项经费资助