#论文快读# 今天在港科广召开的Strategy Research Symposium in the Greater Bay Area 2024上有三篇文章涉及到Bartik Shift Share IV的思想，故快读一下Bartik IV。Bartik工具变量方法的本质：理论基础与实证应用在计量经济学中，工具变量方法是解决内生性问题的关键工具。而Bartik工具变量因其独

#论文快读# 今天在港科广召开的Strategy Research Symposium in the Greater Bay Area 2024上有三篇文章涉及到Bartik Shift Share IV的思想，故快读一下Bartik IV。

Bartik工具变量方法的本质：理论基础与实证应用

在计量经济学中，工具变量方法是解决内生性问题的关键工具。而Bartik工具变量因其独特的构造方式和广泛的应用，在近三十年来获得了特殊的地位。Goldsmith-Pinkham、Sorkin和Swift发表在《美国经济评论》上的这篇论文，通过深入的理论分析和实证应用，揭示了Bartik工具变量的本质，为我们理解这一方法提供了全新的视角。

首先，我们需要理解Bartik工具变量的历史渊源。虽然这一方法以Bartik（1991）的名字命名，并在Blanchard和Katz（1992）的工作中得到推广，但其最早的思想可以追溯到Perloff（1957）的研究。在计量方法上，Freeman（1980）首次将这种结构用作工具变量。Bartik（1991）的创新在于他不仅将其作为工具变量使用，还在附录中明确讨论了使用全国性增长率作为外生成分的逻辑。

Bartik工具变量的基本构造非常优雅。它将地区层面的就业增长分解为两个部分的内积：地区的行业构成份额（zlk）和全国性的行业增长率（gk）。具体来说，就业增长可以写作：xl = ∑k zlkglk，其中zlk是l地区k行业的就业份额，glk是该行业在该地区的增长率。进一步，我们可以将行业增长率分解为三个部分：glk = gk + gl + g˜lk，其中gk是行业成分，gl是地区成分，g˜lk是特异成分。

本文的第一个关键发现是，Bartik工具变量在数值上等同于使用行业份额作为工具变量的广义矩估计（GMM）。当权重矩阵选择为W = GG'时，βˆGMM = βˆBartik。这一发现具有深远的含义：它表明识别假设应该基于行业份额而非全国性增长率来陈述。全国性增长率仅仅起到加权的作用，影响工具变量的相关性而非外生性。

第二个重要贡献是引入了Rotemberg权重的概念来解构Bartik估计量。Rotemberg权重（αˆk）衡量了估计结果对各个工具变量的敏感程度。具体来说，αˆk(GG') = gkZ'kX⊥/∑K k=1 gkZ'kX⊥。这些权重之和为1，但可以为负。权重的大小反映了某个行业份额作为工具变量的重要性，也就是最终估计结果对该工具变量的依赖程度。

在技术细节方面，有几点特别值得注意。首先，在实际应用中应该使用留一法（leave-one-out）来计算全国性增长率，这可以解决有限样本偏差问题。其次，标准误的计算假设地区之间相互独立，忽略了空间相关性。第三，假设数据反映稳态，且地区数量趋于无穷而工具变量数量保持固定。这些技术假设的重要性在实证应用中得到了充分体现。

论文通过两个经典的实证应用来展示方法的实用性。第一个应用估计劳动供给弹性，使用1980-2010年的人口普查数据（IPUMS 5%样本）。研究发现，尽管存在大量工具变量，但前五个工具变量就占据了33%的权重，其中石油和天然气开采行业（2000年代）的权重达到16%。这说明估计结果主要依赖于少数几个关键行业的变异。另外，负权重之和达到-0.8，表明某些行业份额实际上起到了对冲的作用。

第二个应用研究中国进口对美国制造业就业的影响（即著名的"中国冲击"）。作者首先精确复制了Autor、Dorn和Hanson（2013）的结果，得到相似的系数估计（-0.62对比原文的-0.60）。但当固定行业份额时，估计结果显著减小至-0.16。在这个应用中，电子计算机行业（2000年代）获得最高权重0.14，而增长率解释了约30%的权重方差。

论文还提出了两种检验识别假设有效性的方法。第一种是过度识别检验，采用HFUL估计量来应对多工具变量的情况。在两个实证应用中，过度识别检验都拒绝了所有工具变量都是外生的原假设。第二种是平衡性检验，考察高权重行业的份额与初始期特征的相关性。例如，在劳动供给应用中，"其他"行业的R²高达0.43，表明该行业份额与多个控制变量高度相关。

论文的附录提供了丰富的技术细节。特别是附录E提供了完整的经济理论模型，包括劳动供给方程：ln NSlt = σlt + θ ln wlt和需求方程：ln NDlkt = Tlkαlkt - φ ln wlt。附录F讨论了过度识别检验的局限性，而附录G则详细推导了留一法下的权重公式。

这项研究对实证研究具有重要的指导意义。首先，它表明研究者在使用Bartik工具变量时，应该关注行业份额的外生性而不是全国性增长率。其次，通过计算Rotemberg权重，研究者可以明确识别哪些行业对估计结果起决定性作用，从而有针对性地论证这些关键行业份额的外生性。第三，负权重的存在提醒我们要警惕某些行业份额可能产生对冲效应。

研究也存在一些局限性。首先，忽略了空间相关性可能导致标准误低估。其次，稳态假设在某些应用场景可能过于强硬。第三，保持工具变量数量固定的假设排除了一些有趣的渐近性质。这些局限性为未来研究指明了方向。

总的来说，这篇论文通过深入的理论分析和细致的实证应用，从根本上改变了我们对Bartik工具变量的理解。它不仅澄清了识别假设的本质，还提供了实用的工具来评估估计结果的可靠性。这些发现对实证研究的设计和执行都具有深远的影响。

论文的贡献还体现在它建立了一个统一的框架，可以涵盖多种看似不同的研究设计。例如，移民飞地工具变量（immigrant enclave instrument）、银行贷款份额工具变量，以及利用人口结构变化作为市场规模工具变量的方法，都可以被理解为Bartik类型的工具变量。这种统一的视角不仅有助于我们理解这些方法的共同特征，也为评估它们的有效性提供了一致的标准。

最后，这项研究也为政策评估提供了新的视角。通过识别哪些行业在估计中起关键作用，政策制定者可以更好地理解政策效果估计的可靠性，并针对性地收集补充证据。这种透明度的提高对于建立可信的政策评估体系具有重要意义。

从方法论的角度看，这篇论文展示了如何将深奥的计量经济学理论转化为实用的经验研究工具。它既保持了理论的严谨性，又提供了清晰的实施指南。这种平衡对于推动实证研究的科学性和可信度具有重要意义。

发布于广东