最初に
いつか自分が学んだことをアウトプットしようと思っていましたが、なかなか踏み出せず今日になって初めて、始めようと思ったのでブログを始めてみました。
今回の記事の元となっているのは、Andrew Goodman-Bacon(2021)の論文です。論文を読むのも、記事を書くのも初心者なため、内容に関しては目を瞑っていただけると幸いです。
DIDに関して
DIDは広く使われる手法ですが、処置のタイミングが異なる場合の扱いに関しては、確立されていませんでした。そこで今回の論文では、DIDで処置のタイミングが異なる場合にどのように効果を推定するのかということを述べています。個人的な感覚ですが、この論文で提案されている手法は、処置のタイミングの異質性を明示的にモデル化できるということなので、従来のDIDに比べ、処置効果の異質性や、時間変化に対してより頑健な推定量を提供することが可能ということだと思っています。今回の記事でDIDそのものに関しての説明は省略し、論文で述べられている、新しいDIDの活用方法に関して焦点を当てていきます。(従来のDIDに関しては色々なところで解説されているので)
分解定理に関して
前述しましたが、従来のDIDでは、処置のタイミングが異なる場合の効果推定が困難でした。そこで、この論文では分解定理(Decomposition Theorem)というものを提案しています。分解定理は簡単に言うと、処置のタイミングが異なる場合のDID推定量が、2群間・2時点のDID推定量の加重平均で表せるということです。
しばらくの間は、数式を用いずに、直観的な説明をしていきたいと思います。
具体的には、任意の2群(群Aと群Bとする)の比較に着目するとします。ここで、群Aを処置軍、群Bを対照群とする2時点間のDID推定量を考えます。これは、群Aの処置前後の変化から、群Bの同じ期間の変化を引いたものです。
分解定理は、処置のタイミングが異なる場合のDIDの推定量が、このような2群間のDIDの推定量をすべての群の組み合わせについて計算し、それらを適切な重みで平均したものになることを示しています。
重みは、各群の比較がどの程度DIDの推定量に寄与するかを表しており、2つの要素から決まります。1つ目は各群のサンプルサイズ、2つ目は処置変数の分散です。サンプルサイズが大きい群の比較ほど重みが大きくなります。また、処置変数の分散が大きい、つまり処置軍と対照群の処置状態の差が大きいほど重みが大きくなります。
ここで重要なのは、ある群が処置群として寄与する重みと、対照群として寄与する重みが異なる点です。この差は、その群の処置のタイミングによって決まります。
分解定理の意義は、一般化されたDIDの推定量の性質を、よりシンプルな2群間・2時点のDIDの推定量の性質に帰着させた点にあると個人的には思っています。これにより、DIDの推定量がどのような変動から識別されているのかを明らかにすることができます。また、処置効果の異質性や時間変化がある場合に、DIDがどのような仮定のもとで因果効果を識別できるかについても、示唆してくれているかなとも思います。
それでは数式を用いて、自分が理解したことを解説していこうと思います。 一般化されたDIDの推定量は、2群間・2時点のDIDの加重平均として表せます。
ここで、
- 群k: ある時点で処置を受ける群(処置群)
- 群j:一度も処置を受けていない群(未処置群)
- 群l:群kよりも後の時点で処置を受ける群(対照群であり、後に処置群になる)
3.全ての処置群kについてステップ1とステップ2を行い、得られた値を合計する。 以上、みんなそんなこと言われなくてもわかっている内容だったと思いますが、私はいつも理解するのに時間がかかってしまうので、後で見返した時に理解できるよう、自分用に書かせてもらっています。
次は、
についてです。
VWATT
VWATTは、Variance-Weighted Average Treatment Effect on the Treated(分散加重処置群平均処置効果)の略です。これは、一般化されたDIDの推定量のうち、処置効果を表す部分に相当します。
分解定理によると、一般化されたDIDの推定量は、以下のように分解できます。
この重み付けにより、VWATTは各処置群の処置効果を、その群のサンプルサイズと処置変数の分散に基づいて集約したものとなります。これは、一般化されたDIDの推定量が、各処置群の処置効果を効率的に集約していることを意味しています。
ただし、VWATTは処置効果の heterogeneity(異質性)が存在する場合、必ずしも処置群全体の平均処置効果を表すわけではありません。VWATTは、各処置群の処置効果を、その群の重要度に応じて加重平均したものであり、処置効果の heterogeneity が重要度と相関を持つ場合、VWATTはその影響を受けます。
一般化されたDIDの識別条件
一般化されたDIDの識別条件は、分散で重み付けされた共通トレンド(Variance-Weighted Common Trends: VWCT)と呼ばれ、以下のように表されます。
この条件は、処置群と未処置群・対照群の間で、処置を受けなかった場合の時間変化(トレンド)が並行である必要があることを意味しています。ただし、各群のトレンドが完全に同一である必要はなく、重みを考慮した上で並行であれば十分です。
VWCTは、各処置群について、その群が処置群として用いられる際の重み付けされたトレンドと、対照群として用いられる際の重み付けされたトレンドの差が、未処置群のトレンドと等しくなることを要求しています。
この条件が満たされない場合、一般化されたDIDの推定量にはバイアスが生じます。バイアスの大きさは、各群のトレンドの差異と、その群の重みによって決まります。
以上が、一般化されたDIDの識別条件についての詳細な説明になります。この条件は、DIDの基本的な仮定である「並行トレンドの仮定」を、処置のタイミングが異なる状況に拡張したものと言えます。
処置効果の時間変化によるバイアス
処置効果が時間的に変化する場合、既に処置を受けた群を対照群として使うと、DIDの推定量にバイアスが生じます。このバイアスは以下のように表されます。
このバイアスは、既に処置を受けた群を対照群として使う際に生じます。バイアスの大きさは、処置効果の時間変化が大きいほど、また、処置群と対照群の処置タイミングの差異が大きいほど、大きくなります。
したがって、処置効果が時間的に変化する可能性がある場合、既に処置を受けた群を対照群として使うことは適切ではありません。このような場合、イベントスタディ等の代替的な手法を用いて、処置効果の時間変化を考慮した分析を行う必要があります。
分解定理の応用
分解定理は、DIDの仮定のテストや頑健性の確認に応用できる。 - 各2群間・2時点間のDIDの推定量とその重みをプロットすることで、識別に寄与する変動の源泉が明らかになる - 共変量のバランスを重み付けして検定することで、VWCTの成立をテストできる - モデルの変更による推定量の変化を、2群間・2時点のDIDの変化と重みの変化に分解できる
最後に
最近DID関連を勉強しており、面白い方法だなと思ったので、紹介させていただきました。正直論文の理解も浅く、間違っている箇所が多々あるような気がしていますが、今回読んだものは話半分程度に思っていただいて、詳しいことはURLを載せている論文の方を読みに行っていただければと思います。論文読むのが億劫という方は、今回みたいな方法もあるんだな程度に思っていただけると幸いです。何度も言いますが、これが正しいとは決して思わないでください。私は初心者なので...