効果検証入門のまとめ 第一章


このの第一章のまとめです。まとめと言いつつ少し書き足しているので間違ってたらごめんなさい、教えてください。

因果推論でやりたいこと

対象の集団を考える。その集団全体がある介入を受けたときの目的変数の期待値と、その集団全体が介入を受けなかったときの目的変数の期待値の差を得たい。
例:クーポンを一部の顧客に配信したら、クーポンを配信していない顧客に比べて売上が20%高かった。この20%はクーポンを配信によるものか?クーポンを配信しなくても売上が高い顧客だったのではないか?この問いは次のことがわかれば答えられる。顧客全体に対してクーポンを配信したときの売上と、顧客全体に対してクーポンを配信しなかったをときの売上。

因果推論の難しいところ

顧客全体に対してクーポンを配信したときの売上と、顧客全体に対してクーポンを配信しなかったをときの売上の両方を計測することは不可能である。 1
観測できるのは一部の顧客にクーポンを打ったという現実世界の売上だけである。

RCTなら相関を因果とみなすことができる

世界観

Rubin流の因果推論の世界観を図で表現する。

上の図では色がクーポンが打たれたかどうかを表現している。Zはクーポンが打たれたかどうかは表現しない。イメージで説明すると、Zは人の分別に使われる。我々が観測できる世界で、クーポンを打たれた人はバッジをつける。すべての顧客がクーポンを打たれていない世界でもその人はバッジをつけている。Zはバッジを付けている人かどうかを分別する。

我々が知りたいのは次の式で表現できる因果である。

E[Y^{(1)}-Y^{(0)}]

しかし、我々が観測できるのは$Y$と$Z$のみである。例えば、次の式で表現できる相関は観測できる。

E[Y|Z=1] - E[Y|Z=0]

仮定

次の仮定を置く。23

E[Y|Z=1] = E[Y^{(1)}|Z=1]    
E[Y|Z=0] = E[Y^{(0)}|Z=0]  

RCTのすごいとこ

RCTならば次の式が成り立つ。

E[Y^{(0)} | Z=1] = E[Y^{(0)} | Z=0]
E[Y^{(1)} | Z=1] = E[Y^{(1)} | Z=0]

これにより、相関と因果が等価であることを示すことができる。

\begin{equation*}
\begin{split}
E[Y|Z=1] - E[Y|Z=0] &= E[Y^{(1)}|Z=1] - E[Y^{(0)}|Z=0]\\
&=E[Y^{(1)}-Y^{(0)}|Z=1] + (E[Y^{(0)}|Z=1]- E[Y^{(0)}|Z=0]) \\
&=E[Y^{(1)}-Y^{(0)}]
\end{split}
\end{equation*}

3
相関が因果になった!!!!!!!やっったね!!!!!!!!!


  1. 母集団すべてのサンプルが得られない(顧客全てにクーポンを配信することができない)という意味ではなく、顧客に対して、クーポンを配信されたかつ配信されていない状態にすることが不可能であるという意味。 

  2. いわゆるConsistency。これは仮定するしかないという理解をしています。詳細はこちらhttps://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/ 

  3. 第三式の第一項がこうなるのは、$Y^{(1)}\perp Z$かつ$Y^{(0)}\perp Z$なら$Y^{(1)}-Y^{(0)}\perp Z$