처치 효과와 사실적/반사실적 결과
인과모델이 있다면 해당 모델을 고치고 개선하여 인과적 질문에 대한 답을 얻을 수 있다. 이때 이와 같은 의도적 수정을 개입(intervention)이라고 한다. 이와 같이 인과모델에 개입하였을 때 발생하는 현상을 처치 효과(treatment effect)라고 하며, 이로 인해 일어나는 결과를 사실적 결과(factual outcome)이라고 한다. 이번에는 이러한 처치 효과와 사실적 결과, 그리고 그에 대응하는 반사실적 결과(counterfactual outcome)에 대해서 알아보도록 하자.
개입
앞서, 개입이란 인과모델에 의도적인 수정을 가하는 것을 의미한다고 설명하였다. 예를 들어, 모든 실험 대상이 $t_0$라는 처치를 받도록 개입할 수 있다.
$$T \leftarrow t_0$$
$$Y \leftarrow f_y(T,u_y)$$
위 인과모델은 인위적으로 모든 실험 대상에 처치 $t_0$를 가해줬으므로 $T$에 대한 자연적 원인을 제거할 수 있고 따라서 상수로 대체할 수 있게 된다. 이는 '처치를 $t_0$로 설정한다면 결과 $Y$가 어떻게 바뀔까?'라는 질문에 대한 답을 줄 수 있는 인과모델이 된다.
이와 같은 개입을 인과추론에서는 $do(\cdot)$으로 나타낸다. 예를 들어, 위의 예시처럼 $T$에 $t_0$라는 개입을 하는 경우는 $do(T=t_0)$와 같이 표현할 수 있다. 이전 게시글에서 예시로 든 시나리오에서, 기업이 할인을 진행한 경우의 판매량 기댓값은 $E[AmountSold|IsOnSales=1]$이며 '할인을 하도록 개입'한 경우의 판매량 기댓값은 $E[AmountSold|do(IsOnSales=1)]$로 나타낼 수 있다. 이때, 이 두 기댓값은 반드시 같지는 않음을 기억하자. 그 이유는 직관적으로 알 수 있는데, $E[AmountSold|IsOnSales=1]$는 전체 사례 중 할인한 경우를 '선택'하여 표본 집단에서 기댓값을 계산한 것이고 $E[AmountSold|do(IsOnSales=1)]$는 모든 경우에서 할인하도록 '개입'해서 모집단에서 기댓값을 계산한 것이기 때문이다.
개별 처치효과와 잠재적 결과
$do(\cdot)$ 연산자를 사용하면 개별 실험 대상 $i$에 처치가 미치는 영향인 개별 처치효과(Individual Treatment Effect, ITE)를 표현할 수 있다. 이는 처치 $t_1$을 한 경우의 결과에서 처치 $t_0$를 한 결과를 빼서 얻을 수 있으며, 수식으로는 다음과 같이 표현된다.
$$\tau_i = Y_i|do(T=t_1) - Y_i|do(T=t_0)$$
계속 언급하고 있는 할인 여부 시나리오에 대해 적용하여 $IsOnSales$가 1이 되도록, 즉 할인을 하도록 개입한 경우의 ITE는 다음과 같이 표현할 수 있다.
$$\tau_i = AmountSold|do(IsOnSales=1) - AmountSold|do(IsOnSales=0)$$
하지만, 이전에 설명하였듯이, 인과추론의 근본적 문제로 인해 우리는 위 식의 두 항 중 하나의 항만 관찰할 수 있다. 여기서 관찰 가능한 항(실제 일어난 사건)을 사실적 결과(factual outcome), 관찰이 불가능한 항(가정)을 반사실적 결과(counterfactual outcome)라고 하며, 사건이 발생하기 전 이 둘은 모두 잠재적 결과(potential outcome)이다.
잠재적 결과는 다음과 같이 나타낼 수도 있다.
$$Y_i = T_i \cdot Y_{1i} + (1-T_i)\cdot Y_{0i}$$
그리고 위 식을 정리하여 $Y_{0i} + (Y_{1i} - Y_{0i})T_i$로 만들게 되면 처치 대상 $i$의 인과효과 $\tau_i = Y_{1i} - Y_{0i}$를 정의할 수 있음을 알 수 있다.
인과 추정량
인과추론은 여러 잠재적 결과 중 하나만 관찰이 가능함을 다시 한번 떠올려보자. 눈치를 챈 사람도 있겠지만, 결국 인과추론에서는 ITE를 실제로 구할 수는 없다. 그렇기에 실제 상황에서는 이를 대체하기 위한 다른 인과추정량을 사용한다. 가장 흔히 사용되는 세 가지 인과추정량은 평균 처치효과, 실험군에 대한 평균 처치효과, 그리고 조건부 평균 처치효과이다. 각각의 개념에 대해서 알아보도록 하자.
1) 평균 처치효과(Average Treatment Effect, ATE)
ATE는 처치 $T$가 평균적으로 미치는 영향을 나타내는 것으로, ITE의 기댓값으로 나타낼 수 있다. 실제 데이터 상에서는 표본 평균을 기댓값으로 사용할 수 있다.
$$ATE = E[Y|do(T=1)]-E[Y|do(T=0)]=E[Y_{1i}-Y_{0i}]=E[\tau_i]\approx {1\over N}\sum^N_{i=0}\tau_i$$
그런데 바로 방금 ITE $\tau_i$는 알 수 없다고 했는데 그럼 어떻게 ATE를 계산할 수 있을까? 이 부분에 추후 '식별'에 대해서 다룰 때 살펴보도록 하겠다. (해당 내용에 대한 게시글이 작성되면 이 부분은 수정됩니다.)
2) 실험군에 대한 평균 처치효과(Average Treatment effect on the Treated, ATT)
ATT는 처치받은 대상에 대한 처치효과의 평균이다. 즉, 할인을 했을 때(처치받은 대상에 대해) 판매량이 얼마나 늘었는지(처치효과)에 대한 질문에 답을 할 수 있는 인과추정량이다. ATE와 달리, 처치를 받은 그룹에만 초점을 맞추기 때문에 더욱 구체적인 정보를 제공할 수 있다.
$$ATT = E[Y_{1i}-Y_{0i}|T=1]$$
여기서도 마찬가지로, ATT는 처치를 받은 대상을 조건으로 하므로 $Y_{0i}$는 항상 관찰되지 않기 때문에 이 또한 별도의 기법을 이용해서 계산해야 한다.
3) 조건부 평균 처치효과(Conditional Average Treatment Effect, CATE)
CATE는 처치 외에 다른 조건을 두어 특정한 그룹을 변수 $X$로 정의하고 이에 대한 평균 처치효과를 계산하는 것이다. 예를 들어, 나이가 40세 이상인 경우에 대해서 처치효과를 구하고 싶다면 이를 조건부 확률의 조건에 추가하면 된다.
$$CATE(X=x) = E[Y_{1i}-Y_{0i}|X=x]$$
CATE는 어떤 유형의 실험 대상이 개입에 더 잘 반응하는지를 알 수 있게 하며 개인화(personalization)에도 유용하다.
노트: 처치변수 $T$가 연속형 변수인 경우 편미분(partial derivative) 함수로 차이를 대체하여 인과추정량을 구할 수 있다.
$${\partial\over\partial t}E[Y_i]$$
'인과추론' 카테고리의 다른 글
그래프 인과모델 (0) | 2024.05.30 |
---|---|
인과적 식별 (0) | 2024.05.28 |
인과효과에서의 편향 (1) | 2024.05.24 |
인과추론의 분석단위와 인과모델 (0) | 2024.05.20 |
인과관계와 인과추론 (0) | 2024.05.18 |
댓글