데이터분석가/데분당태 블로그챌린지

무작위 시행이 필요한 이유, 선택편의를 제거하는 방법

chan's chance 2023. 5. 1. 23:27

https://playinpap.github.io/random-assignment/

 

인과추론 첫번째 - 무작위 시행이 필요한 이유

들어가기 앞서 학교에서 계량경제학을 수강했을 때 교수님께 가장 처음 들었던 말은 ‘다른 조건이 동일하다면?…

playinpap.github.io

https://playinpap.github.io/casual-inference-selection-bias/

 

인과추론 두번째 – 선택편의를 제거하는 방법

들어가기 앞서 지난 시간에는 무작위 시행의 필요성에 대해 이야기했다! 바로 선택편의를 제거하기 위한 것!!…

playinpap.github.io

playinpap 커뮤니티에 게시된 경윤영님의 글을 참고하여 정리한 내용입니다.
자세한 내용은 원문을 참고하시면 좋습니다.

--

ceteris paribus : 다른 조건이 모두 동일한 상태에서 이루어진 비교의 경우에만 인과적 해석을 적용할 수 있다.

집단 평균의 차이 = 평균 인과효과 + 선택 편의

결국, '통제집단과 실험집단간의 평균의 차이'를 구할 수 있을 뿐이다.
선택편의 문제는 어떻게 해결할 수 있을까?
선택편의를 제거하는 방법은 무작위 시행으로 인한 대수의 법칙으로 가능해진다.

대수의 법칙 : 큰 모집단에서 무작위로 뽑은 표본의 평균이 전체 모집단의 평균과 가까울 가능성이 높다는 개념.

통제집단과 실험집단에 무작위로 뽑힌 사람들의 표본이 충분히 크다면,
두 집단은 ceteris paribus에 가까워지고, 이를 통해 선택편의를 제거할 수 있다.

주의해야할 점은 통제집단과 실험집단간의 균형이 맞는지 살펴보아야 한다.

  • Assessing balance involves assessing whether the distributions of covariates are similar between the treated and control groups.
    균형을 평가하는 것은 통제집단과 실험집단간의 공변량의 분포가 비슷한지 평가하는 것을 포함한다.

--

https://cran.r-project.org/web/packages/MatchIt/vignettes/assessing-balance.html

 

Assessing Balance

Introduction Covariate balance is the degree to which the distribution of covariates is similar across levels of the treatment. It has three main roles in causal effect estimation using matching: 1) as a target to optimize with matching, 2) as a method of

cran.r-project.org

출처 : voxco