https://playinpap.github.io/casual-inference-regression/
인과추론 세번째 – 뻔하지만 강력한 무기 회귀분석
들어가기 앞서 인과추론하면 빠질 수 없는 것이 회귀분석이다. 회귀분석에 대해 1학기 내내 배웠었는데 수식 …
playinpap.github.io
이번주 월요일 인과추론 첫번째, 두번째에 이어 세번째 글을 정리하게 되었습니다.
위 글은 pap 커뮤니티에 게시된 경윤영님의 글을 읽고 정리한 글입니다.
자세한 내용은 원문을 참고하심이 좋습니다.
--
관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다.
다중회귀방정식
yhat = β0hat + β1hat * x1 + β2hat * x2 + … + βkhat * xk (k는 독립변수의 개수)
위의 제시된 일반적인 OLS 방정식에 잔차 (yi - yhat)^2 을 최소화하는 최소제곱법(Ordinary Least Squares)을 사용하여 추정값을 구한다.
OLS 추정량이 B.E.S.T.이기 위해서는 아래의 고전적 가정을 만족하여야 한다.
- 종속변수와 독립변수는 선형관계이다.
- 독립변수 간 독립적이다.
- 표본의 임의 추출
- 오차항이 등분산이다.
- 오차항이 독립적이다.
- 오차항이 정규분포이다.
가우스-마르코프 정리는 위의 가정 중 1번부터 5번까지 성립하였을 때, 최소제곱추정량이 B.E.S.T.(Best Linear Unbiased Estimator)임을 정리한 것이다.
--
계량경제학 강의를 통해 배웠던 내용입니다.
추정량을 도출하는 방법을 열심히 배워 시험을 봤었지만,
6개월 만에 다시 보니 새로 배우는 느낌이 드네요.
이번 기회에 복습을 하게 되어 좋았습니다.
'데이터분석가 > 데분당태 블로그챌린지' 카테고리의 다른 글
모바일 앱 로그분석, 어떻게 시작해야 할까? (0) | 2023.05.06 |
---|---|
넷플릭스에서 A/B 테스트를 해석하는 법 : 거짓 양성 오류 알아보기 (0) | 2023.05.06 |
신뢰할 수 있는 지표 만들기 (0) | 2023.05.03 |
데이터 파이프라인 개념 정리 (0) | 2023.05.02 |
무작위 시행이 필요한 이유, 선택편의를 제거하는 방법 (0) | 2023.05.01 |
댓글