https://playinpap.github.io/statistics-to-data-product-analysis/
통계학이 제품 분석의 실제 도구가 되는 과정
이 글은 작성자 블로그 에서도 보실 수 있습니다. 필자가 ML을 뉴스가 아닌 곳에서 제대로 처음들어본 곳…
playinpap.github.io
PAP 커뮤니티에서 이용혁님이 작성하신 '통계학이 제품 분석의 실제 도구가 되는 과정'을 읽고 정리한 글입니다.
--
첫 번째 : 암환자의 생존율을 예측하던 모델이 고객 이탈 분석으로
Cox Proportional-Hazards(1972) 는 환자의 질병과 생존시간 간의 연관성을
조사하는 의학 연구에 사용되어온 회귀 모델입니다.
하지만, 보험 고객 이탈 예측과 같은 곳에 사용되고 있다고 합니다.
두 번째 : 주성분 분석(PCA)에서 추천으로
주성분 분석은 고차원의 데이터를 원 데이터의 정보를 최대한 보존하면서
저차원의 데이터로 변환시키는 방법입니다.
이 방법을 통해, 유저가 어떠한 이유로 어떤 선택을 하는지에 대한 정보를
효과적으로 축약하는 방법을 통해 추천 알고리즘에 이용된다고 합니다.
세 번째 : 도구 변수
도구 변수는 계량경제학에서 OLS가 B.L.U.E.이기 위한 고전적 가정 중 외생성을
불만족할 때 사용하는 방법입니다.
제품 A/B 테스트에서, 외생성을 불만족하는 경우가 많기 때문에
많이 사용된다고 합니다.
--
학부시절, 데이터마이닝 강의와 학술회를 통해
머신러닝을 처음 알게 되어 재밌게 공부했던 기억이 있습니다.
지금은 멀리 동떨어지게 되어 접할 기회가 잘 없었는데,
오랜만에 공부 욕심이 나게 하는 글이었습니다!
'데이터분석가 > 데분당태 블로그챌린지' 카테고리의 다른 글
무작위 시행이 필요한 이유, 선택편의를 제거하는 방법 (0) | 2023.05.01 |
---|---|
이벤트 로그 체계 구축 여정 (0) | 2023.04.30 |
데이터 분석가 면접 보러가서 내가 해봤던 질문 14가지 (0) | 2023.04.28 |
의심 많은 데이터 분석가가 지표를 볼 때 하는 생각들 (0) | 2023.04.27 |
시계열 데이터 교차검증 방법 9가지 (0) | 2023.04.26 |
댓글