본문 바로가기

데이터분석가/데분당태 블로그챌린지13

데이터 파이프라인 개념 정리 https://playinpap.github.io/data-pipeline/ 데이터 파이프라인 개념 정리 들어가며 우리는 주로 BI 툴이나 대시보드 툴을 통해 데이터를 확인하고 분석합니다. 하지만 이 데이터, … playinpap.github.io 이 글은 PAP 커뮤니티에 게재된 홍선아님의 글을 읽고 요약한 글입니다. 자세한 내용은 원문을 참고하시면 좋습니다! -- 데이터 파이프라인 차례대로 전달해 나가는 데이터로 구성된 시스템. 목적에 따라 다르지만, 흔히 데이터 소스 - 추출 - 정제 - 변환 - 저장의 과정을 포함합니다. 에서는 두가지로 분류하고 있다. 데이터 웨어하우스를 주축으로 한 데이터 파이프라인 데이터 레이크를 주축으로 한 데이터 파이프라인 데이터 수집 방식 벌크형 : 이미 존재하는 데이터.. 2023. 5. 2.
무작위 시행이 필요한 이유, 선택편의를 제거하는 방법 https://playinpap.github.io/random-assignment/ 인과추론 첫번째 - 무작위 시행이 필요한 이유 들어가기 앞서 학교에서 계량경제학을 수강했을 때 교수님께 가장 처음 들었던 말은 ‘다른 조건이 동일하다면?… playinpap.github.io https://playinpap.github.io/casual-inference-selection-bias/ 인과추론 두번째 – 선택편의를 제거하는 방법 들어가기 앞서 지난 시간에는 무작위 시행의 필요성에 대해 이야기했다! 바로 선택편의를 제거하기 위한 것!!… playinpap.github.io playinpap 커뮤니티에 게시된 경윤영님의 글을 참고하여 정리한 내용입니다. 자세한 내용은 원문을 참고하시면 좋습니다. -- ceter.. 2023. 5. 1.
이벤트 로그 체계 구축 여정 https://spoqa.github.io/2023/04/28/journey-to-building-an-event-log-system.html 이벤트 로그 체계 구축 여정 키친보드 서비스의 로그 체계를 새롭게 개편한 과정을 공유합니다. spoqa.github.io 이 글은 스포카의 양현승 데이터분석가님이 작성하신 글을 읽고 정리한 글입니다. 식자재 주문∙관리 앱 키친보드를 운영하는 스포카의 이벤트 로그 설계 과정이 궁금하신 분은 원문을 참고하세요! -- 0. 이벤트 로그 체계 구축을 하게 된 배경 데이터 분석 환경이 충분히 구축되지 않은 상태에서 서비스 개선에 필요한 데이터가 충분치 않아 이벤트 로그 체계를 구축하게 되었다. 1. 이벤트 로그 설계 과정 로그 설계를 위한 문서로 동시 수정과 공유에 용이한.. 2023. 4. 30.
통계학이 제품 분석의 실제 도구가 되는 과정 https://playinpap.github.io/statistics-to-data-product-analysis/ 통계학이 제품 분석의 실제 도구가 되는 과정 이 글은 작성자 블로그 에서도 보실 수 있습니다. 필자가 ML을 뉴스가 아닌 곳에서 제대로 처음들어본 곳… playinpap.github.io PAP 커뮤니티에서 이용혁님이 작성하신 '통계학이 제품 분석의 실제 도구가 되는 과정'을 읽고 정리한 글입니다. -- 첫 번째 : 암환자의 생존율을 예측하던 모델이 고객 이탈 분석으로 Cox Proportional-Hazards(1972) 는 환자의 질병과 생존시간 간의 연관성을 조사하는 의학 연구에 사용되어온 회귀 모델입니다. 하지만, 보험 고객 이탈 예측과 같은 곳에 사용되고 있다고 합니다. 두 번째 .. 2023. 4. 29.