< 학습 안내 >
1. 데이터 연결
(1) 영업 실적 자료 유니온
영업 실적 4개년 자료가 각각 파일로 저장되어 있다. 데이터 시각화를 위해 네 테이블을 한 테이블로 만들고자 한다.
테이블 병합은 유니온 기능을 사용하여 할 수 있다.
(2) 지역별 관리자 파일 조인
병합이 완료된 유니온 테이블에 지역별 관리자 테이블을 조인하여 함께 보고자 한다.
조인을 실행하였더니 [유니온] 테이블의 [지역] 컬럼과 [지역별 관리자] 테이블의 [지역] 컬럼을 자동으로 조인절에 사용하였고, 조인의 형태는 INNER JOIN을 사용하였다. 하지만 <조인 결과 요약>에서 조인에서 제외된 값이 1,832건임을 확인할 수 있었다. 오른쪽에 일치하지 않은 값만 표시를 통해 [유니온] 테이블의 [지역] 컬럼에서 "서울경기" 라는 값이 [지역별 관리자] 테이블의 [지역] 컬럼에 존재하지 않아 생긴 결과임을 알 수 있었다.
조인에서 제외된 값이 발생하지 않도록, 정리 단계를 거쳐야 한다. 문제가 되는 '서울경기'값을 수도권과 [값 그룹화]를 하여 '수도권'을 기준으로 합친다.
위와 같이 정리 단계를 거친 후 조인을 다시 실행하여 결과를 확인하니 정상적으로 처리된 것을 알 수 있다.
다음으로 [반품] 테이블을 가져와 지금까지 만든 테이블에 조인하고자 한다. 조인을 한 후 결과화면을 보면, 제외된 값이 10,214로 대부분의 데이터가 제외된 것을 알 수 있다. 이는 [반품] 테이블이 [주문] 테이블 중 일부에만 해당하기 때문에 당연한 결과이다. 이를 정상적으로 조인되도록 하기 위해서는 LEFT JOIN으로 설정하여 [주문] 테이블 중 [반품] 테이블에 해당하지 않는 값들은 null로 처리하도록 하여 해결할 수 있다.
2. 데이터 추출
출력은 앞서 연결했던 테이블의 결과를 저장하는 것이다. 파일/게시된 데이터 원본/ 데이터베이스 등의 형식으로 저장할 수 있으며, 태블로 데이터(hyper) / CSV / xlsx 파일 등의 유형으로 지정할 수 있다.
< 과제 >
1. 카테고리별 평균 칼로리&카페인
(1) 열 선반에 [칼로리]와 [카페인]을 올려놓고, 각각의 [측정값]을 평균으로 설정한다.
(2) [카테고리]를 행 선반에 올려놓는다.
(3) [평균(카페인)]만 마크 카드의 색상으로 지정한다.
2. 메뉴별 칼로리&카페인
(1) [메뉴명]을 마크 카드의 레이블로 설정한다.
(2) [평균(칼로리)]를 마크 카드의 크기, [평균(카페인)]을 마크 카드의 색상으로 설정한다.
3. 카테고리와 메뉴명을 한번에 살펴보기
(1) 카테고리별 평균 칼로리&카페인 시트에서 마크 카드의 도구 설명을 선택한다.
(2) 도구 설명 우측 상단에 위치한 삽입을 눌러 [시트] - [메뉴명별 칼로리&카페인]을 선택한다.
(3) 자동으로 입력된 문장에서 maxwidth = "" 와 maxheight="" 의 큰따옴표 내 숫자를 수정하여 적절한 크기를 설정한다.
4. 당분 함유량과 칼로리 상관관계
스타벅스 메뉴의 당분 함유량과 칼로리의 상관관계를 보고자 한다. 이 때 카페인의 함유량 또한 색상과 크기로 나타내고자 한다.
(1) [당류]와 [칼로리]를 차원으로 변경하여 각각 열 선반과 행 선반에 위치시킨다.
(2) [평균(카페인)]을 마크 카드의 색상과 크기로 설정한다.
(3) 스캐터 플랏에 표현된 마크들이 겹쳐져 가독성을 낮추기 때문에, 이를 개선하기 위해 마크의 불투명도와 테두리를 적절히 설정한다.
(4) 좌측 상단 분석 탭에서 추세선을 선형으로 나타내어 추가하고, 평균 라인을 테이블 단위로 추가한다.
5. 시군구별 매장 분포 현황
(1) [시도] 를 마크 카드의 세부정보로 한다. 그리고 드릴다운을 통해 [시군구] 단위로 설정한다.
(2) [매장코드]를 마크 카드의 색상과 크기로 설정한 뒤 [측정값]을 카운트(고유)로 설정한다.
(3) 마크의 크기를 적절히 조절하고, 색상을 설정한 뒤 불투명도와 테두리를 조절하여 효과적으로 시각화한다.
6. 대시보드 만들기
1~3번 과제에서 만든 시트를 이용해 대시보드를 만들어보자.
<추가 도전 과제>
1. 칼로리가 낮으면서 카페인이 높지 않은 메뉴를 마시고 싶을 때, 어떤 시각화로 답을 찾아볼 수 있을까요?
과제의 예시가 주어지지 않아 칼로리가 낮으면서 카페인이 높지 않은 메뉴를 고를 수 있도록 하는 시각화에 대한 고민이 필요했다.
(1) 칼로리와 카페인을 가로축과 세로축에 두고, 각각 평균선을 그어주었다.
(2) 제 3사분면에 평균 칼로리, 평균 카페인 이하의 메뉴와 그 외 메뉴들과 구분할 수 있도록 수식 기준을 이용하여 생성한 집합 [평균 이하 메뉴]를 색상으로 지정하였다.
(1) 칼로리, 카페인이 낮고 높음은 개인에 따라 기준이 다를 수 있으므로, 그 기준을 지정할 수 있도록 매개변수를 생성하였다.
(2) 매개변수에 따라 개인의 선호와 부합하는 메뉴와 그렇지 않은 메뉴를 구분하기 위해 수식을 이용하여 [기준 이하 메뉴] 집합을 생성하여 색상으로 지정하였다.
2. '스타벅스 매장 정보' 데이터에 있는 경도/위도 데이터를 이용해서 아래와 같이 서울시의 실제 매장 위치를 표현하세요.
(1) 매장주소를 마크의 세부정보에 삽입하고, 경도와 위도를 각각 열 선반과 행 선반에 둔다.
(2) 마크의 색상과 크기를 적절히 조정하여 겹치는 마크들이 잘 보일 수 있도록 한다.
(3) 필터에 시도를 두고, '서울시'만 시각화한다.
'데이터분석가 > Tableau' 카테고리의 다른 글
[태블로 신병훈련소] DAY 6 (0) | 2023.02.13 |
---|---|
[태블로 신병훈련소] DAY 5 (0) | 2023.02.13 |
[태블로 신병훈련소] DAY 4 (0) | 2023.02.13 |
[태블로 신병훈련소] DAY 3 (0) | 2023.02.13 |
[태블로 신병훈련소] DAY 2 (0) | 2023.02.13 |
댓글