본문 바로가기
데이터분석가/Tableau

[태블로 신병훈련소] DAY 6

by chan's chance 2023. 2. 13.

<학습 안내>

1. 배송 시간 : XX 시간 YY 분으로 표현하기

∙ 데이터 : 주문(샘플 - 슈퍼 스토어)

왼쪽 테이블에서 option 키를 누른 채로 행 패널에 내려놓으면 다음과 같은 창이 뜬다.

YMD 형식을 선택하여 표현한다. 똑같은 과정을 주문 일자 필드에 반복한다.

 

 

주문 일자와 배송 일자 간의 차이를 나타내기 위해 DATEDIFF 함수를 이용하여 배송기간 (분) 필드를 생성한다.

생성한 필드를 행 패널에 가져와 불연속형으로 변환한다.

 

 

 

 

주문 일자와 배송 일자에 시간이 입력되어 있지 않아 0분으로 표현될 수 밖에 없다.

 

 

1-1. 배송 기간을 지도에 표현하기

 

 

 

 

2. 세부 수준 계산식

∙ 데이터 : 주문(샘플 - 슈퍼 스토어)

 

 

(1) FIXED : 특정 차원 수준으로 고정하여 집계하는 경우

(2) EXCLUDE : 특정 차원을 제외한 수준으로 집계하는 경우

(3) INCLUDE : 뷰 수준에 없지만, 특정 차원을 포함하여 집계하는 경우

 

 

 

 

매출 필드는 행 패널 수준에 따라 제품 중분류별 매출액의 합계를 나타내지만, fixed 필드는 제품 대분류 필드를 고정하여 만든 필드이기 때문에, 제품 대분류의 매출 합계를 나타내고 있다.

 

 

 

 

3번째 열 exclude는 제품 중분류 차원을 제외하여 생성한 필드이기 때문에 제품 대분류에 따른 매출의 합계를 보여주고 있다.

 

 

 

 

행 패널의 세부수준을 [주문 번호] 차원으로 생성한 매출의 합계와 [지역] 차원을 포함하여 계산한 필드의 매출 합계는 같다. 하지만, 두 필드의 값을 평균으로 집계하였을 때, 왼쪽 차트는 주문 번호별 매출 평균을 나타내는 반면에, 오른쪽 차트는 지역별 매출 평균을 나타내고 있다.

이게 무슨 말인가? -> 태블로 도움말에서 더 공부해볼 것.

 

 

2-1. 유입 시점별 고객 매출 기여도 : 2014년도에 처음 구매한 고객이 2017년도 매출에 얼마나 기여하고 있을까?

(1) 처음 구매한 고객을 보기 위해 [첫 구매시점]이라는 필드를 생성

 

 

 

 

(2) 각 연도별 구성비율로 나타내기

[합계(매출)] - [퀵 테이블 계산] - [구성 비율]

[합계(매출)] - [다음을 사용하여 계산] - [테이블(아래로)]

 

 

 

 

2-2. 주민번호 당 평균 매출 금액

 

 

 

 

단순히 [매출] 차원을 [주문 번호] 차원으로 집계하는 경우 각 주문 번호의 매출 금액을 주문 번호의 개수로 나눈 값이 된다.

즉, 주문번호 IN-2015-37320, ... 의 평균 매출 금액을 구하게 되는 것이다. 

 

이것이 아니라, 전체 매출을 주문번호의 개수로 나누어 구한 주문번호 당 평균 매출 금액을 구하고자 한다. 이에 더하여, 이것을 계산식으로 만듦으로써, 차원을 패널에 삽입하지 않고 구하고자 한다.

 

 

 

 

차원을 패널에 삽입하지 않고, 주문번호 당 평균 매출 금액을 구하기 위해서는 LOD식을 사용하여야 한다.

때에 따라, fixed, include, exclude를 적절히 사용하여 구현할 수 있다.

 

 

 

 

상위 15가지 LOD 표현식

Tableau의 사명은 사람들이 데이터를 보고 이해하는 일을 돕는 데 있습니다. Tableau 기능은 사용자가 데이터를 의미 있는 정보로 변환할 수 있도록 신중하게 설계되었습니다. Tableau에서 중점적으로

www.tableau.com

 

 

3. 테이블 계산

원본 데이터에서 집계가 되어 계산된 값으로 2차 계산하는 것을 테이블 계산이라고 하며, [퀵 테이블 계산]을 통해 할 수 있다.

 

 

 

 

3-1. 지역별 TOP 3 (매출 기준) 제품 찾기 (정렬)

매출을 지역별, 제품 중분류별로 나누고 매출의 순서대로 정렬하고 싶은 경우, 매출 필드를 복제하여 [퀵 테이블 계산] - [순위]를 선택한다.

 

 

 

 

Q ) 연속형과 불연속형의 차이가 무엇인가요?
A ) 여러 가지가 있지만, 그 중 가장 대표적인 것은 연속형은 축을 만들고, 불연속형은 머릿글을 생성하여 자료를 분할하는 역할을 한다.

 

여기서, '지역별'  매출의 순위를 보고자 하는 경우, 순위를 나타내는 매출 필드의 [다음을 사용하여 계산] - [패널(아래로)]를 선택한다.

 

 

 

 

필터에 매출 필드를 복제하여 1,2,3 순위만 나타내도록 한 다음, 행 패널의 매출 필드의 [머릿글 표시]의 체크를 해제한 결과이다.

 

 

 

 

3-2. 분기별 수익이 최대 수익일 때 확인하기 (기록 수익)

 

 

불연속형 분기로 나타낸 경우
연속형 분기로 나타낸 경우

 

 

주문일자 필드에서 불연속형 분기와 연속형 분기를 선택할 수 있다. 연속형 분기를 선택하는 경우, 잘 보면 축으로 나타낸다.

 

기록 수익(수익 중 가장 높은 수익)을 보는 것은 [계산된 필드]를 통해 할 수 있다.

Q ) MAX 와 RUNNING_MAX의 차이는 무엇인가요?

A ) MAX를 사용하는 경우, 각 분기에서의 최대값을 나타내지만, RUNNING_MAX를 사용하는 경우, 누계값 중에서 2014년 1분기~2014년 4분기 내의 최대값을 나타낸다.

 

 

상단에 있는 차트는 분기별 수익 차트, 하단에 있는 차트는 현재까지 가장 높은 수익(기록 수익)

 

 

수익 차트에 해당 분기의 수익이 기록 수익인지에 대해 표시하고자 [계산된 필드]를 통해 [기록 수익?] 필드를 생성하였다. 생성된 필드를 [색상]으로 표현한 후 마크를 [원]으로 선택하였고, 수익 차트와 겹치기 위해 [이중 축]을 선택하였다.

 

 

 

<과제>

1. 테이블 계산식 - 차이

과제 예시

 

 

[종가] 필드의 [퀵 테이블 계산] - [차이] 를 선택하여, 테이블 계산식을 조회하고 데이터 테이블에 [전일 대비 종가 등락]으로  저장한다.

 

 

 

 

IF 논리식을 이용하여, [전일 대비 종가 등락 여부] 계산식 필드를 생성한다. 생성한 필드를 [종가] 필드를 하나 복제하여 [마크] - [색상]으로 표현하도록 하고, 모양을 [원]으로 설정하고 크기와 테두리 등을 설정한다. 그리고, 기존에 있던 [종가]필드와 복제한 [종가(2)]필드를 같이 나타내기 위해 [이중 축]을 선택한다.

 

 

 

 

[마크] - [레이블] - [레이블 마크] - [최소/최대]를 선택하여 최솟값과 최댓값에만 레이블을 표시하고,

[축 편집] - [0 포함] 해제, [눈금자] - [고정] - 500으로 세부설정을 완료한다.

 

 

과제 결과물

 

 

1-1. [추가] 워크시트 동작 활용하기

 

 

[워크시트] - [동작] - [동작 추가]
구현 결과

 

 

<참고>

 

마크 레이블 표시, 숨기기 및 서식 지정

비주얼리제이션의 데이터 요소에 레이블을 추가할 수 있습니다

help.tableau.com

 

 

2. 테이블 계산식 - 구성비율

 

 

과제 예시

 

 

1. [경도], [위도] 필드를 열 선반과 행 선반에 위치시킨다.

2. [국가], [지역], [시도], [시군구] 필드를 계층으로 묶은 후, [국가] 필드를 마크 카드의 [세부 정보]로 설정 후 드릴다운을 통해 시도 수준까지 나타낸다.

3. [매출] 필드를 마크 카드의 [색상]과 [레이블]로 설정한 후에, [레이블]에 설정한 [매출] 필드의 [퀵 테이블 계산] - [구성 비율]을 선택하여, 전체 매출 중 시도별 매출 비율을 나타낸다.

4. [지역] 필드를 필터로 설정한 후에 필터를 우측에 표시한다.

 

 

과제 결과

 

 

3. 지역별/전국구 구성비 함께 보기

 

 

과제 예시

 

 

수도권 필터를 적용했을 때

 

 

1. [경도], [위도] 필드를 열 선반, 행 선반에 위치시킨다.

2. 위 과제와 마찬가지로 드릴다운을 이용해 마크 카드의 [세부 정보]를 [시도] 수준으로 설정한다.

3. [매출] 필드를 마크 카드의 [색상]과 [레이블] 로 설정한 후, [레이블]에 해당하는 [매출] - [퀵 테이블 계산]을 [구성 비율]로 설정한다.

4. [지역] 필드를 필터로 설정하고, 우측에 표시한다. 수도권에 필터를 적용하는 경우, 다음과 같이 전국 기준 매출 구성비가 아닌 수도권 기준 매출 구성비가 적용되어 화면에 나타난다. 필터를 적용함에도, 전국을 기준으로 매출 구성비를 보고자 하면 아래와 같이 세부수준 계산식(LOD)을 사용하여야 한다. [전국 기준 매출] 필드를 생성한 후, 이를 이용해 [전국 기준 매출 구성비] 필드를 생성하여, 마크 카드의 [레이블]로 설정한다.

5. 마크 카드의 [도구 설명]을 수정하여 화면에 텍스트가 적절히 표시되도록 수정한다.

 

 

LOD를 사용한 전국 기준 매출 필드와 그 필드를 이용하여 생성한 전국 기준 매출 구성비
과제 결과

 

 

4. 세부 수준 계산식 : 과거 고객 매출 기여도 및 신규 유입 고객 현황 분석

 

 

 

 

5. [추가 도전] 코호트 분석

 

 

과제 예시

 

 

IIF(논리식, TRUE일 경우 값, FALSE일 경우 값)을 이용하여, 최초 구매일을 제외한 주문 일자를 계산한다.

그 다음, MIN() 함수를 이용하여, 최초 재구매일을 계산한다. 마지막으로, LOD식을 이용하여 [고객번호] 필드를 포함하는

세부수준 계산식을 완성하여 결과적으로, 고객별 최초 재구매일을 계산하는 필드를 생성한다.

 

 

 

 

이렇게 구한 고객별 최초 구매일과 고객별 최초 재구매일 간의 차이를 분기 단위로 나타내고자 DATEDIFF('quarter',시작 날짜,끝 날짜) 를 이용한 계산식을 통해 고객별 재구매 경과시간을 계산한다.

 

 

과제 결과

'데이터분석가 > Tableau' 카테고리의 다른 글

[태블로 신병훈련소] DAY 8  (0) 2023.02.19
[태블로 신병훈련소] DAY 7  (0) 2023.02.14
[태블로 신병훈련소] DAY 5  (0) 2023.02.13
[태블로 신병훈련소] DAY 4  (0) 2023.02.13
[태블로 신병훈련소] DAY 3  (0) 2023.02.13

댓글