본문 바로가기
패스트캠퍼스 데이터분석 부트캠프 14기

[Tableau] 태블로의 기초: 데이터 시각화 툴의 모든것

by 꾸꾸집사 2024. 7. 17.


태블로 1년에 120만원이라는 어마어마한 몸값을 지닌 툴이지만 그 가격의 값을 톡톡히 하는 엄청난 자식..! 

 

이 게시글은 태블로를 공부하면서 그때그때 수정에서 추가 업로드하는 방식으로 정리해보려고 합니다 👍 

(공부 기록 목적)


 

🔆차원과 측정값

- 측정값: 관찰하고자 하는 대상 그 자체


- 차원: 측정값을 어떻게 '썰어서' 볼것인가. (성별 기준, 연도기준, 월별 기준 등등..)

            SQL 쿼리문으로 따지면 GROUP BY 

 

 

🔆연속형과 불연속형

- 연속형: 연속형이 시트에 올라가면 '축'이 생긴다

 

- 불연속형: 불연속형이 시트에 올라가면 그 '리스트'가 생긴다

 


💥Tip. 시트위에 필(pill) 올려놓을 때 마우스 '우클릭' 하기 

 

 

💥 초록색 - 파란색 순서로 선택하면 축이 먼저생기고 그래프가 나오지만,

파란색을 먼저 선택하고 측정값(초록색)을 선택하면 '표' 형태가 나온다

 


 

🔆 머리글과 패널 

서식 수정할 때 꼭 구분해서 봐줘야 한다.

 

 

🔆Level Of Detail

- 태블로는 '집계' 한다.집계의 default 는 => 합계 집계의 방식은 합계, 평균, 중앙값, 분산,표준편차 등등이 있다.

 

- 어떻게 썰 것인가?화면을 만드는 사람은 항상 어떤 기준으로 데이터를 볼 것인지 결정해야한다.

 

- VLOD 화면이 잘게 썰려진 정도View Level Of Detail데이터를 나누는 기준(차원)은 여러개가 될 수도 있다. 차원이 늘어날수록 잘게 썰려진 화면이 되는 것이다.

 

✅ 차원과 측정값 중 오직 차원만 화면의 LOD를 결정한다 => YES . 

 

 

🔆 계산 

- 행 수준 계산 / 집계 계산 / 테이블 계산 

- 집계 계산

'계산된 필드 만들기' 에서

profit + sales 와 sum(profit) + sum(sales)의 차이

1번은 profit 로우 1개 와 sales 로우 1개를 각각 더해서 그 더한것을 한번에 집계 하는 방식

2번은 profit 로우 전체를 집계하고, sales 로우 전체를 집계한 다음에 그 집계된 로우 2개를 합치는 것

 

이것은 + 연산에서는 문제가 되지않는다. 그러나 곱셈 나누기 계산에서는 문제가 된다

1번은 하나하나를 나눈 결과를 더한것 => 각각 비율의 합계 => 따라서 비율이 아닌 큰 숫자가 나올 것임 

2번은 profit 집계 한것과 sales 집계한것을 나누는 것. => 진정한 비율

 

- LOD 표현식

내가 원하는 것만 집계해서 옆에 있는 로우와 관계없이 만들 수 있는 식 

 

 

 

🔆 대시보드

- 빈 페이지 (컨테이너) 항상 이용하기

- 대시보드의 꽃 => 하이라이트 액션 이용하기

  원본시트: 어떤 행동을 했을때 액션 하게 해주는 기준이 되는 시트 고르기

                  (예시. year컬럼에 마우스 올리면(행동) 액션 진행해!)

  대상시트: 그 원본시트에 액션 했을때 액션을 함께 보여줄 시트 고르기 

                  (year에 마우스 올리면(원본시트) 2번시트의 year에따른 구분, 3번시트의 year에 따른 구분을 불켜줘)

 

- 대시보드 필터링

 


 

💥태블로는 항상 '집계'한다.

 

💥 태블로는 항상 집계하기 때문에 측정값을 바꿔야하는 경우가 있다.

ex. DISCOUNT(할인율)은 합계하는 개념은 아니잖아 → 평균이 더 알맞겠다.


 

🔆 마크카드

- 색상 넣기

 

 

🔆 워크시트 뒤에 grid (격자선)지우기

- 서식 →  통합문서 → 격자선 해제

 

 

🔆 바 차트 밑에 지지선 만들기 

- 서식 라인   '0 기준선'

- 만약 가로로 세워진 바 차트라면: 서식   라인   열 '0 기준선'

 

 

🔆 레이블 깔끔하게 붙이기

-마크카드   레이블   '레이블 지정할 마크' 에서 직접 골라보기!

- 주로 '최대최소' 많이 씀!

 

 

🔆 영역차트 만들기 (영역차트와 라인차트는 어떻게 다른가?)

- 영역차트: 라인차트 만들고 → 같은 측정값 하나 더 넣어서 라인차트 위아래 두개 만들고 → '마크 카드'에서 하나는 라인으로, 하나는 '영역'으로 바꿔주기

 

(복수 항목으로 색상을 나누게 되면 라인차트와 영역차트는 모양이 달라진다.)

- 영역차트는 복수항목에 대해 '누적'해서 value를 만드는 차트다. 

-  라인차트는 각각의 복수항목에 대해 각각 라인을 보여준다.

 

🔆 스캐터 플롯 

- 측정값과 측정값

- 집계하는 방식에 따라 측정값 잘 바꿔주기 ex. Sales는 합계, Discount는 평균으로

 

- 추세선 넣기 : 분석 탭 → 추세선 → 드래그 앤 드랍 

- 추세선 의미: profit = 기울기 => 앞으로는 기울기 이렇게 해석하기 => x축(판매량)이 1증가할때 y축 이익이 0.171만큼 증가한다.⭐

R제곱: Sales(x축)가 profit(y축)의 변동에 영향을 주는 정도가 34% 이다. (단점: profit에 영향을 주는 다른 변수가 나오면 설명력이 약해짐)
p밸류: 매출과 이익의 상관관계가 유의미하다

 

 

🔆 박스 플롯

- 이상치(outlier)를 판별하기에 좋은 플롯

 

- 만들기: ctrl로 원하는 차원가 측정값 잡기 → 오른쪽 상단 표현방식 → 박스플롯 선택!

 

 

🔆히스토그램

- 우클릭 →  만들기 →  구간차원 →  새롭게 만들어진 필드(구간차원)을 에 드래그앤드랍 →  항목(스튜던트아이디) 오른쪽마우스로 에놓고 '카운트'
-히스토그램은 '연속형(초록색)'으로 만들어야한다

 

 

🔆 기본속성 중 '통화' 바꾸기

1. 워크시트에 계속 적용되도록 (영구적)으로 바꾸기

 왼쪽 '데이터' 탭에서 원하는 필 선택 → 우클릭 → 기본속성 → 숫자형식 → 원하는대로 바꾸기~

⭐ 왼쪽 데이터에 있는 필을 건드리는 것은 ==> 근본 속성을 건드리는 것. 모든 워크시트에 적용! 

 

2. 반영구적으로 바꾸기 

이미 드래그 앤 드랍 한 필드 우클릭 → 서식 → '패널 ' 선택 → 기본값 → 숫자 

 

 

 

🔆 discount 할인율 % 붙이기

1, 영구적인 방법: 왼쪽 데이터에서 필 선택 → 우클릭 → 기본속성 → 숫자형식 → 백분율 → 소수 자리수 정하기

 

2. 반영구적 방법: 드래그 앤 드랍한 필 우클릭 → 서식 → 패널 → 기본값 → 숫자 → 백분율  → 소수 자리수 정하기 

 

 

🔆 화면에 양 쪽 공백이 애매하게 생길때 강제로 축 지정하기

- 아래 축 우클릭 → 축편집 → 사용자 지정 선택 → 고정된 끝을 1로 설정하고 나가기 !

 

 

✅  퀵테이블 계산에서 구성비율로 바꾸는 방법도 기억! 

 

 

🔆 대시보드 만들기 

1. 사이즈 잡아주기 (가로 1200 ~1500 * 세로 800)

2. 화면 구도 잡기: 컨테이너 잡기 → 빈페이지 넣기 

3. 텍스트 넣기 

4. 컨테이너별 균등분할, 컨데이너별 높이 조정 

 


🔆데이터 준비

1. 유니온

- 테이블 여러개를 한번에 다룰 수 있게 

- 세로 결합    

- 아예 다른 엑셀 파일도 UNION이 가능하다! → 유니온 변환 (와일드카드)

- 테이블마다 컬럼명이 다를 때 → ctrl 선택 →  불일치 필드 병합 

 

2. 조인: 물리적 결합

-  '추가' 버튼 

-  준비창 가운데 시트 더블 클릭

- 물리적 결합이기 때문에 태블로의 주 기능인 '집계'에서 문제가 생길수도있음! 

→ 집계가 되면 안되는데 물리적 결합으로 인해 태블로에 띄우면 집계가 되고 결과가 뻥튀기 됨  → 해결 (3번 관계)

ex

 

3. 관계: 느슨한 결합

-  시트 드래그 앤 드랍 

 

4. 블렌딩: 화면에서의 ad-hod 결합

- 임시결합 

- 다른 종류의 데이터 소스를 가져올 때 ex. 오라클과 엑셀에 있는 각각의 데이터 셋을 함께 보고싶을 때 

 

 

 

🔆 필터 ⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐ 별표 100개 ⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

-  추출: 데이터 원본과 태블로 간에 연결이 끊어지는것. 딱 끊어서 그것만 가지고 내가 작업할거야

VS - 라이브: 데이터 원본과 태블로 간에 연결되어있는것. 바뀌는 데이터를 계속해서 보면서 작업할거야

→ 추출 할때 필터가 들어가는 것 → "추출 뜨다"

 

 

 

 

 

 

 

 

 


TOP

Designed by 티스토리