Tableau

[Tableau] 기본 개념 - 차원/측정값, 연속형/불연속형, 계산 방법

루루23 2024. 11. 11. 14:28
반응형

1. 차원과 측정값

차원(Dimension):
- 질적, 범주형 데이터 (예: 이름, 날짜, 지역 등)
- 데이터를 분류하고 구조화하는 데 사용
- 일반적으로 불연속형(discrete) 필드이며 파란색으로 표시
- 행이나 열에 배치하면 머리글이 생성됨

측정값(Measure):
- 양적, 수치형 데이터 (예: 매출, 수량, 이익 등)
- 집계 및 계산에 사용
- 일반적으로 연속형(continuous) 필드이며 녹색으로 표시
- 행이나 열에 배치하면 축이 생성됨

 

2. 연속형과 불연속형

연속형 데이터
- 무한한 값을 가질 수 있으며, 값 사이에 중간값이 존재
- 측정 가능한 양, 대표적인 예) 시간, 온도, 무게 등
- Tableau에서는 초록색으로 표시되며, 축(axis)을 생성
- 그라데이션 형태의 색상으로 표현
- 필터에서 범위로 설정 가능

불연속형 데이터
- 구별 가능한 개별 값, 셀 수 있는 유한한 값
- 주로 계수나 범주화를 통해 얻어짐
- Tableau에서는 파란색으로 표시, 개별 값으로 나타남
- 서로 다른 색상으로 표현
- 필터에서 개별 값 선택 가능

날짜 데이터의 특수성
- 연속형 날짜는 큰 맥락 속에서 상위 개념을 포함
- 불연속형 날짜는 상위 개념과 별개로 각각 독립적으로 처리됨

차원과 측정값과의 관계
- 일반적으로 차원은 불연속형, 측정값은 연속형으로 사용되지만, 항상 그런 것은 아님
- 차원과 측정값은 데이터의 역할을 나타내는 반면, 연속형과 불연속형은 데이터의 특성을 나타냄

[참고]

연속형으로 사용되는 차원 (Continuous Dimension) 불연속으로 사용되는 측정값 (Discrete Measure)
날짜 차원:
- 가장 흔한 연속형 차원입니다.
- 예: 2023년 1월 1일부터 2023년 12월 31일까지의 매출 추이를 연속적인 선 그래프로 표현할 때, 날짜를 연속형으로 사용합니다.
등급 또는 점수:
- 1부터 5까지의 고객 만족도 점수를 개별적인 카테고리로 취급할 때 불연속 측정값으로 사용할 수 있습니다.
- 예: 각 만족도 점수별 고객 수를 막대 그래프로 표현할 때, 만족도 점수를 불연속 측정값으로 사용합니다.
숫자로 된 ID:
- 고객 ID나 제품 ID가 연속적인 숫자로 되어 있을 때, 이를 연속형으로 사용할 수 있습니다.
- 예: 고객 ID에 따른 구매 금액을 스캐터 플롯으로 표현할 때, 고객 ID를 연속형으로 사용할 수 있습니다.
반올림된 수치:
- 소수점 없이 반올림된 매출액을 개별적인 카테고리로 다룰 때 불연속 측정값으로 사용할 수 있습니다.
- 예: 천 단위로 반올림된 매출액별 주문 건수를 표현할 때, 매출액을 불연속 측정값으로 사용합니다.
위도/경도:
- 지리적 데이터에서 위도/경도는 연속형 차원으로 사용될 수 있습니다.
- 예: 지도 시각화에서 위도와 경도를 연속형으로 사용하여 부드러운 지도를 생성합니다.
빈도 또는 카운트:
- 특정 이벤트의 발생 횟수를 개별적인 카테고리로 다룰 때 불연속 측정값으로 사용할 수 있습니다.
- 예: 고객의 방문 횟수별 고객 수를 표현할 때, 방문 횟수를 불연속 측정값으로 사용합니다.

 

 

3. 네 가지 계산 방법 - 행수준 계산 , 집계 계산, 테이블 계산, LOD 표현식

1. 행 수준 계산:
   - 각 개별 데이터 행에 대해 수행되는 계산입니다.
   - 집계되지 않은 원시 데이터를 사용합니다.
   - 예: [매출] / [수량]으로 단가 계산

2. 집계 계산:
   - 데이터를 그룹화하고 집계하는 계산입니다.
   - SUM, AVG, COUNT 등의 집계 함수를 사용합니다.
   - 예: SUM([매출])으로 총 매출 계산

3. 테이블 계산:
   - 이미 집계된 결과에 대해 추가적인 계산을 수행합니다.
   - 현재 뷰의 구조에 따라 결과가 달라집니다.
   - 예: 전년 대비 성장률, 누적 합계 등

4. LOD (Level of Detail) 표현식:
   - 뷰의 세부 수준과 독립적으로 계산을 수행합니다.
   - FIXED, INCLUDE, EXCLUDE 키워드를 사용합니다.
   - 예: {FIXED [고객]: SUM([매출])}로 고객별 총 매출 계산

반응형