스타스키마
- 팩트테이블을 중심으로, 디멘젼 테이블이 주위를 둘러쌓은 모델 (별모양으로)
- 이해하기 쉽다
- 팩트 테이블은 3정규형, 차원 테이블은 2정규형
- 조인 감소하여 쿼리 성능 향상
- 분석관점이 명확하고, 데이터가 많은 경우 유리
- 다른 관점으로 분석 요구 시 차원 테이블이 추가되고, 팩트를 다시 말아야 하거나 다른 팩트 테이블이 추가되어야 할 수도 있다.
- 분석관점이 명확 하지 않을 경우, 스노우플레이크가 더 적합할 때도 있다.
- 번역본인데 아래는 뭔소리야
- 비즈니스 사용자들이 다양한 차원을 살펴봄으로써 디자인 단계에서 고려하지 못했던 질문에 대한 답을 찾을 수 있다 ??
- 팩트테이블의 세부 표현 수준에 따라 다양한 수준에서 롤업할 수 있다
- 차원 테이블이 많을 수록 더 많은 측면에서 리포팅이 가능 (당연한소리아녀?)
스노우플레이크 스키마
- 스타스키마의 변형, 더 복잡해진
- 데이터 중복을 제거하기 위해 차원 테이블을 추가로 정규화 (3NF)
- 3NF : 이행적 함수 종속이 없는 것 (기본키 이외의 다른 컬럼이 그외 다른 컬럼을 결정할 수 없다)
- 그러나 DW에서 '더 정규화 한다'는 컨셉 자체가 상대적으로 실용성이 떨어지며, 더욱이 빅데이터 플랫폼에서는 선호되기 힘든 방식이다.
- 데이터 중복을 제거하기 위해 차원 테이블을 추가로 정규화 (3NF)
- 다대일 관계를 갖는 차원 테이블로 둘러 쌓여 있음
- 저장 공간을 절약할 수 있지만, 차원 테이블 수가 증가
- 조인 증가하여 쿼리 성능 감소
- 조인 증가하여 스타 스키마 쿼리보다 복잡
- 스타스키마에 비해 소규모 DW환경에 적합
- 확장에 용이
- 차원 테이블의 컬럼수가 많고, 대용량 및 차원 테이블내에 중복 데이터가 많을 때, 스토리지 용량이 부족할 때(?) 공간 절약이 가능하므로 적절한 방법 인듯?
복합스키마
- 스타스키마, 스노우플레이크 스키마는 각각 장단점을 가지고 있으므로, 실제 프로젝트에서는 획일적으로 설계하지 않고 복합적으로 설계
- 데이터 무결성 유지 및 데이터 중복성을 줄이기 위한 정규화와 성능 향상을 위한 비정규화가 일정한 수준에서 조합된 형태
- 집계 상세수준을 고려
- 사용자 질의 유형과 질의 응답 성능을 고려
별자리스키마
- 각기 다른 팩트 테이블들이 동일한 차원 테이블과 조인되는 구조
- 여러 스타스키마들이 집합관계를 갖고 있음
대게 스타스키마로만 이루어진 DM에서 나타남
'학습장 > Data Engineering' 카테고리의 다른 글
ADF 배치작업 모니터링 방안 (1) | 2023.02.07 |
---|---|
Azure 환경에서 구동되는 ETL - Azure ADF (1) | 2023.01.16 |
[DW] Dimensional Modeling (2) | 2022.11.24 |
[DW] OLAP 정의와 목적 (3) | 2022.11.18 |
[DB] index 등 기본개념 정리 (3) | 2022.11.08 |
댓글