본문 바로가기
학습장/Data Engineering

[DW] Mart Modeling

by daedoo_ 2022. 11. 28.

스타스키마

  • 팩트테이블을 중심으로, 디멘젼 테이블이 주위를 둘러쌓은 모델 (별모양으로)
  •  

  • 이해하기 쉽다
    • 팩트 테이블은 3정규형, 차원 테이블은 2정규형
  • 조인 감소하여 쿼리 성능 향상
  • 분석관점이 명확하고, 데이터가 많은 경우 유리
    • 다른 관점으로 분석 요구 시 차원 테이블이 추가되고, 팩트를 다시 말아야 하거나 다른 팩트 테이블이 추가되어야 할 수도 있다.
    • 분석관점이 명확 하지 않을 경우, 스노우플레이크가 더 적합할 때도 있다.
  • 번역본인데 아래는 뭔소리야
    • 비즈니스 사용자들이 다양한 차원을 살펴봄으로써 디자인 단계에서 고려하지 못했던 질문에 대한 답을 찾을 수 있다 ??
    • 팩트테이블의 세부 표현 수준에 따라 다양한 수준에서 롤업할 수 있다
    • 차원 테이블이 많을 수록 더 많은 측면에서 리포팅이 가능 (당연한소리아녀?)

 

 

스노우플레이크 스키마

  • 스타스키마의 변형, 더 복잡해진
    • 데이터 중복을 제거하기 위해 차원 테이블을 추가로 정규화 (3NF)
      • 3NF : 이행적 함수 종속이 없는 것 (기본키 이외의 다른 컬럼이 그외 다른 컬럼을 결정할 수 없다)
    • 그러나 DW에서 '더 정규화 한다'는 컨셉 자체가 상대적으로 실용성이 떨어지며, 더욱이 빅데이터 플랫폼에서는 선호되기 힘든 방식이다.
  • 다대일 관계를 갖는 차원 테이블로 둘러 쌓여 있음
  • 저장 공간을 절약할 수 있지만, 차원 테이블 수가 증가
    • 조인 증가하여 쿼리 성능 감소
    • 조인 증가하여 스타 스키마 쿼리보다 복잡
  • 스타스키마에 비해 소규모 DW환경에 적합
  • 확장에 용이
  • 차원 테이블의 컬럼수가 많고, 대용량 및 차원 테이블내에 중복 데이터가 많을 때, 스토리지 용량이 부족할 때(?) 공간 절약이 가능하므로 적절한 방법 인듯?
  •  

 

복합스키마

  • 스타스키마, 스노우플레이크 스키마는 각각 장단점을 가지고 있으므로, 실제 프로젝트에서는 획일적으로 설계하지 않고 복합적으로 설계
  • 데이터 무결성 유지 및 데이터 중복성을 줄이기 위한 정규화와 성능 향상을 위한 비정규화가 일정한 수준에서 조합된 형태
    • 집계 상세수준을 고려
    • 사용자 질의 유형과 질의 응답 성능을 고려

 

 

별자리스키마

  • 각기 다른 팩트 테이블들이 동일한 차원 테이블과 조인되는 구조
    • 여러 스타스키마들이 집합관계를 갖고 있음

대게 스타스키마로만 이루어진 DM에서 나타남

'학습장 > Data Engineering' 카테고리의 다른 글

ADF 배치작업 모니터링 방안  (1) 2023.02.07
Azure 환경에서 구동되는 ETL - Azure ADF  (1) 2023.01.16
[DW] Dimensional Modeling  (2) 2022.11.24
[DW] OLAP 정의와 목적  (2) 2022.11.18
[DB] index 등 기본개념 정리  (3) 2022.11.08

댓글