星型模型&雪花模型

发布时间 2024-01-09 08:47:20作者: 粒子先生

数据集市(Data Mart)也有称ADS(Application Data Store),数据集市将主题层和基础层的数据按照各业务的实际需求进行聚合,形成宽表或数据立方体(Cube),可直接供业务部门和数据分析团队使用。

数据集市中主要存在的是事实表(fact)和维度表(dimension)。

  • 事实表中存放着业务的详细数据,例如订单、销售等业务数据。
  • 维度表是围绕事实表建立的,存放着一些维度属性,定义了可以从哪些角度分析事实表,例如时间、地域、操作系统等维度。

数据集市中的数据结构一般有星型结构(star)和雪花结构(snow)。

星型结构由一个事实表和一组维表组成,每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。使得事实表与每个维度表产生关联,事实表位于中央,维度表围绕在事实表周围。

雪花结构是在星型结构上的扩展,对一些维度表进一步层次化,将维度表扩展为事实表,并建立下一层的维度表。雪花结构更加符合数据库范式,减少数据冗余,但在数据分析时,操作也可能更复杂。下方是星型结构和雪花结构的对比。

                                                             星型结构

                                                          雪花结构