SAP HANA 数据仓库中的模式
2018-11-27 14:17 更新
模式是数据仓库(Data Warehouse)中表的逻辑描述。通过连接多个事实和维表来创建模式以满足某些业务逻辑。
数据库使用关系模型来存储数据。但是,数据仓库使用连接维度和事实表的模式来满足业务逻辑。在数据仓库中使用了三种类型的模式:
- 星型模式(Star Schema)
- 雪花模式(Snowflakes Schema)
- 星系模式(Galaxy Schema)
星型模式
在星型模式中,每个维度被连接到一个单一的事实表。每个维度仅由一个维度表示,不会进一步标准化。
维度表包含用于分析数据的一组属性。
示例 - 在下面给出的示例中,我们有一个事实表FactSales,其中包含所有维度表的主键以及度量(units_sold和dollars_ sold)以做分析。
我们有四个维度表 - DimTime,DimItem,DimBranch,DimLocation
每个维度表都连接到事实表,因为事实表具有每个用于连接两个表的维度表的主键。
事实表中的事实/度量以及维度表中的属性用于分析目的。
雪花模式
在Snowflakes模式中,一些维表进一步标准化并接到单个事实表。标准化用于组织数据库的属性和表格以最小化数据冗余。
规范化涉及将表分解为较少冗余的较小表,而不会丢失任何信息,较小的表连接到维度表。
在上面的例子中,DimItem和DimLocation维度表被标准化,不会丢失任何信息。这被称为雪花模式,其中维度表被进一步标准化为较小的表格。星系模式
在星系模式中,有多个Fact表和维表。每个事实表存储几个维度表的主键和度量/事实以进行分析。
在上面的例子中,有两个事实表FactSales,FactShipping和多个维度表连接到事实表。每个事实表都包含用于连接维度表的主键以及度量/事实以执行分析。以上内容是否对您有帮助:
更多建议: