SAP HANA 数据仓库中的模式

2018-11-27 14:17 更新

模式是数据仓库(Data Warehouse)中表的逻辑描述。通过连接多个事实和维表来创建模式以满足某些业务逻辑。

数据库使用关系模型来存储数据。但是,数据仓库使用连接维度和事实表的模式来满足业务逻辑。在数据仓库中使用了三种类型的模式:

  • 星型模式(Star Schema)
  • 雪花模式(Snowflakes Schema)
  • 星系模式(Galaxy Schema)

星型模式

在星型模式中,每个维度被连接到一个单一的事实表。每个维度仅由一个维度表示,不会进一步标准化。

维度表包含用于分析数据的一组属性。

示例 - 在下面给出的示例中,我们有一个事实表FactSales,其中包含所有维度表的主键以及度量(units_sold和dollars_ sold)以做分析。

我们有四个维度表 - DimTime,DimItem,DimBranch,DimLocation

Star Schema

每个维度表都连接到事实表,因为事实表具有每个用于连接两个表的维度表的主键。

事实表中的事实/度量以及维度表中的属性用于分析目的。

雪花模式

在Snowflakes模式中,一些维表进一步标准化并接到单个事实表。标准化用于组织数据库的属性和表格以最小化数据冗余。

规范化涉及将表分解为较少冗余的较小表,而不会丢失任何信息,较小的表连接到维度表。

Snowflakes Schema

在上面的例子中,DimItem和DimLocation维度表被标准化,不会丢失任何信息。这被称为雪花模式,其中维度表被进一步标准化为较小的表格。

星系模式

在星系模式中,有多个Fact表和维表。每个事实表存储几个维度表的主键和度量/事实以进行分析。

Galaxy Schema

在上面的例子中,有两个事实表FactSales,FactShipping和多个维度表连接到事实表。每个事实表都包含用于连接维度表的主键以及度量/事实以执行分析。


以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号