top of page

通过实际示例理解各种类型的缓慢变化维度

  • 作家相片: Claude Paugh
    Claude Paugh
  • 8月11日
  • 讀畢需時 4 分鐘
在快节奏的数据仓库和商业智能领域,有效地管理数据变化至关重要。该领域的一个关键概念是缓慢变化维度 (SCD)。这些维度有助于在报告和分析中维护准确的历史记录。这篇博文将探讨不同类型的缓慢变化维度,并通过实际案例来强调它们在实际中的应用。

数据仓库缓慢变化维度
Data Warehouse Slowly Changing Dimensions

什么是缓慢变化维度?


缓慢变化维度是指数据仓库中数据属性随时间的变化方式。与频繁变化的数据不同,缓慢变化维度的演变速度较慢。这可能包括客户信息、产品详情或任何非每日更新的属性的更改。


了解不同类型的 SCD 对于有效的数据管理和报告至关重要。主要有三种类型:1 型、2 型和 3 型。每种类型都有不同的特点和用例。


类型 1:覆盖


1 型缓慢变化维度是最简单的形式。在这种方法中,当发生变化时,旧数据会被新数据替换。这意味着历史数据不会被保留,只有最新的信息可用。


类型 1 的示例


假设一位客户更改了他们的电子邮件地址。在类型 1 的 SCD 中,旧的电子邮件会被替换。例如,如果 John Doe 的电子邮件地址从 john.doe@example.com 更改为 john.new@example.com,则数据仓库中只会保留新的电子邮件地址。


当不需要历史数据时,此方法非常有效。例如,维护当前客户的联系方式可能比追踪过去的电子邮件地址更为重要,尤其是在以前的信息对您的报告需求并不重要的情况下。


类型 2:添加新行


类型 2 的缓慢变化维度允许保留历史数据。当发生更改时,维度表会添加新行,并将旧行标记为非活动状态。这样,新旧数据可以同时存在,从而支持历史分析。


类型 2 的示例


继续以客户为例,如果 John Doe 更改了他的电子邮件地址,维度表中就会创建一个新行。旧行会保留,但会被标记为非活动状态。例如,John 之前的一行应该为 john.doe@example.com,而新行会显示更新后的电子邮件地址 john.new@example.com,以及指示更改发生时间的时间戳。


这种方法有利于长期追踪客户行为。一项研究表明,追踪客户属性的企业可以通过基于历史数据的定向营销,将客户留存率提高 20%


类型 3:添加新属性


类型 3 渐变维度允许通过向现有记录添加新属性来保留部分历史数据。此方法不是创建新行,而是添加新列来捕获属性的先前值。


类型 3 的示例


如果 John Doe 再次更改其电子邮件地址,则可以将旧地址存储在名为“上一个电子邮件”的新列中。维度表将同时保存当前电子邮件地址和上一个电子邮件地址,从而提供简化的视图。


当只需要有限的历史背景信息时,这种方法非常有用。例如,如果一个组织经常更改客户联系方式,但只需要跟踪最近的两个地址,那么第 3 类方法就足够了。


类型 4:历史表


第四类缓慢变化维度包含一个单独的历史表来存储变化。主维度表仅保存当前数据,而历史表则跟踪随时间的变化。


类型 4 的示例


在我们的客户场景中,主客户表包含当前的电子邮件地址。同时,一个单独的历史表将记录所有过去的电子邮件地址以及时间戳。这种设置可以轻松访问当前数据,同时保留完整的历史记录。


对于需要保持维度表简洁并保留完整历史数据的公司来说,这种方法尤其有利。研究表明,保留历史记录的企业可以将决策流程提升30%


类型 6:混合方法


类型 6 融合了类型 1 和类型 2 的特性。它保留历史数据,同时允许覆盖某些属性。


类型 6 的示例


如果 John Doe 更改了他的电子邮件地址,则主表中的当前电子邮件地址将会更新(类型 1),同时历史表中会添加一个新行来记录该更改(类型 2)。这样就可以同时进行当前和历史分析,而不会丢失数据。


这种混合方法对于那些需要灵活管理数据并保持历史准确性的组织来说非常宝贵。根据行业数据,由于数据跟踪更加清晰,采用这种方法的企业可以节省高达15% 的报告时间


探索缓慢变化维度的影响


了解各种类型的渐变维度可以丰富您的数据管理和报告策略。每种类型都有其独特的优势,并针对不同的情况进行定制。


通过深思熟虑地了解组织的数据需求,您可以选择合适的 SCD 类型。这种选择将有助于确保您的数据仓库在业务不断发展的同时,始终保持准确性和实用性。


将这些策略纳入您的数据仓库实践中,不仅可以增强您的报告能力,还可以提供有关历史趋势和变化的宝贵见解,从而推动更好的业务决策。


数据仓库模型图的视线水平视图
A diagram illustrating different types of slowly changing dimensions in data warehousing.

+1 508-203-1492

马萨诸塞州贝德福德 01730

bottom of page