大数据应用与技术丛书·数据仓库工具箱(第3版):维度建模权威指南 [The Data Warehouse Toolkit:The Definitive Guide to Dimensional Modeling, Third Edition] pdf

大数据应用与技术丛书·数据仓库工具箱(第3版):维度建模权威指南 [The Data Warehouse Toolkit:The Definitive Guide to Dimensional Modeling, Third Edition]

内容简介

随着TheDataWarehouseToolkit(1996)第1版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。

该书汇集了到目前为止全面的维度建模技术。

该书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。

该书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。

该书主要内容:

实用设计技术——有关维度和事实表的基本和高级技术。

14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等。

为12个案例研究提供了数据仓库总线矩阵示例。

需要避免的维度建模陷阱和错误。

增强的缓慢变化维度(SCD)技术类型0~类型7。

用于处理参差不齐的可变深度层次和多值属性的桥接表大数据分析的实践。与业务参与方合作、交互设计会议的指南。

有关KimballDW/BI项目生命周期方法论的概论。

对ETL系统和设计思考的总结构建维度和事实表的34个ETL子系统和技术

作者简介

Ralph Kimball,博士,自1982年以来,一直是数据仓库和商业智能行业的思想开拓者。自1996年以来,The Data Warehouse Toolkit系列书籍一直是受读者欢迎的畅销书。

Margy Ross,Kimball集团总裁,她与Ralph Kimball合作撰写了5本工具箱系列书籍。她关注数据仓库和商业智能已有30多年的历史。

目录

第1章 数据仓库、商业智能及维度建模初步 
1.1 数据获取与数据分析的区别 
1.2 数据仓库与商业智能的目标 
1.3 维度建模简介 
1.3.1 星型模式与OLAP多维数据库 
1.3.2 用于度量的事实表 
1.3.3 用于描述环境的维度表 
1.3.4 星型模式中维度与事实的连接 
1.4 Kimball的DW/BI架构 
1.4.1 操作型源系统 
1.4.2 获取.转换-力口载(ETL)系统 
1.4.3 用于支持商业智能决策的展现区 
1.4.4 商业智能应用 
1.4.5 以餐厅为例描述Kimball架构 
1.5 其他DW/BI架构 
1.5.1 独立数据集市架构 
1.5.2 辐射状企业信息工厂hlmon架构 
1.5.3 混合辐射状架构与Kimball架构 
1.6 维度建模神话 
1.6.1 神话1:维度模型仅包含汇总数据 
1.6 ,2神话2:维度模型是部门级而不是企业级的 
1.6.3 神话3:维度模型是不可扩展的 
1.6.4 神话4:维度模型仅用于预测 
1.6.5 神话5:维度模型不能被集成 
1.7 考虑使用维度模型的更多理由 
1.8 本章小结 

第2章 Kimball维度建模技术概述 
2.1 基本概念 
2.1.1 收集业务需求与数据实现 
2.1.2 协作维度建模研讨 
2.1.3 4步骤维度设计过程 
2.1.4 业务过程 
2.1.5 粒度 
2.1.6 描述环境的维度 
2.1.7 用于度量的事实 
2.1.8 星型模式与OLAP多维数据库 
2.1.9 方便地扩展到维度模型 
2.2 事实表技术基础 
2.2.1 事实表结构 
2.2.2 可加、半可加、不可加事实 
2.2.3 事实表中的空值 
2.2.4 -致性事实 
2.2.5 事务事实表 
2.2.6 周期快照事实表 
2.2.7 累积快照事实表 
2.2.8 无事实的事实表 
2.2.9 聚集事实表或OLAP多维数据库 
2.2.1 0合并事实表 
2.3 维度表技术基础 
2.3.1 维度表结构 
2.3.2 维度代理键 
2.3.3 自然键、持久键和超自然键 
2.3.4 下钻 
2.3.5 退化维度 
2.3.6 非规范化扁平维度 
2.3.7 多层次维度 
2.3.8 文档属性的标识与指示器 
2.3.9 维度表中的空值属性 
2.3.10 日历日期维度 
2.3.11 扮演角色的维度 
2.3.12 杂项维度 
2.3.13 雪花维度 
2.3.14 支架维度 
2.4 使用一致性维度集成 
2.4.1 一致性维度 
2.4.2 缩减维度 
2.4.3 跨表钻取 
2.4.4 价值链 
2.4.5 企业数据仓库总线架构 
2.4.6 企业数据仓库总线矩阵 
2.4.7 总线矩阵实现细节 
2.4.8 机会/利益相关方矩阵 
2.5 处理缓慢变化维度属性 
2.5.1 类型0:原样保留 
2.5.2 类型1:重写 
2.5.3 类型2:增加新行 
2.5.4 类型3:增加新属性 
2.5.5 类型4:增加微型维度 
2.5.6 类型5:增加微型维度及类型1支架 
…… 

第3章 零售业务 
第4章 库存 
第5童采购 
第6章 订单管理 
第7章 会计 
第8章 客户关系管理 
第9章 人力资源管理 
第10章 金融服务 
第11章 电信 
第12章 交通运输 
第13章 教育 
第14章 医疗卫生 
第15章 电子商务 
第16章 保险业务 
第17章 KimballDW/BI生命周期概述 
第18章 维度建模过程与任务 
第19章 ETL子系统与技术 
第20章 ETL系统设计与开发过程和任务 
第21章 大数据分析

感悟与笔记

建模初步

1. 数据获取与数据分析区别:

  1. 数据获取--操作型记录的保存,按部就班以可预测的方式完成同样的操作型人物和执行业务过程,通常不必维护历史数据,只需修改数据以反映最新状态。
  2. 数据分析--分析决策型的使用数据,用于研究分析企业运转、评估性能、了解客户意愿,一般一次查询成千上万的事务,通常保存历史环境用以精确评估组织性能。

2. 数据仓库与商业智能的目标

  1. DW/BI系统要能方便地存取信息
  2. DW/BI系统必须以一致的形式展现信息
  3. DW/BI系统必须能够适应变化
  4. DW/BI系统必须能够及时展现信息
  5. DW/BI系统必须成为保护信息财富的安全堡垒
  6. DW/BI系统必须成为提高决策制定能力的权威和可信的基础
  7. DW/BI系统成功的标志是业务全体接受DW/BI系统

3. 维度建模简介

维度建模主要基于以下两个需求同时满足:

  1. 以商业用户可理解的方式发布数据
  2. 提供高效的查询性能

并不是一种新技术,简单性至关重要,能保护用户方便地理解数据,以及确保软件能够快速、有效地发现及发布结果。

4. 事实表、维度表

这两个术语来自于20世纪60年代杰拉尔德·米勒和达特茅斯大学的一个联合研究项目。

但并不是由某个个人发明了维度方法,当设计者需要将可理解性和性能作为最重要的目标时,维度模型是在设计数据库时必然产生的结果。

事实表--用于度量: 维度模型中的事实表存储组织机构业务过程事件的性能度量结果,通常具有两个或多个外键。

维度表--用于描述环境: 维度表包含与业务过程度量事件有关的文本环境,用于描述与“谁、什么、哪里、何时、如何、为什么”有关的事件,维度属性是所有查询约束和报表标识的来源。

粒度最小的数据或原子数据具有最多的维度。

Copyright © 2021-2022 知识猫. All Rights Reserved.