1.1. 简介
数据仓库的概念最初是由数据仓库之父 Bill Inmon 于 1990 年提出的:
数据仓库(Data Warehouse,DW)是集成的(Integrated),面向主题的(Subject-Oriented),随时间变化的(Time-Variant),不可修改的(Nonvolatile)数据集合,用于支持管理决策。
数据仓库为了方便企业快速做各种业务决策提供数据支撑而构建的集成化数据环境,它将分散的、异构的数据源整合在一起,是一整套包括了ETL、调度、建模在内的体系。
数据仓库的方案的建设,主要应用于OLAP(on-line Analytical Processing)。
1.2. 数据分层
1.2.1. ODS
ODS简介
ODS(Operational Data Store,操作型数据存储)是面向主题的、集成的、可变的、反映当前数据值的、详细的数据的集合,用来满足企业综合的、集成的和操作型的处理需求。
ODS层是当前的、不断变化的数据,而数据仓库保留的是历史的、不再变化的数据,所以一般来说会落后ODS层一天或一天以上的数据
ODS层的作用
(1)在业务系统和数据仓库之间形成一个隔离层
(2)转移一部分业务系统细节查询的功能
(3)完成数据仓库中不能完成的一些功能
1.2.2. 数据集市
数据集市(Data Mart)也叫数据市场,主要功能是将主题层和基础层的数据按各业务需求进行聚合,生成宽表和Cube,并直接推送给数据分析和业务部门使用,是数据仓库的核心组成部分。
数据集市是数据仓库的一部分,主要面向各业务部门使用,并且仅面向某个特定的主题