- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
ch04 数据仓库与OLAP技术
Data Mining:
Concepts and Techniques
— Chapter 4 —
1
第4章: 数据仓库与OLAP技术
数据仓库: 基本概念
数据仓库建模: 数据立方体和OLAP
数据仓库设计和使用
数据仓库实现
数据泛化:面向属性的归纳
小结
2
什么是数据仓库? (1)
著名的数据仓库专家William.H.Inmon在其著作《
Building the Data Warehouse》中给予如下描述
:数据仓库是一个面向主题的、集成的、时变的
、非易失的数据集合,用于支持管理决策
面向主题的(subject-oriented):数据仓库
中的数据是按照一定的主题域进行组织。主题
是一个抽象的概念,是指用户使用数据仓库进
行决策时所关心的重点方面,一个主题通常与
多个操作型信息系统相关
3
什么是数据仓库? (2)
集成的(integrated):数据仓库中的数据是在对
原有分散的数据库数据抽取、清理的基础上经过系
统加工、汇总和整理得到的,必须消除源数据中的
不一致性,以确保命名约定、编码结构、属性度量
等的一致性
时变的(time-variant):数据仓库中的数据通常
包含历史信息,系统记录了企业从过去某一时点(
如开始应用数据仓库的时点)到目前的各个阶段的
信息,通过这些信息,可以对企业的发展历程和未
来趋势做出定量分析和预测
4
什么是数据仓库? (3)
非易失的(nonvolatile):数据仓库的数据主要供企
业决策分析之用,所涉及的数据操作主要是数据的初
始化装入和数据访问,一旦某个数据进入数据仓库以
后,一般情况下将被长期保留,即数据仓库中一般有
大量的查询操作,但修改和删除操作很少,通常只需
要定期的加载、刷新,不需要事务处理、恢复和并发
控制机制
数据仓库的构造需要数据集成、数据清理和数据统一
数据仓库的构造需要决策支持技术
数据仓库使用更新驱动而不是查询驱动的方法对异种数据库集
成
5
数据仓库 vs.操作数据库系统
联机操作数据库系统的主要任务是执行联机事务和查
询处理,称为OLTP系统
数据仓库在数据分析和决策方面为用户提供服务,称
为OLAP系统
OLTP和OLAP的主要区别
OLTP和OLAP的主要区别
OLTP OLAP
功能 日常操作 长期信息需求,决策支持
特征 操作处理 信息处理
系统面向性 事务和查询处理 数据分析
用户面向性 客户 知识工人
数据内容
文档评论(0)