ch04 数据仓库与OLAP技术.pdf

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
ch04 数据仓库与OLAP技术

Data Mining: Concepts and Techniques — Chapter 4 — 1 第4章: 数据仓库与OLAP技术  数据仓库: 基本概念  数据仓库建模: 数据立方体和OLAP  数据仓库设计和使用  数据仓库实现  数据泛化:面向属性的归纳  小结 2 什么是数据仓库? (1)  著名的数据仓库专家William.H.Inmon在其著作《 Building the Data Warehouse》中给予如下描述 :数据仓库是一个面向主题的、集成的、时变的 、非易失的数据集合,用于支持管理决策  面向主题的(subject-oriented):数据仓库 中的数据是按照一定的主题域进行组织。主题 是一个抽象的概念,是指用户使用数据仓库进 行决策时所关心的重点方面,一个主题通常与 多个操作型信息系统相关 3 什么是数据仓库? (2)  集成的(integrated):数据仓库中的数据是在对 原有分散的数据库数据抽取、清理的基础上经过系 统加工、汇总和整理得到的,必须消除源数据中的 不一致性,以确保命名约定、编码结构、属性度量 等的一致性  时变的(time-variant):数据仓库中的数据通常 包含历史信息,系统记录了企业从过去某一时点( 如开始应用数据仓库的时点)到目前的各个阶段的 信息,通过这些信息,可以对企业的发展历程和未 来趋势做出定量分析和预测 4 什么是数据仓库? (3)  非易失的(nonvolatile):数据仓库的数据主要供企 业决策分析之用,所涉及的数据操作主要是数据的初 始化装入和数据访问,一旦某个数据进入数据仓库以 后,一般情况下将被长期保留,即数据仓库中一般有 大量的查询操作,但修改和删除操作很少,通常只需 要定期的加载、刷新,不需要事务处理、恢复和并发 控制机制  数据仓库的构造需要数据集成、数据清理和数据统一  数据仓库的构造需要决策支持技术  数据仓库使用更新驱动而不是查询驱动的方法对异种数据库集 成 5 数据仓库 vs.操作数据库系统  联机操作数据库系统的主要任务是执行联机事务和查 询处理,称为OLTP系统  数据仓库在数据分析和决策方面为用户提供服务,称 为OLAP系统  OLTP和OLAP的主要区别 OLTP和OLAP的主要区别 OLTP OLAP 功能 日常操作 长期信息需求,决策支持 特征 操作处理 信息处理 系统面向性 事务和查询处理 数据分析 用户面向性 客户 知识工人 数据内容

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体李**

1亿VIP精品文档

相关文档

相关课程推荐