数据仓库与数据挖掘概述(学时2).ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘概述(学时2)

数据仓库与数据挖掘 (DATA WAREHOUSING AND DATA MINING) 石家庄铁道大学 课程介绍 21世纪是一个以计算机技术和知识经济为核心的信息化时代。随着计算机技术、网络技术的飞速发展和数据库应用的不断深化,数据仓库(Data Warehousing)和数据挖掘(Data Mining)技术及其应用已成为计算机科学技术领域的热点之一。 课程介绍 数据库技术及其应用的发展: 从关系模型发展到面向对象模型 从单机应用发展到分布式应用 从局域网数据库应用发展到Web数据库应用 从联机事务处理(OLTP:On-Line Transaction Process)发展到联机分析处理(OLAP:On-Line Analysis Process) 从数据库发展到数据仓库 从数据的统计分析发展到数据挖掘 课程介绍(Cont.) 目前,计算机科学技术界的许多专家、学者都在大力研究数据仓库的构筑技术和基于各种模型的数据挖掘算法,并取得了可喜的成果。国内外一些著名计算机企业也纷纷提出了数据仓库实施战略,推出了一些OLAP和数据挖掘工具。高等院校的研究生需要掌握这方面的新知识、新技术,掌握数据仓库与数据挖掘领域的基本理论、基本原理和实现技术,适应计算机科学技术新的发展趋势。 课程介绍(Cont.) 本课程在数据仓库部分全面深入地介绍数据仓库的基本概念和体系结构,详细阐述数据仓库的实现技术;在数据挖掘部分介绍数据挖掘的各类算法(包括关联规则挖掘算法、分类规则挖掘算法、聚类分析算法、WEB数据挖掘等)。 学时及成绩评定 学时:32=20+12 教学形式:讲解、报告、实验等 考核方式:C 方式C:平时(30%)+课程论文(70%) 平时:出勤、课堂表现、作业、报告等 课程论文: 专题论文、实验报告等 参考资料 1.王丽珍,周丽华 等. 数据仓库与数据挖掘原理及应用. 北京:科学出版社,2005 2.安淑芝 等. 数据仓库与数据挖掘. 北京:清华大学出版社,2005 3.陈京民. 数据仓库与数据挖掘技术. 北京:电子工业出版社,2002 4.Data Mining Concepts and Techniques. (影印版). 北京:高等教育出版社,2001 5.有关参考资料和文献、学术刊物上有关论文 主要内容 数据仓库与数据挖掘概述 数据仓库的数据模型与数据组织 数据仓库的开发方法及开发过程 数据集市及开发 OLAP概述、MOLAP与ROLAP 数据挖掘技术与算法 数据挖掘工具及其应用 第1章 数据仓库与数据挖掘概述 本章要点 数据仓库的发展 数据仓库的基本概念 数据挖掘的发展 数据挖掘的基本概念 数据仓库与数据挖掘的集成 1. 引 言 在最近的几十年当中,有关数据库新技术的研究有三件事情值得我们加以关注: 进入90年代以后,数据库系统的应用从传统的事务处理应用扩展到辅助决策等新的集成应用领域。 2. 从数据库到数据仓库 基于数据库技术的数据处理操作可以分为两大类: 在传统的以数据库为核心的事务处理环境中不适宜建立DSS等分析型应用的原因主要有以下五条: 分析处理:DSS需要集成的数据,包括整个企业内部各部门的相关数据,还需要企业外部、竞争对手等处的相关数据。全面而正确的数据是有效的分析和决策的首要前提。 因此用于分析处理的数据可能来自多种不同的数据源,包括: 同构/异构数据库 文件系统 Internet 外部的用户数据。 静态集成:对所需数据进行一次集成,以后就不再发生变化。在采用静态集成策略时,如果数据源中的数据发生了变化,那么这些变化就不能反映给决策者,导致决策使用的是过时的数据。 动态集成:对集成后的数据进行周期性刷新。 事务处理:一般只需要当前数据,数据库中的过时数据虽然也能通过数据转储等方式保存下来,但往往被束之高阁,未能得到充分利用。 分析处理:更看重历史数据,可以通过对大量历史数据的详细分析来把握企业的发展趋势。 分析处理:需要的往往是大量的总结性分析型数据,而非数据库中的细节性操作型数据。 事务处理:需要的是当前的细节性操作数据。 分析处理:数据的访问操作以‘读’操作为主,不需要实时的‘更新’操作,但需要定时‘刷新’。 事务处理:提供多种不同类型的数据访问操作,对于需要修改的数据必须实时‘更新’数据库。 综上所述,在事务处理环境中直接构建分析处理应用是不合适的,要提高分析处理和决策支持的效率和有效性,必须将分析型处理及其所需的综合性数据从传统的事务型处理和细

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档