数据仓库与数据挖掘实务(第2版)课件全套 第1--8章 数据仓库与数据挖掘概述---大数据技术.ppt

数据仓库与数据挖掘实务(第2版)课件全套 第1--8章 数据仓库与数据挖掘概述---大数据技术.ppt

  1. 1、本文档共558页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据分析实务 第7章 数据挖掘方法 7.3聚类分析 7.2.3人工神经网络 人工神经网络(Artificial Neural Network, ANN)是由大量的简单的处理单元组成的非线性、自适应、自组织系统。它是在现代神经科学研究成果的基础上,通过模拟人类的神经系统对信息进行加工,记忆和处理的方式,设计出的一种具有人脑风格的信息处理系统。 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 人工神经网络模拟人脑神经系统的结构和功能,运用大量的处理部件,由人工方式构造的网络系统。 神经网络理论突破了传统的、线性处理的数字电子计算机的局限,是一个非线形动力学系统,并以分布式存储和并行协同处理为特色,虽然单个神经元的结构和功能极其简单有限,但是大量的神经元构成的网络系统所实现的行为却是极其丰富多彩的。 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 在工程上把神经元抽象为一个简单的多输入单输出的非线性信息处理数学模型 7.2.3人工神经网络 X1,X2,……,Xn是神经元的输入,即是来自前级n个神经元的轴突的信息; b是i神经元的阈值(或者叫阀值或偏置,有时用θ表示); W1,W2……,Wn分别是神经元对X1,X2,……,Xn的权系数; Y是神经元的输出;f(x)是活化函数,它决定神经元受到输人X1,X2,……,Xn的共同刺激达到阈值时以何种方式输出。 7.2.3人工神经网络 神经元输入矢量和权值用矩阵可以表示为: 7.2.3人工神经网络 活化函数有多种形式,其中最常见的有阶跃型、线性型和S型(Sigmod)三种形式。 7.2.3人工神经网络 7.2.3人工神经网络 ANN应用 7.2.3人工神经网络 BP算法:是为了解决多层前向(或称前馈)神经网络的权系数优化而提出来的。所以,BP算法也常暗示着神经网络的拓扑结构是一种无反馈的多层前向网络。故而,有时也称无反馈多层前向网络为BP模型。 7.2.3人工神经网络 从训练样例集中取一样例,把输入信息输入到网络中。 由网络分别计算各层节点的输出。 计算网络的实际输出与期望输出的误差。 从输出层反向计算到第一个隐层,按一定原则向减小误差方向调整网络的各个连接权值。 对训练样例集中的每一个样例重复以上步骤,直到对整个训练样例集的误差达到要求时为止。 BP过程 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 7.2.3人工神经网络 大数据分析实务 第7章 数据挖掘方法 7.2分类方法 根据已有的实例建立一个模型,使之能够识别对象所属的类别,该模型可以用于将未定类别的对象划分到已知类别的工作。 分类的目的通过建立的模型(分类器)将数据对象映射到某一个给定的类别中,如高价值客户、中价值客户、低价值客户。 典型的分类可应用于客户识别、老客户维系、新客户获取等方面。 决策树算法、神经网络算法、贝叶斯算法等。 7.2.1分类问题 7.2.1分类问题 7.2.1分类问题 分类算法的基本过程是根据已知数据,建立模型来判定未知对象所属类别,故此分类也是典型的有教师(或有监督、有指导)的学习过程。 在学习过程中,一般将已知数据分为训练数据集和测试数据集两部分。训练数据集一般负责训练分类模型,使其能够完成分类操作。测试数据集则负责检查训练好的分类模型是否能达到所需的分类精度。 7.2.1分类问题 一般来说有教师的学习算法的学习过程通常包括以下三个步骤: 首先,根据训练数据集,建立和训练分类模型; 其次,利用测试数据集,检查分类模型的精度; 最后,在实际数据中应用分类模型,并根据实际结果调整模型。 7.2.1分类问题 7.2.2决策树 决策树(Decision Tree)是数据挖掘分类算法的一个重要方法。在各种分类算法中,决策树是最直观的一种。决策树具有树状结构特征,依靠节点表示分析对象的特征,而每个分叉路径则代表了可能的特征值,每个叶结点则对应一类具有相似特征的一类对象。 7.2.2决策树 7.2.2决策树 以ID3算法为例,介绍决策树学习的基本过程。 ID3 算法以信息论原理为基础,利用信息增益寻找数据库中具有最大信息量的属性建立决策树

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档