人工智能技术基础课件第3、4章机器学习、深度学习.pptx

下载文档

0
0
约5.88千字
约 129页
2023-08-05 发布于山东
举报
版权申诉
保障服务

人工智能技术基础课件第3、4章机器学习、深度学习.pptx

1、本文档共129页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

人工智能技术基础;;;; 她还有一些鸢尾花的测量数据，这些花之前已经被植物学专家鉴定为属于setosa（山鸢尾）、versicolor（变色鸢尾）或virginica（维吉尼亚鸢尾）三个品种之一，如图所示。通过这些测量数据，她可以确定每朵鸢尾花所属的品种。我们假设这位植物学爱好者在野外只会遇到这三种鸢尾花。; 我们的目标是构建一个机器学习模型，可以从这些已知品种的鸢尾花测量数据中进行学习，从而能够预测新鸢尾花的品种。;;;设备中的传感器会产生前所未有的海量数据;; 第一个机器学习的定义来自于亚瑟·塞缪尔（Arthur Samuel）。他定义机器学习：在进行特定编程的情况下，给予计算机学习能力的领域。; 第二个定义来自卡内基梅隆大学Tom Mitchell定义的机器学习：一个好的学习问题定义如下，一个程序被认为能从经验E中学习，解决任务T，达到性能度量值P，当且仅当，有了经验E后，经过P评判，程序在处理T时的性能有所提升。这个定义在学术界内被多次引用。;在垃圾邮件分类问题中， “一个程序”指的是需要用到的机器学习算法，比如逻辑回归算法； “任务T”是指区分垃圾邮件的任务； “经验E”为已经区分过是否为垃圾邮件的历史邮件，在监督式机器学习问题中，这也被称之为训练数据； “效果P”为机器学习算法在区分是否为垃圾邮件任务上的正确率。;;;什么是监督式学习？; 监督式学习中鸢尾花数据在人工智能眼里的样子。在类别信息的指导下，我们很容易就能找到一条最优的直线，将特征空间一分为二，使变色鸢尾和山鸢尾各居一隅;监督式学习两个主要的应用领域;;什么是无监督式学习？;无监督学习中鸢尾花数据在人工智能眼里的样子。可以看到，没有类别信息的指导，我们很难判断哪一些鸢尾花是相同的品种，哪一些鸢尾花是不同品种，更别提使用一条直线为鸢尾花分类了;如何确定使用哪种机器学习算法？;;;;下面通过一个简单的例子说明一下：如图，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果K=5，由于蓝色四方???比例为3/5，因此绿色圆被赋予蓝色四方形类;;2. K值;3. 分类决策规则;;;解：（1）从上下左右看， A的上下左右全是“△”为甲班学生，故A应是甲班学生；B的上下左右全是“☆”为乙班学生，故B应是乙班学生；C的上下左右，3人是甲班，1人乙班，故C应是甲班；D的上下左右全是“△”为甲班学生，故D应是甲班学生。（2）从四周看 A的四周有七个“△”为甲班学生，故A应是甲班学生；B的四周全是“☆”为乙班学生，故B应是乙班学生；C的四周，3人是甲班，5人乙班，故C应是乙班；D的四周全是“△”为甲班学生，故D应是甲班学生。;;; 聚类的目的也是把数据分类，但是事先我是不知道如何去分的，完全是算法自己来判断各条数据之间的相似性，相似的就放在一起。在聚类的结论出来之前，我完全不知道每一类有什么特点，一定要根据聚类的结果通过人的经验来分析，看看聚成的这一类大概有什么特点。;;给定一个数据集;;;?; 这说明了两点：第一，这个算法最终会收敛到一个稳定的局部最优值，不一定全局最优，这是由于算法中欧几里得距离保持不增决定的。第二，分类结果与初始值有关。;;如何划分才合适;自底向上的合并算法;相似度的计算;;;;;商品图片分类;;呼叫记录详细分析;;非常感谢你的观看;人工智能应用技术基础;;什么是深度学习？;什么是机器学习？;学习; 著名学者赫伯特·西蒙教授（Herbert Simon，1975年图灵奖获得者、1978年诺贝尔经济学奖获得者）曾对“学习”给了一个定义：“如果一个系统，能够通过执行某个过程，就此改进了它的性能，那么这个过程就是学习”; 遵循西蒙教授的观点，对于计算机系统而言，通过运用数据及某种特定的方法（比如统计的方法或推理的方法），来提升机器系统的性能，就是机器学习; 卡内基梅隆大学的Tom Mitchell教授，在他的名作《机器学习》一书中，也给出了更为具体（其实也很抽象）的定义：对于某类任务（Task，简称T）和某项性能评价准则（Performance，简称P），如果一个计算机程序在T上，以P作为性能的度量，随着很多经验（Experience，简称E）不断自我完善，那么我们称这个计算机程序在从经验E中学习了。; 一般说来，人类的知识在两个维度上可分成四类。即从可统计与否上来看，可分为：是可统计的和不可统计的。从能否推理上看，可分为可推理的和不

您可能关注的文档

文档评论（0）

balala11 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

人工智能技术基础课件第3、4章机器学习、深度学习.pptx