人工智能技术基础 课件 第3、4章 机器学习、 深度学习.pptx

人工智能技术基础 课件 第3、4章 机器学习、 深度学习.pptx

  1. 1、本文档共129页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人工智能技术基础;;;; 她还有一些鸢尾花的测量数据,这些花之前已经被植物学专家鉴定为属于setosa(山鸢尾)、versicolor(变色鸢尾)或virginica(维吉尼亚鸢尾)三个品种之一,如图所示。通过这些测量数据,她可以确定每朵鸢尾花所属的品种。我们假设这位植物学爱好者在野外只会遇到这三种鸢尾花。; 我们的目标是构建一个机器学习模型,可以从这些已知品种的鸢尾花测量数据中进行学习,从而能够预测新鸢尾花的品种。;;;设备中的传感器会产生前所未有的海量数据;; 第一个机器学习的定义来自于亚瑟·塞缪尔(Arthur Samuel)。他定义机器学习:在进行特定编程的情况下,给予计算机学习能力的领域。; 第二个定义来自卡内基梅隆大学Tom Mitchell定义的机器学习:一个好的学习问题定义如下,一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。这个定义在学术界内被多次引用。;在垃圾邮件分类问题中, “一个程序”指的是需要用到的机器学习算法,比如逻辑回归算法; “任务T”是指区分垃圾邮件的任务; “经验E”为已经区分过是否为垃圾邮件的历史邮件,在监督式机器学习问题中,这也被称之为训练数据; “效果P”为机器学习算法在区分是否为垃圾邮件任务上的正确率。;;;什么是监督式学习?; 监督式学习中鸢尾花数据在人工智能眼里的样子。在类别信息的指导下,我们很容易就能找到一条最优的直线,将特征空间一分为二,使变色鸢尾和山鸢尾各居一隅;监督式学习两个主要的应用领域;;什么是无监督式学习?;无监督学习中鸢尾花数据在人工智能眼里的样子。可以看到,没有类别信息的指导,我们很难判断哪一些鸢尾花是相同的品种,哪一些鸢尾花是不同品种,更别提使用一条直线为鸢尾花分类了;如何确定使用哪种机器学习算法?;;;;下面通过一个简单的例子说明一下:如图,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形? 如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方???比例为3/5,因此绿色圆被赋予蓝色四方形类;;2. K值;3. 分类决策规则;;;解:(1)从上下左右看, A的上下左右全是“△”为甲班学生,故A应是甲班学生;B的上下左右全是“☆”为乙班学生,故B应是乙班学生;C的上下左右,3人是甲班,1人乙班,故C应是甲班;D的上下左右全是“△”为甲班学生,故D应是甲班学生。 (2)从四周看 A的四周有七个“△”为甲班学生,故A应是甲班学生;B的四周全是“☆”为乙班学生,故B应是乙班学生;C的四周,3人是甲班,5人乙班,故C应是乙班;D的四周全是“△”为甲班学生,故D应是甲班学生。;;; 聚类的目的也是把数据分类,但是事先我是不知道如何去分的,完全是算法自己来判断各条数据之间的相似性,相似的就放在一起。在聚类的结论出来之前,我完全不知道每一类有什么特点,一定要根据聚类的结果通过人的经验来分析,看看聚成的这一类大概有什么特点。;;给定一个数据集;;;?; 这说明了两点:第一,这个算法最终会收敛到一个稳定的局部最优值,不一定全局最优,这是由于算法中欧几里得距离保持不增决定的。第二,分类结果与初始值有关。;;如何划分才合适;自底向上的合并算法;相似度的计算;;;;;商品图片分类;;呼叫记录详细分析;;非常感谢你的观看;人工智能应用技术基础;;什么是深度学习?;什么是机器学习?;学习; 著名学者赫伯特·西蒙教授(Herbert Simon,1975年图灵奖获得者、1978年诺贝尔经济学奖获得者)曾对“学习”给了一个定义:“如果一个系统,能够通过执行某个过程,就此改进了它的性能,那么这个过程就是学习”; 遵循西蒙教授的观点,对于计算机系统而言,通过运用数据及某种特定的方法(比如统计的方法或推理的方法),来提升机器系统的性能,就是机器学习; 卡内基梅隆大学的Tom Mitchell教授,在他的名作《机器学习》一书中,也给出了更为具体(其实也很抽象)的定义: 对于某类任务(Task,简称T)和某项性能评价准则(Performance,简称P),如果一个计算机程序在T上,以P作为性能的度量,随着很多经验(Experience,简称E)不断自我完善,那么我们称这个计算机程序在从经验E中学习了。; 一般说来,人类的知识在两个维度上可分成四类。即从可统计与否上来看,可分为:是可统计的和不可统计的。从能否推理上看,可分为可推理的和不

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档