- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中信期货专题报告
一、机器学习介绍
这一部分主要介绍机器学习基础,并对一些可以应用的监督学习方法进行介
绍。
(一)机器学习分类
Tom Michael Mitchell 在1997 年给出机器学习一个形式化的定义:假设用
P 来评估计算机程序在某任务类T 上的性能,若一个程序通过利用经验E 在T 中
任务上获得了性能改善,则我们就说关于T 和P,该程序对E 进行了学习。
机器学习致力于如何通过计算手段,利用经验来改善系统自身的性能。在计
算机系统中,经验通常以数据形式存在,利用计算机从数据中产生模型算法,即
“学习算法”,是机器学习的主要内容。如果把经验数据提供给学习算法,就能产
生相应的模型,在面对新情况时,模型会提供相应的判断。
简而言之,机器学习是从经验数据中获得模型,进而预测未来。
一般的机器学习流程是输入数据、训练模型、模型预测,输入的数据是数据
集,其中每一条记录称为一个示例,示例中包含对象的属性,如果示例信息中包
含标记,那么该示例称为样例。
机器学习根据任务类型,可以分为无监督学习、监督学习、半监督学习、强
化学习。其中无监督学习是训练数据中不包含标记,该任务可以再分为聚类和降
维;监督学习是训练数据中包含标记,如果标记为离散值,则该任务是分类任务,
如果是连续的,该任务是回归任务。半监督学习介于监督学习和无监督学习之间,
用大量的未标记训练数据和少量的已标记数据来训练模型。强化学习以环境反馈
(奖/惩信号)作为输入,以统计和动态规划技术为指导的一种学习方法。
图表1:机器学习根据任务类型分类
聚类
无监督学习
降维
分类
监督学习
机器学习
回归
半监督学习
强化学习
资料来源:中信期货研究所
4 / 37
中信期货专题报告
根据算法类型,机器学习可以分为传统统计学习和深度学习。
传统统计学习基于严格的数学推理,具有可解释性强、运行速度快、可应用
于小规模数据集的特点。如SVM、逻辑回归、决策树等。
深度学习是基于神经网络的机器学习方法,包括前馈神经网络、卷积神经网
络等。这类方法可解释性较差,强烈依赖于数据集规模,但在语音、视觉处理方
面很成功。
图表2 :机器学习根据算法类型分类
传统统计学习
文档评论(0)