- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
量化投资中要用到的数学
MIT 一牛人对数学在机器学习中的作用给的评述,写得
很实际机器学习和计算机视觉都是很多种数学的交汇场。看
着不同的理论体系的交汇, 对于一个 researcher 来说, 往往
是非常 exciting 的 enjoyable 的事情。不过,这也代表着要
充分了解这个领域并且取得有意义的进展是很艰苦的。
Linear Algebra ( 线性代数 ) 和 Statistics ( 统计学 ) 是最重要
和不可缺少的。 这代表了 Machine Learning 中最主流的两大
类方法的基础。一种是以研究函数和变换为重点的代数方法,
比如 Dimension reduction ,feature extraction ,Kernel 等,
一种是以研究统计模型和样本分布为重点的统计方法,比如
Graphical model, Information theoretical models 等。它们
侧重虽有不同,但是常常是共同使用的,对于代数方法,往
往需要统计上的解释,对于统计模型,其具体计算则需要代
数的帮助。以代数和统计为出发点,继续往深处走,我们会
发现需要更多的数学。 Calculus ( 微积分 ),只是数学分析体
系的基础。其基础性作用不言而喻。 Learning 研究的大部分
问题是在连续的度量空间进行的,无论代数还是统计,在研
究优化问题的时候,对一个映射的微分或者梯度的分析总是
不可避免。而在统计学中, Marginalization 和积分更是密不
可分——不过,以解析形式把积分导出来的情况则不多见。
Partial Differential Equation (偏微分方程 ),这主要用于描
述动态过程, 或者仿动态过程。 这个学科在 Vision 中用得比
Learning 多,主要用于描述连续场的运动或者扩散过程。比
如 Level set, Optical flow 都是这方面的典型例子。
Functional Analysis ( 泛函分析 ) ,通俗地,可以理解为微积
分从有限维空间到无限维空间的拓展——当然了,它实际上
远不止于此。在这个地方,函数以及其所作用的对象之间存
在的对偶关系扮演了非常重要的角色。 Learning 发展至今,
也在向无限维延伸——从研究有限维向量的问题到以无限
维的函数为研究对象。 Kernel Learning 和 Gaussian
Process 是其中典型的例子——其中的核心概念都是
Kernel 。很多做 Learning 的人把 Kernel 简单理解为 Kernel
trick 的运用,这就把 kernel 的意义严重弱化了。 在泛函里面,
Kernel (Inner Product) 是建立整个博大的代数体系的根本,
从 metric, transform 到 spectrum 都根源于此。 Measure
Theory ( 测度理论 ),这是和实分析关系非常密切的学科。但
是测度理论并不限于此。 从某种意义上说, Real Analysis 可
以从 Lebesgue Measure (勒贝格测度)推演,不过其实还
有很多别的测度体系——概率本身就是一种测度。测度理论
对于 Learning 的意义是根本的, 现代统计学整个就是建立在
测度理论的基础之上——虽然初级的概率论教科书一般不
这样引入。 在看一些统计方面的文章的时候,
文档评论(0)