- 1、本文档共284页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课件PPT教学课件完整版课件全册课件全套课件整套课件全书课件完整版PPT全册PPT全套PPT整套PPT全书PPT完整版教案电子教案全册电子教案全书电子教案教学课件课件汇总课件汇集
全
册
课
件
延迟符
计算机视觉全套课件
计算机视觉
Computer Vision
第一章·绪论
目录
背景介绍
Contents
小节介绍
本章总结
背景介绍
BACKGROUND
Every image tells a story. Computer vision develops theories and methods to allow computers to extract relevant information from digital images or videos.
ONE
背 景 介 绍
作为人类,我们可以轻松感知周围的三维世界。
相比之下,不管近年来计算机视觉已经取得多么令人瞩目的成果,但要让计算机能像人类那样理解和解释图像,却仍然是一个遥远的梦想。
为什么计算机视觉会成为如此富有挑战性的难题?
它的发展历史与现状又是怎样的?
小节介绍
SECTION INTRODUCTION
Every image tells a story. Computer vision develops theories and methods to allow computers to extract relevant information from digital images or videos.
TWO
1.1 计算机视觉简史
美国计算机科学家拉里·罗伯茨在麻省理工大学的博士毕业论文《Machine Perception of Three-Dimensional Solids》
1963年
热点偏向于图像内容的建模,如三维建模、立体视觉等
20世纪70年代
主动视觉理论和定性视觉理论等被提出,进入了最蓬勃发展的一个时期
20世纪80年代
机器学习开始成为计算机视觉,尤其是识别、检测和分类等应用中一个不可分割的重要工具
成为计算机领域的一个大学科
21世纪
20世纪90年代
基于神经网络的深度学习算法
2012年,Hinton的小组参加了ImageNet竞赛,提出卷积神经网络AlexNet,取得十个百分点的改进,完胜第二名
冲击传统计算机视觉分类算法
更深的网络结构
校正线性单元(Rectified Linear Unit, ReLU)、Dropout等方法的应用
GPU训练网络
三点改进
自从2012年后,基于深度学习的检测和识别、基于深度学习的图像分割、基于深度学习的立体视觉等如雨后春笋般一夜之间全冒了出来。
在各领域发挥作用
1.2 计算机视觉发展的新起点
现实生活应用
安防
交通
工业生产
在线购物
信息检索
游戏娱乐
摄影摄像
机器人/无人机
体育
医疗
1.3 计算机视觉应用
相对其他许多传统的机器学习方法,深度神经网络本身就是一个消耗计算量的大户。另一方面,由于多层神经网络本身极强的表达能力,对数据量也提出了很高的要求。
20世纪80年代,使用专门的运算单元负责对三维模型形成的图像进行渲染。
1999年,NVIDTA发布GeForce 256,正式提出了GPU的概念。
2000年, 尝试用GPU来加速通用高密度、大吞吐量的计算任务。
2001年,通用图形处理器(General-Purpose computing on CPU, GPGPU)的概念被正式提出。
2002年,多伦多大学的James Fung发布了Open VIDIA,利用GPU实现了一些计算机视觉库的加速,这是第一次正式将GPU用到了渲染以外的用途上。
2006年,NVIDIA推出了利用GPU进行通用计算的平台CUDA,很快就流行开并成为了GPU通用计算的主流框架。
2012年,Alex一战成名,同时GPU也成为了训练深度神经网络的标配。
1.4 GPU与并行技术
图像搜索
图像分割
生成对抗网络
图像描述
图像分类
物体检测
人脸识别
1.5 基于卷积神经网络的计算机视觉应用
本章总结
CHAPTER SUMMARY
Every image tells a story. Computer vision develops theories and methods to allow computers to extract relevant information from digital images or videos.
Three
本书从基本的视觉色彩原理到神经网络模型,再到之后的卷积模型与具体应用,对计算机视觉领域的知识进行了较为系统的介绍。
全书共分为八个章节:
第二、三章介绍基础的图像色彩表示及传统特征提取方法;
第四章介绍深度学习神经网络方法及卷积、循环神经网络;
第五至八章介绍图像分类、目标检测与分割、图片描述与关系识别及生成对抗网络等主要任务及算法。
1.6 全书章节简介
计算机视觉
Computer Vision
第二
文档评论(0)