- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
Bounding-box回归 其中 这是一个典型的最小二乘问题。 最终在进行实验时,lambda = 1000,同时作者发现同一对中P和G相距过远时通过上面的变换是不能完成的,而相距过远实际上也基本不会是同一物体,因此作者在进行实验室,对于pair(P,G)的选择是选择离P较近的G进行配对,这里表示较近的方法是需要P和一个G的最大的IoU要大于0.6,否则则抛弃该P。 深度学习目标检测:RCNN Bounding-box回归 绿色的框为飞机的Ground Truth,红色的框是提取的Region Proposal。那么即便红色的框被分类器识别为飞机,但是由于红色的框定位不准(IoU<0.5),那么这张图相当于没有正确的检测出飞机。如果我们能对红色的框进行微调,使得经过微调后的窗口跟Ground Truth更接近,这样岂不是定位会更准确。确实,Bounding-box regression 就是用来微调这个窗口的。 深度学习目标检测:RCNN Bounding-box回归 深度学习目标检测:RCNN Bounding-box回归 深度学习目标检测:RCNN Bounding-box回归 只有当Proposal和Ground Truth比较接近时(线性问题),我们才能将其作为训练样本训练我们的线性回归模型,否则会导致训练的回归模型不work(当Proposal跟GT离得较远,就是复杂的非线性问题了,此时用线性回归建模显然不合理)。 深度学习目标检测:RCNN Bounding-box回归 线性回归就是给定输入的特征向量X,学习一组参数W,使得经过线性回归后的值跟真实值Y(Ground Truth)非常接近。即。那么Bounding-box中我们的输入以及输出分别是什么呢? 输入:输入就是这四个数值吗?其实真正的输入是这个窗口对应的CNN特征,也就是R-CNN中的Pool5feature(特征向量)。(注:训练阶段输入还包括 Ground Truth,也就是下边提到的) 输出:需要进行的平移变换和尺度缩放,或者说是。我们的最终输出不应该是Ground Truth吗?是的,但是有了这四个变换我们就可以直接得到Ground Truth,这里还有个问题,根据上面4个公式我们可以知道,P经过,得到的并不是真实值G,而是预测值。 的确,这四个值应该是经过 Ground Truth 和Proposal计算得到的真正需要的平移量和尺度缩放。 这也就是R-CNN中的: 深度学习目标检测:RCNN Bounding-box回归 深度学习目标检测:RCNN Fast-RCNN主要贡献在于对RCNN进行加速,快是我们一直追求的目标(来个山寨版的奥运口号- 更快、更准、更鲁棒),问题在以下方面得到改进: 1)卖点1?-?借鉴SPP思路,提出简化版的ROI池化层(注意,没用金字塔),同时加入了候选框映射功能,使得网络能够反向传播,解决了SPP的整体网络训练问题; 2)卖点2 - 多任务Loss层 A)SoftmaxLoss代替了SVM,证明了softmax比SVM更好的效果; B)SmoothL1Loss取代Bouding box回归。 将分类和边框回归进行合并(又一个开创性的思路),通过多任务Loss层进一步整合深度网络,统一了训练过程,从而提高了算法准确度。 深度学习目标检测:FAST RCNN FAST RCNN框架图如下: 深度学习目标检测:FAST RCNN 与R-CNN框架图对比,可以发现主要有两处不同:一是最后一个卷积层后加了一个ROI pooling layer,ROI pooling layer实际上是SPP-NET的一个精简版二是损失函数使用了多任务损失函数(multi-task loss),将边框回归直接加入到CNN网络中训练。R-CNN训练过程分为了三个阶段,而Fast R-CNN直接使用softmax替代SVM分类,同时利用多任务损失函数边框回归也加入到了网络中,这样整个的训练过程是端到端的(除去region proposal提取阶段)。Fast R-CNN在网络微调的过程中,将部分卷积层也进行了微调,取得了更好的检测效果。小结:Fast R-CNN融合了R-CNN和SPP-NET的精髓,并且引入多任务损失函数,使整个网络的训练和测试变得十分方便。缺点:region proposal的提取使用selective search,目标检测时间大多消耗在这上面(提r
您可能关注的文档
- 人工智能-卷积神经网络(CNN).ppt
- 人工智能-决策树.ppt
- 人工智能-垃圾邮件拦截过滤系统.ppt
- 人工智能-列表.ppt
- 人工智能-面向对象编程改.ppt
- 人工智能-模块和包.ppt
- 人工智能-目标检测备课.ppt
- 人工智能-深度学习概述.ppt
- 人工智能-数学基础python回顾.ppt
- 人工智能-数学基础之概率论和数理统计.ppt
- 2023年环氧脂肪酸甲酯行业市场突围建议及需求分析报告.docx
- 2023年精密车床行业市场需求分析报告及未来五至十年行业预测报告.docx
- 2023年窄带综合业务数字网(N-ISDN)行业市场需求分析报告及未来五至十年行业预测报告.docx
- 2023年磁共振成像装置行业市场突围建议及需求分析报告.docx
- 2023年房车旅游行业市场突围建议及需求分析报告.docx
- 2023年艺术展行业市场突围建议及需求分析报告.docx
- 2023年聚酯纤维行业洞察报告及未来五至十年预测分析报告.docx
- 2023年米粉行业分析报告及未来五至十年行业发展报告.docx
- 2023年食用冰行业市场突围建议及需求分析报告.docx
- 2023年硫精砂行业市场突围建议及需求分析报告.docx
文档评论(0)