人工智能概论.docxVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
双目感深摄像头结合手机传感器运动数据,建立实时的3D运动模型 张云鹏 汽车盲区是驾驶员无法直接观察到的车辆周围区域,其中包括四大视觉盲区以及其他人为盲区。为了解决这一问题,我们采用了双目感深摄像头结合手机多传感器的方法,以获取运动数据并建立实时的3D运动模型,以预判障碍物的轨迹并发出警示。 双目摄像头是一种使用两个摄像头组成的系统,旨在模拟人类双眼视觉的原理。通过利用双目摄像头的立体视觉,可以获取场景中物体的深度信息和三维结构。 双目摄像头的原理基于视差的概念。视差是指当我们观察一个物体时,由于双眼位置的不同,每只眼睛所看到的物体位置存在微小的差异。通过测量这种视差,可以计算出物体与摄像头之间的距离。 基于深度学习的匹配算法 基于深度学习的匹配算法是利用深度学习网络模型来实现双目图像匹配,通过卷积神经网络(CNN)对图像特征进行提取并用于代价计算,同时将代价聚合和图像增强等步骤嵌合在特征提取的过程中,最终实现端到端的双目图像匹配。深度学习网络模型可以更多地利用图像的全局信息和上下文信息,通过预先训练来获取模型参数,使算法的鲁棒性得到提高。 这类算法网络主要可分为孪生网络(Siamese Network)和生成式对抗网络(Generative Adversarial Network)。 孪生网络则是由Bromley等人于1993年提出的一种神经网络结构[30],该网络结构具有两个权重共享的子网络结构,子网络结构在整体网络的前端,旨在使用同样的方式对输入信号进行处理。在用于双目立体匹配的双目双生网络中,这两个共享权重的子网络分别用来处理左右图像,将卷积得到的特征通过全连接层转化为特征向量,通过计算2个特征向量之间的曼哈顿距离来判断两张图片的相似度。Xu等人于2022年提出了ACVNet[40],该网络利用相关线索生成注意权重,抑制冗余信息,增强匹配相关的信息,有效的提高了双目匹配的效率。Shen等人于2022年提出了PCWNet[41],该网络对金字塔结构进行修改,在金字塔的上层构造组合代价用于视差估计,在最后一层构造扭曲体用于视差细化,实现了很好的泛化性。 生成式对抗网络是近年来无监督学习最具前景的方法之一,网络模型由至少两个模块构成:生成模型(Generative Model)和判别模型(DiscriminativeModel),两个模块互相博弈学习产生输出,最终达成纳什均衡。Pilzer等人于2018年提出了用于双目立体匹配的生成对抗网络模型,该模型由两个对称的生成模型和一个判别模型构成,两个对称的生成模型用于生成不同视角的图像,通过相互制约和监督,融合后输出最终的视差图。 Lore等人于2018年提出了cGAN网络[43],该网络利用邻近帧计算估计深度图,具有良好的泛化性。Matias 等人于2019年提出了VelGAN网络,该网络针对双目图像中被遮挡区域的视差回归进行了优化,得到了良好的视差结果。Liang等人于2019年提出iDCGAN网络[45],该网络可以在同一表面只有两张图像的情况下生成新的光照方向的第三张图像,从而使用光度立体测量法来实现双目立体匹配。 双目视觉原理研究 双目摄像头通常由一个主摄像头和一个辅助摄像头组成。主摄像头用于捕捉场景的纹理和颜色信息,而辅助摄像头则被安装在主摄像头旁边,它的位置与主摄像头之间存在一定的距离,通常称为基线距离。 当双目摄像头对准一个物体时,主摄像头和辅助摄像头会同时捕捉到该物体的图像。然后,通过图像处理算法对两个图像进行匹配和比对,找出对应的特征点。通过计算这些特征点之间的视差,可以获得物体在摄像头坐标系中的三维坐标。 一旦获得了物体的三维坐标,就可以进行深度感知和距离测量。此外,双目摄像头还可以用于物体识别、跟踪和姿态估计等应用。通过连续捕捉并分析双目图像,可以实现对物体的实时跟踪和运动估计。 如图所示,双目图像就是通过左右两个摄像头拍摄的图片,存在一定视差。视差就是指,同一像素在两张图片上位置的差距。举例来说,看下面这张图,我们聚焦在同一像素点,摩托车后视镜上。在左图,该像素点坐标是(80,150),右图是(35,150),那该图的视差就是80-35=45 为了建立准确的盲区模型,我们利用大型车辆的数据进行训练,确定覆盖范围最广的盲区范围,以确保车辆的安全性。同时,结合当前车辆的速度、车长、轴距以及手机自带的陀螺仪、GPS系统、加速度传感器等传感器信息,以及车辆周围障碍物的距离和移动轨迹,建立了实时的3D数学模型。这个模型可以预测附近行人或车辆是否处于危险区域,并及时发出警报。通过将手机自带的传感器与盲区监测系统相融合,我们极大地降低了成本,提高了产品的普适性。 其中结合我们在手机端开发的APP,用户授权APP读取手机的

您可能关注的文档

文档评论(0)

130****7010 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档