跨媒体移动应用理论与实践 课件 3.2 基于语音识别的跨媒体移动应用.pptx

跨媒体移动应用理论与实践 课件 3.2 基于语音识别的跨媒体移动应用.pptx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
1第三章 跨媒体移动应用中的语音识别3.2 基于语音识别的跨媒体移动应用 2语音识别移动应用现状 基于语音识别的跨媒体移动应用 “ASR技术能够打通语音与其他媒体的隔阂,为我们的生产和生活提供了巨大的便利,带来了庞大的市场。” 3语音识别移动应用现状 Tractica:直至2025年全球语音和语音识别软件市场将增长至约69亿美元赛迪数据发布《2019-2021年中国智能语音市场预测与展望数据》:预计至2021年,智能语音市场规模将达到194.8亿元中国智能音箱易观发布《2020年中国语音OS市场分析报告》:随着AI与5G技术的持续发展,中国智能语音产业将迎来新的发展机遇语音识别市场前景 4语音识别移动应用现状 语音识别在移动应用中在实际运用中ASR技术主要出现于手动输入不便、输入文字量较大、或面向不熟悉设备输入的用户的典型应用场景:高德地图语音查找导航地点与信息微信语音输入转文字智能手机搭载的语音助手服务智能家电的语音控制 5语音识别移动应用现状 语音识别在移动应用中同样 ASR 技术能够打通语音与其他媒体的隔阂:将语音转化为文字,利用语音的便捷性和文字的条理性,高效处理会议记录、笔记等进一步实现翻译、关键词检索、摘要分析处理需求 认识用户的声音,对特定的人做出特定的反馈举例:有道词典APP的语音识别功能能够实时识别输入的语音信息,并将其转换成双语文字。系统对输入的音频数据进行声学特征提取,再将特征输入声学模型和语言模型。最后,从词汇表中对词组序列进行解码,获得最终的文本内容。 6基于语音识别的跨媒体移动应用 字说——智能文字动画视频App支持文字、语音、音频文件多种形式智能识别语音,提取文字,依据文字合成人声,文本音频的双向转化 7基于语音识别的跨媒体移动应用 Soloop即录——智能视频剪辑App 自动识别音乐节奏、画面切换、语音内容实现音频、画面、字幕的跨媒体一键生成 8基于语音识别的跨媒体移动应用 网易云音乐——哼唱识曲 自动提取哼唱音频中的音频指纹信息 与曲库中的音乐原曲音频指纹比对 找到歌曲及对应信息

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体孙**

1亿VIP精品文档免费下

相关文档

相关课程推荐