无人机录音中噪声抑制方案.docx

下载文档

0
0
约1.31万字
约 13页
2024-01-07 发布于辽宁
举报
版权申诉
保障服务

无人机录音中噪声抑制方案.docx

1、本文档共13页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第一章绪论

1.1研究背景

无人机行业在近几年蓬勃发展，无人机无论是用于航拍或者实际工程等，无人机的数字化实时语音记录是一项极其关键的部分，录音数据通过高速通道实时传输到主控机处理和保存，或采用嵌入式数字录音系统进行处理并通过大容量存储卡(CF卡等)本地保存。

然而，实时语音记录的过程中不可避免地会受到来自周围环境的干扰，例如传输媒介引入的噪声（主要是空气噪声），无人机设备内部的电噪声，乃至其它讲话者的话音等。环境的背景噪声特别是周期噪声会严重影响录音效果，同时当处于静音状态(没有通话语音)时，如果仍继续录音，则会录下大量无用的背景声音信息。静音和语音的编码存储原理一样，存储空间都是与时间成正比，而在无人机作业时大多数情况下司机的语音只占很小的一部分，如果不进行噪声抑制处理，就会造成存储空间的极大浪费，因此在无人机录音系统中需要对噪声加以抑制，改善数字录音音质和录音存储的效率问题。

如前所述，在实际现场中，环境噪声的污染是不可避免的，这些噪声的污染使得许多语音处理系统的性能急剧恶化。例如，一个典型的孤立词识别系统，用纯净语音训练后，其识别率可以达到100%，但在以90km/h的速度飞行的无人机上其识别率将会降到3096，这主要是受到无人机内部自身噪声的影响;一个用纯净语音训练的错误率不到1%的语音识别系统，在20m高空中的识别错误率将会高于50%,这同样是由于各种噪声的影响。

噪声破坏了语音信号原有的声学特征和模型参数，模糊了不同语音之间的差别，使语音质量下降，清晰度降低;强噪声会使人产生听觉疲劳，如何尽可能地从带噪语音中去除噪声就成了目前信号处理领域中的一个热门的话题。因此在无人机录音中对背景噪声进行抑制，从带噪语音中去除噪声能够提高无人机录音效率，减少无人机录音存储量，提高无人机录音的音质，可以为安全监控、航拍等领域提供很好的基础;同时，使用有效的静音检测、语音增强方法有助于提高语音识别的识别率;在用户接口中消除回声可以提高合成语音的音质;在通讯系统中应用噪声抑制技术可以降低系统平均传输率。研究数字录音中的噪声抑制技术不仅可以利用在无人机上，也可拓展到其它噪声环境，在其他语音处理领域也有很好的应用前景，因此研究数字录音中噪声抑制具有重要的意义。

1.2研究现状

由于语音的特殊作用，社会进步对语音通信提出了更高的要求，推动了对语音压缩编码、语音识别、说话人识别、语音合成、语音理解、语音增强、语音分离的研究。在近几年，声学、语音和信号处理国际会议(InternationalConferenceonAcoustic,SpeechandSignalProcessing,ICASSP)与声学回声和噪音控制国际研讨会(InternationalWorkshop.onAcousticEchoandNoiseControl,IWAENC)都有很多语音信号处理的优秀论文发表。噪声抑制包括静音(纯噪声)检测和语音增强两部分内容:

一、静音检测

静音检测最早的应用是在贝尔实验室开发的电话传输和转换系统中，用于通信信道的时间分配，通过语音检测实现在空闲的信道插入其他人的话音信息。之后.，各种各样的语音检测算法在自动语音识别、说话人确认、回声消除、语音编码和其他方面的应用中被提出来。通常，不同的系统需要不同的算法以满足各自在计算精度、复杂性、鲁棒性、敏感性、响应时间等方面的需求。长期以来，传统的语音端点检测方法都是针对实验室安静环境，直到近年来，人们才开始研究噪声环境下语音的端点检测。传统的语音端点检测算法是依据语音信号的时域特性，采用的主要参数有短时能量、短时平均过零率等。这些算法简单易于实现但是应用于噪声环境效果不佳。

近年来，随着通信业的迅猛发展，又出现了很多种语音端点检测算法。它们主要是通过采用各种新的特征参数，以提高算法的抗噪声性能。如基于1994年由J-CJunqua提出的TF参数[4]的语音端点检测，还有诸如倒谱系数[7][8]，短时频带方差、自相关相似距离[10]、信息嫡[11]等也逐渐被应用到端点检测中[5][6]。另外，有时还通过将信号的几种特征组合成一个新的特征参数来进行语音端点检测[12]，而对语音端点的判决方式也由原来的单一门限、双门限、多门限，发展到基于模糊理论的判决方式[13]。

二、语音增强

语音增强这个课题早在20世纪60年代就己引起人们的注意，此后30多年来进行了大量的研究。随着数字信号处理理论的成熟，20世纪70年代曾形成一个研究高潮，取得了一些基础性的成果，并使得语音增强发展成为语音信号数字处理的一个重要分支。进入20世纪80年代以后，VLSICVeryLargeScaleIntegration，超大规模集成电路)技术的发展为语音增强的实时实现提