- 1、本文档共23页,其中可免费阅读22页,需付费10金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
本申请涉及人工智能领域以及数字医疗领域,提供了一种端到端语音合成方法、装置、设备以及介质,该方法基于包括有图编码器、后验编码器、随机时长预测器、标准化流模块以及解码器的语音合成模型,获取训练文本对应的目标梅尔频谱以及预测合成语音的预测梅尔频谱得到第一损失值,获取训练文本对应的隐状态变量、隐变量以及音素时长信息得到第二损失值,之后基于第一损失值和第二损失值对语音合成模型进行训练,而在模型推理过程中,将待合成文本输入至训练好的语音合成模型以获取目标合成语音。本申请实施例基于隐状态向量以及声谱隐状态进
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116469375 A
(43)申请公布日 2023.07.21
(21)申请号 202310640928.5 G10L 25/30 (2013.01)
1亿VIP精品文档
相关文档
最近下载
- 广发证券-华利集团-300979-崛起中的运动鞋履制造龙头.pdf
- 城乡学校网上结对工作实施方案.doc
- 弟子规全文带拼音(可打印版).pdf
- 高三二轮复习生物【 知识精讲+备课精思+拓展提升 】 生物高考核心素养科学思维课件.pptx
- 人教版九年级上册历史第2课 古代两河流域 导学案设计 (无答案).docx
- Midea美的 BCD-515WGPM 星河紫冰箱 说明书.pdf
- 2023年湖南省益阳市中考物理试卷真题(含答案详解)+2022年试卷及答案.docx
- 吉利-博瑞GC-9-产品使用说明书-博瑞2.4L-MR7243C01-吉利KC-1S车型用户手册-V0.6-20160510.pdf
- 2021枪支管理使用规定题库含答案.doc
- 防爆器材使用操作使用课件.pptx
文档评论(0)