自然语言处理导论课件第13--16章问答系统、基于深度学习的社会计算、内容生成与跨模态计算、深度学习时代下自然语言处理的前沿研究.pptx

下载文档

0
0
约1.92千字
约 93页
2023-12-08 发布于山东
举报
版权申诉
保障服务

自然语言处理导论课件第13--16章问答系统、基于深度学习的社会计算、内容生成与跨模态计算、深度学习时代下自然语言处理的前沿研究.pptx

1、本文档共93页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

《自然语言处理导论》;问答系统：一个能回答任意自然语言形式问题的自动机。

输入：任何自然语言形式的问题

输出：一个简洁的答案或者可能答案的列表

输入：新中国是多久成立的？

输出：1949年10月1日。;1.基于符号的表示方法;最简单方法：N-gram匹配;最常用方法：Bi-LSTM+CRF;编码嵌入后，计算两个向量之间的余弦相似度;1.基于符号的表示方法;问句;But！;2.基于分布式的表示方法;知识图谱图数据嵌入;ShenYing,DengYang,YangMin,LiYaliang,DuNan,FanWei,LeiKai.Knowledge-awareAttentiveNeuralNetworkforRankingQuestionAnswerPairs.InThe41stInternationalACMSIGIRConferenceonResearch&DevelopmentinInformationRetrieval(SIGIR2018).SIGIR:AnnArbor,Michigan,USA,July8-12,2018.pp.901-904.ACM.;;;;;问答系统评价指标-MRR;假设有两个主题，主题①有4个相关网页，主题②有5个相关网页。

某系统对于主题①检索出4个相关网页，其rank分别为1,2,4,7

对于主题②检索出3个相关网页，其rank分别为1,3,5

对于主题1，平均准确率为(1/1+2/2+3/4+4/7)/4=0.83

对于主题2，平均准确率为(1/1+2/3+3/5+0+0)/5=0.45

则MAP=(0.83+0.45)/2=0.64

MAP是反映系统在全部相关文档上性能的单值指标。系统检索出来的相关文档越靠前，MAP就越高。如果系统没有返回相关文档，则准确率默认为0。;;知识图谱内容越完备，问答效果越好;;;;多模态任务;多模态任务;多模态问答系统;多模态问答系统;视觉问答系统;视觉问答系统需要四个部分完成：视觉/文本理解，多模态特征交互，答案检索，答案生成。;视觉问答系统数据集;多轮对话系统;多轮对话系统;多轮对话系统;多轮对话系统;《自然语言处理导论》;推荐系统的发展轨迹;推荐系统的应用场景;推荐系统的整体架构;推荐系统的整体架构;用户过去行为

物品特征

物品相似性;用户过去行为

用户间关联关系

物品特征

物品相似性;混合推荐：物以类聚、人以群分-基于物品的协同过滤;用户静态特征：男女，地域，年龄，教育，etc…;推荐系统的整体架构;推荐系统的整体架构;推荐系统的整体架构;评价指标;?;《自然语言处理导论》;;表格数据-文本数据的内容生成;研究动机：语言更适合人类，数据更适合机器;天气;人???生平;NBA赛事;NBA赛事;黄蜂队;黄蜂队;黄蜂队;黄蜂队;保真性;消融实验;风格迁移;多模态文本-图像生成;周一，洛杉矶快船队以107比101击败犹他爵士队。克里斯-保罗本赛季拿下三双，得到13分。在36分钟内得到10个篮板和12次助攻。他还投出了两次抢断和一次盖帽……爵士队的投篮效率相对较高，但他们有17次失误，而……;;参考风格编码器;表格数据嵌入;解码器：逐词生成文章;解码器;跨模态计算;图像描述技术;图像描述技术;图像描述技术;图像描述的端到端框架;

编码器-解码器结构虽然强大，但是依旧存在着局限性：encoder和decoder之间只通过一个固定长度的向量作为特征传递信息，这其中必然存在着一定量的信息丢失，使得解码的时候无法获得充足的信息，那么最终模型的准确率自然也就收到了限制。为了弥补这一缺陷，这一领域的科研工作者们引入了注意力机制。

所谓的注意力（Attention）机制，实际就是在传递信息的过程中，给不同的元素赋予不一样的权重作为“注意力”，这一改进使得信息传递的过程中可以更高效地利用重点信息，减少了整体信息量的丢失。在图像描述领域的话，也可以加上注意力机制，具体的用法有很多，常见的方法就是给经过CNN生成的featuremap的每个位置加上权重因子，再去编码成定长的特征向量。;图像描述的端到端框架;图像描述的组合框架;图像描述的组合框架;图像描述的其他框架;图像描述的其他框架;图像描述的其他框架;图像描述数据集;图像描述数据集;《自然语言处理导论》;幂律分布与正态分布示意图;神经机器翻译模型涉及噪声数据不稳定示例;自动摘要与手工摘要示意图;MAML算法初始化参数学习过程;卷积神经网络反卷积可视化方法

您可能关注的文档

文档评论（0）

lai + 关注: 实名认证

内容提供者

精品资料

咨询Ta 进入空间

1亿VIP精品文档

更多 >

自然语言处理导论 课件 第13--16章 问答系统、基于深度学习的社会计算、 内容生成与跨模态计算、 深度学习时代下自然语言处理的前沿研究.pptx