天津大学《自然语言处理与信息检索》课程教学大纲.PDF

下载文档

685
0
约1.17万字
约 8页
2017-05-09 发布于江苏
举报
版权申诉

天津大学《自然语言处理与信息检索》课程教学大纲.PDF

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

天津大学《自然语言处理与信息检索》课程教学大纲

天津大学《自然语言处理与信息检索》课程教学大纲自然语言处理与课程编号： 2160258 课程名称：信息检索学时： 32 学分： 1.5 学时分配：授课：16 学时上机：16 学时授课学院：计算机科学与技术学院适用专业：计算机、语言学专业本科生或研究生统计学、面向对象程序设计、人工智能或机器学习的相先修课程：关知识一．课程的性质与目的自然语言处理技术是自动人机交互、搜索引擎、机器翻译、信息抽取等应用的重要支撑技术。本课程将系统地介绍自然语言处理（NLP ）的基本概念、常用的算法和重要的应用。在基本概念和算法上，将介绍词汇、句法、语义分析等的基本知识。贯穿其中，将重点介绍统计自然语言处理的关键算法，主要是在大规模语料库的支持下，统计语言模型在语言知识自动学习中的应用。在应用方面，将结合文本分类和聚类、机器翻译、信息检索、网络挖掘等进一步加深学生对自然语言处理系统的设计策略和实现技术的了解。二．教学基本要求了解和掌握自然语言处理的基本理论基础，包括统计学和语言学基础，词汇、语法和语义的相关概念及算法，以及自然语言处理的理论和方法在文本自动分类、聚类、信息检索和机器翻译等方面的应用。三．教学内容课程的基本内容包括：（1）自然语言处理的数学基础，如贝叶斯模型、噪声信道模型、熵和互信息等的概念、n 元语法模型和 HMM 模型等，同时介绍这些模型在具体实践中的应用；（2 ）自然语言处理的语言学基础，介绍有关词法和语法等方面的知识，包括词语搭配、语义消歧、概率句法分析等内容；（3 ）自然语言处理的应用，如文本分类和聚类、信息检索、统计机器翻译、互联网信息挖掘。课堂讲座（26 学时）第一章绪论介绍自然语言处理的相关概念，使学生有一感性认识；同时说明自然语言处理中的不同方法论。第二章统计学基础统计学基础知识，包括贝叶斯模型、噪声信道模型，熵、交叉熵和互信息等的概念。第三章语言学基础介绍有关词性、句法、语法和语义等方面的语言学知识；基于语料库的统计自然语言处理，包括语料获取和标注以及应用等。第四章词语搭配如何鉴定相邻或非相邻词语之间组合强度，即如何识别有意义的短语结构。第五章 n 元语法模型 n 元语法模型的建模和应用。第六章语义消歧有监督和无监督的语义消歧。第七章隐马尔可夫模型与词性标注有关隐马尔可夫模型的建模、算法及其在词性标注中的应用。第八章概率句法分析上下文无关文法（CFG ）、概率上下文无关文法（PCFG ）、句法分析树等概念；基于概率的最佳句法分析树的确定；滨州树库；改进 PCFG 的方法。第九章文本分类和聚类文本分类和聚类的算法介绍。第十章信息检索与挖掘有关信息检索、信息挖掘的模型和理论。第十一章统计机器翻译基于统计的机器翻译的概念、方法、模型和应用等。实验（6 个学时）实验一：基于搜索引擎，判断某种语言搭配是否符合语言规范；实验二：隐马尔可夫模型及其在词性标注中的应用实现；实验三：在指定语法下，建立给定句子的最佳句法分析树。四．学时分配教学内容授课上机实验实践实践(周) 第一、二章 2 第三、四章

您可能关注的文档

文档评论（0）

l215322 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta

认证主体李**

1亿VIP精品文档免费下

更多 >

天津大学《自然语言处理与信息检索》课程教学大纲.PDF