- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实 践 教 学 大 纲
一、课程基本信息
课程名称:
自然语言处理(NLP)(课内实验)
课程代码:
042714083
适用专业:
智能科学与技术
课程性质:
专业核心课
开设学期:
第6学期
学分学时:
1/16
开设实验项目数:
6
二、课程目标
《自然语言处理(NLP)》是一门专业核心课程。通过《自然语言处理(NLP)》课程的学习,可以使学生获得对完成自然语言处理任务所必须的各项技能及知识,培养学生认识自然语言处理的建模和算法过程,并学会运用现代信息技术获取相关信息以及解决自然语言处理问题的方法等。
课程目标1:通过学习,掌握自然语言处理的基本流程、基本知识和基本性质。通过案例实践掌握对完成自然语言处理任务所必须的各项技能。(强支撑毕业要求3-2)
课程目标2:通过学习,认识自然语言处理的建模和算法过程,并学会运用现代信息技术获取相关信息以及解决自然语言处理问题的方法等。(中支撑毕业要求4-1)
课程目标3:通过学习,养成良好的自主学习习惯,具有吃苦耐劳的态度;在学习交流中能表现出团队协作能力。(中支撑毕业要求9-2)
课程目标4:能够就自然语言处理相关的专业问题,通过设计报告、PPT、图表、图纸等方式归纳和陈述自己的观点,回应质疑,理解与社会公众与业界同行交流的差异性。(中支撑毕业要求10-1)
三、课程目标与毕业要求的对应关系
毕业要求
毕业要求指标点
课程目标
指标点权重
3.设计方案
3.2掌握自然语言处理的基本流程、基本知识和基本性质。通过案例实践掌握对完成自然语言处理任务所必须的各项技能。力。
课程目标1
0.4
4.研究
4.1认识自然语言处理的建模和算法过程,并学会运用现代信息技术获取相关信息以及解决自然语言处理问题的方法等。
课程目标2
0.2
9.团队
9.2 具有在团队中独立或合作开展工作的意愿和能力,以团队成员或负责人的角色,能够组织、协调与指挥团队开展工作。
课程目标3
0.2
10.沟通
10.1能够就智能科学与技术及相关领域的专业问题,通过口头、书面、图表、图纸等方式归纳和陈述自己的观点,回应质疑,理解与社会公众与业界同行交流的差异性。
课程目标4
0.2
四、实验实训项目设置:
序号
编号
实验项目名称
实验
学时数
实验
类型
要求
1
实验一
实战之构建语料库与语料操作
2
设计性
独立完成
2
实验二
正则表达式应用中文及分词的应用
4
综合性
分组完成
3
实验三
中文命名实体识别及实战之提取文本关键词
2
设计性
独立完成
4
实验四
实战之论文相似度计算及垃圾短信分类
2
设计性
独立完成
5
实验五
基于词典、文本分类LDA、LSTM的情感分析
2
设计性
独立完成
6
实验六
基于Seq2Seq的智能问答系统
4
综合性
分组完成
五、实验实训项目内容:
实验一:实战之构建语料库与语料操作
[目的和要求]
目的:1.掌握Anaconda3的安装和配置
2.掌握scikit-learn的安装和配置
3.掌握Jupyter Notebook的安装和配置
要求:查阅并获取网络在线语料库的内容
[内容与步骤]
内容:1.查阅网络在线语料库的内容。 2.获取网络在线语料库文本。
步骤:
1.查阅网络在线语料库的内容
以在线古腾堡语料库为例,打开古腾堡语料库网页,单击左侧 Browse Catalog 选项,进 入 Online Book Catalog–Overview 网页,在 Languages with more than 50 books 中选择 Chinese, 进入 Browse By Language: Chinese 网页,可以发现网页中包含大量的中文在线语料库。这些 语料以作者姓名(英文)排序,如《西游记》作者 Wu,Cheng'en、《红楼梦》作者 Cao,Xueqin。 通过姓名可以查找需要的语料。
2.获取网络在线语料库文本
打开古腾堡语料库网页,进入 Browse By Language: Chinese 网页,分别找到《三国志》 和《窦娥冤》,单击后进入,在 Download This eBook 中选择 Plain Text UTF-8,分别获得《三 国志》和《窦娥冤》的文本网址。
[主要器材与工具]
微型计算机,Windows10操作系统
实验二:正则表达式应用中文及分词的应用
[目的和要求]
目的:1.熟练运用jieba进行中文分词。
2.使用HMM进行词性标注。
3.掌握viterbi函数。
要求:根据设计要求给出方案,对实验数据准确进行分词和词性标注
[内容与步骤]
内容:
1.使用jieba进行中文分词。
2.获取网络在线语料库文本。
步骤:1.使用HMM进行词性标注
1.1训练HMM
(1)加载需要的库,输
文档评论(0)