教育部产学合作协同育人教学内容和课程体系改革项目申报书—强化学习技术与应用课程建设探索.docxVIP

下载本文档

44
0
约7.69千字
约 11页
2023-07-29 发布于江苏
举报
版权申诉

教育部产学合作协同育人教学内容和课程体系改革项目申报书—强化学习技术与应用课程建设探索.docx

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2023 年美丽软件科技有限公司教育部产学合作协同育人项目申请书项目名称：强化学习技术与应用课程建设探索负责人：联系电话：工作邮箱：学校名称：通信地址：申请时间：二○二三年七月制填表说明 1. 申报资格： (1) 全日制本科高校在职教师或在校学生； (2) 原则上不接受之前已获得过同类项目资助的重复申报。 2.有关项目内容、具体要求和说明请参考项目申报指南。 3.项目负责人填写的内容由所在单位负责审核，所填内容必须真实、可靠。 4. 申请书由项目负责人填写并手写签名，报送所在高校主管部门审查、签署意见并盖章后，将扫描文件上传到项目平台 () 。项目概况项目名称大数据分析技术师资培训项目类型 (单选) R 教学内容和课程体系改革项目 □ 创新创业教育改革项目 □ 师资培训项目 □ 实践条件和实践基地建设项目起止年月 2023 年 8 月至 2025 年 8 月项目负责人姓名性别出生年月职称及所在院系最终学位职务及所在部门教师个人简介 (主要教学及科研工作) 从事计科软件专业教学多年，一直承担计算机导论和操作系统教学任务；指导学生获得蓝桥杯软件设计大赛省赛二等奖；参与多个教育部产学合作协同育人项目；曾发表论文三篇。近五年教育教学研究领域及成果起止时间项目名称项目级别 2019.11- 2020.10 操作系统慕课设计和制作的探究院级 2022.6- 2024.6 疫情下教师在线教学能力提升的探究院级项目主要成员 ( 不含项目负责人) 姓名职称主要任务签名项目调研策划组织项目实施组织项目实施课程建设课程建设课程建设基础调研基础调研基础调研组织项目研发活动组织项目研发活动组织项目研发活动项目相关背景和基础介绍 2017年，国务院发布《新一代人工智能发展战略规划》，其中“高级机器学习理论”专栏中明确指出：“研究统计学基础理论……小样本学习、深度强化学习、无监督学习、半监督学习、主动学习等学习理论和高效模型”。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中明确指出：“加强原创性引领性科技攻关，瞄准人工智能、量子信息……等前沿领域，实施一批具有前瞻性、战略性的国家重大科技项目”“培育壮大人工智能、大数据等新兴数字产业，促进共享、平台经济健康发展”。因此，开展强化学习基础理论和方法的研究，将有力地支撑国家人工智能科技战略规划实施，具有重大意义。强化学习作为人工智能技术的重要组成部分，在控制、游戏、推荐、计算机视觉、自然语言处理、数学、生物信息学、智能交通等领域有广泛应用。 1 课程建设的背景与意义强化学习（Reinforcement Learning）是一种试错的机器学习方法，通过智能体与环境的交互，针对智能体做出的动作获得环境反馈，进而更新智能体知识和经验，选择下一个动作再次对环境进行探索。从分类上讲，强化学习技术是机器学习技术的一部分，但与监督学习、非监督学习等其他机器学习方法有明显不同：①强化学习的学习过程中没有监督信号，只有奖励反馈和实验试错；②强化学习的环境反馈具有延时性；③智能体的动作会影响后续接收到的序列数据；④强化学习的过程与时间序列相关，是一个序贯决策的过程。由于深度学习（Deep Learning）模型的快速发展，与传统强化学习的结合使得对复杂环境的表征成为了可能，形成了深度强化学习技术（Deep Reinforcement Learning），实现了将强化学习的决策能力与深度学习的表征能力的有效融合，面向自动驾驶、机械臂控制等复杂场景具有重要应用。其中最著名的深度强化学习应用当属2016年谷歌DeepMind公司研发的基于强化学习的围棋程序AlphaGo，击败了世界围棋大师李世石，震惊世界的同时也拉开了深度强化学习从学术界走向大众认知的帷幕。此外，深度强化学习技术也可以应用在其他学科领域，如生物工程、机械制造、化学分析、药物合成等，能够促进众多有决策需求的学科发展。近年来，国内外高校逐步开设了强化学习、深度强化学习相关的课程[1]。在国外，英国伦敦大学学院David Silver教授于2015年开设了面向研究生的Reinforcement