《科学数据管理办法》语词分析.docx

《科学数据管理办法》语词分析.docx

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
? ? 《科学数据管理办法》语词分析 ? ? 温亮明 李洋 张丽丽 摘 要 文章分析了《科学数据管理办法》的文本语词,有助于把握国家对科学数据管理的政策导向。文章对《科学数据管理办法》的文本内容进行分词、词频合并、词性筛选、虚词剔除等预处理操作,基于文本预处理结果筛选得出频繁词和热词,构建“语词—条款”共现矩阵并可视化展示。研究发现:《科学数据管理办法》共有11个核心频繁词、9个重点频繁词、8个主要频繁词和若干个一般频繁词,各主题语词在文本中均有对应的核心条款,但主题语词和核心条款分布不均。 Key 《科学数据管理办法》? 自然语言处理 词频统计 关联分析 分类号 G322.0 DOI 10.16810/ki.1672-514X.2020.05.015 Abstract Analysis of the text words of Measures for Managing Scientific Data can help to grasp the policy orientation of national scientific data management. Firstly, this paper performs some pre-processing operations such as word segmentation, word frequency merging, part of speech screening and vocabulary culling for the text content of Measures for Managing Scientific Data. Then, it screens out the frequent words of text and the hot words of each chapter based on pre-processing results. Finally, it constructs a “word-term” co-occurrence matrix and visualize it. Results show that Measures for Managing Scientific Data has 11 core frequent words, 9 key frequent words, 8 major frequent words and several general frequent words, but topic words and core terms are unevenly distribute in the text. Keywords Measures for Managing Scientific Data. Natural language processing. Word frequency statistics. Correlation analysis. 0 引言 目前,科学数据已经成为支撑国家科技创新和经济社会发展的基础性和战略性资源[1],国际上一些组织和政府已经制定了明确的政策以推动科学数据的管理与开放共享[2]。我国也非常重视科学数据管理与共享工作,从2004年起先后在八个领域建成了国家科技资源共享服务平台[3],并相继出台了一系列领域科学数据管理政策。但与发达国家政策体系相比,我们在数据权益、共享规则等方面的管理政策仍有待健全和完善[4],主要表现为:现有政策侧重于个别行业领域数据的管理,而对其他学科领域数据涉及较少[5];现有政策制定主体几乎全为相关部委或领域数据中心,而无国家层面出台的法规政策,缺乏法律效力[6];缺乏国家宏观统一、明確的政策法规[7-8]。针对这些薄弱环节,我国于2016年12月将“加强和规范科学数据管理的办法”列入中央全面深化改革领导小组2017年工作重点[9];2017年3月,科学技术部会同有关部门启动了《科学数据管理办法》 (以下简称《办法》)编制工作;2018年1月,《办法》经中央全面深化改革领导小组审议通过;2018年3月17日,国务院办公厅正式印发《办法》[10]。《办法》出台后,引起了全社会强烈反响,多家主流媒体做了专题报道,科学技术部、中国科学院等部委召开专门会议宣传贯彻落实,部分省份出台了相应的实施细则,部分专家学者专门撰文论述、建言献策。鉴于此,有必要继续研究《办法》,从更多角度理解《办法》的精神内涵。 1 《办法》研究现状 1.1 意义阐述 《办法》是我国首次面向全领域科学数据出台的国家层面的科学数据管理办法,其实践指导意义重大。齐法制[11]、王卷乐[12]等认为,《办法》首次站在国家高度、面向多领域科学数据,具有划时代意义;郭华东[13]认

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

生命在于奋斗,技术在于分享!

认证主体谢**

1亿VIP精品文档

相关文档

相关课程推荐