基于知识图谱的国内数据素养研究述评-《知识管理论坛》(2022年2期).docx

  • 0
  • 0
  • 约4.58千字
  • 约 84页
  • 2023-06-13 发布于四川
  • 正版发售

基于知识图谱的国内数据素养研究述评-《知识管理论坛》(2022年2期).docx

  1. 1、本文档共84页,仅提供部分内容试读,阅读完整内容需要下载文档。
  2. 2、本内容来自版权合作机构,仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  3. 3、因数字商品的特殊性,一经售出,不提供退换货服务、不进行额外附加服务。
龙源版权所有 基于知识图谱的国内数据素养研究述评 作者:李姣姣 杨志和 来源:《知识管理论坛》2022年第02期 摘要:[目的/意义]了解国内数据素养研究现状,梳理数据素养研究主题内容以及發展趋势。[方法/过程]以共词分析方法为理论基础,基于聚类分析法和战略坐标分析法,构建数据素养研究主题知识图谱及战略坐标图,并以可视化方式展现。[结果/结论]数据素养研究处于探索期,研究内容呈现多元化,大致分为8个研究主题,不同的研究主题之间相互关联、相互促进,未来的研究趋势可能向图书馆数据素养教育研究和新一代图书馆馆员的数据素养研究方向跃进。 关键词:数据素养 知识图谱 共词分析 战略坐标分析 分类号:G252 引用格式:李姣姣, 杨志和. 基于知识图谱的国内数据素养研究述评[J/OL]. 知识管理论坛, 2022, 7(1): 153-163[引用日期]. http:///p/283/. 1 引言 2007年E. Stevenson等正式提出了数据素养的概念,将“找到、评价以及合理有效利用信息”作为数据素养的核心要点[1]。黄如花等解析数据素养内涵不再拘囿于数据采集、表示和描述等数据能力层面,还将数据意识、数据伦理纳入数据素养的定义标准[2]。孟祥保等强调数据素养要求科研工作者对数据自身所具有的判断、分析以及转换技能[3]。近年来,数据素养不断成为图书情报界研究的热点话题,为了解国内数据素养研究现状、梳理数据素养研究主题内容以及发展趋势,本文以共词分析方法为理论基础,采用聚类分析算法和战略坐标分析法,构建数据素养研究主题知识图谱及战略坐标图,并以可视化方式展现,为业界数据素养教育未来的发展提供些许参考。 2 研究思路及方法 2.1 研究思路 基于中国知网(CNKI)数据库,以中文社会科学引文索引(CSSCI)和《中文核心期刊目录总览》收录的期刊作为研究数据,首先基于共词分析理论,借助智能局部移动算法(Smart Local Moving algorithm,SLM)进行主题聚类,以识别数据素养研究主题。其次通过向心度(Centrality)和密度(Density)构建战略坐标图(Strategic Diagram),分析各主题的发展阶段及关系,进一步阐释数据素养研究的现状以及未来的发展趋势。具体包括以下几个步骤(见图1):①获取文献数据集,并抽取关键词; ②进行数据处理,合并同类型关键词,去掉不具有实际意义的关键词,获得关键词数据集;③基于步骤②中的关键词数据集构建关键词共现矩阵;④利用智能局部移动算法,实施主题聚类并可视化;⑤根据主题聚类的结果,计算各主题的向心度和密度,构建战略坐标图,分析各主题间的关系;⑥对研究趋势的分析。 2.2 研究方法 共词分析是内容分析中的一种方法,由M. Callon等提出[4],主要通过词(或词组)的共现反映文本的主要内容[5]。聚类分析由H. E. Driver和A. L. Kroeber在1932年首次引入人类学的研究中[6],是一种无监督学习算法,主要依据“物以类聚”的原理,将具有相似性的研究对象聚集在一起。本文将基于智能局部移动算法,借助于VOSviewer 1.6.16软件实现主题聚类[7]。 战略坐标分析由J. Law等提出[8],用于分析特定领域中研究主题之间的关系及主题的发展阶段。战略坐标图是战略坐标分析的主要呈现方式,是一个二维坐标图,横坐标用向心度(Centrality)表示,纵坐标用密度(Density)表示。对于给定主题类簇,向心度表示该主题类簇与其他主题类簇之间联系的强弱,密度表示该主题类簇内部词与词之间联系的强弱[9],向心度与密度的计算方式[10]如下: 公式(1) 公式(2) 其中,D(k)是主题类簇k的密度,C(k)是主题类簇k的向心度,nk是主题类簇k的关键词个数,N是共词矩阵中所有关键词数目,cij表示关键词i和关键词j的共现频次。 根据每个类簇的向心度与密度值构建战略坐标图,以向心度为横坐标,密度为纵坐标,见图2。第一象限中的主题类簇有较强的密度和向心度,表明该研究主题与其他主题之间联系紧密且该主题内部的关联度均较强,是该领域较为核心且成熟的研究主题;第二象限中的主题密度较高、向心度较低,表明主题与主题之间的关联度较弱,但主题内部的关联度较强,是该领域较为边缘但研究成熟的主题;第三象限中的主题密度和向心度均较低,表明主题与主题之间的关联度较弱,但主题内部的关联度也较弱,是该领域较为边缘且研究不成熟的主题,可能是衰退型的研究主题,也可能是新兴研究主题;第四象限中的主题密度较低、向心度较高,表明主题内部的关联度较弱,但主题与主题之间的关联度较强,是该领域较为核心但研究不成熟的主题,具有较大的发展潜力[11-12]。 3 数据获取与分析

您可能关注的文档

文档评论(0)

龙源期刊 + 关注
官方认证
服务提供商

龙源期刊网创建于1998年,是中国领先的人文大众期刊数字发行平台。全文在线的综合性人文大众类期刊品种达到4200多种,优质版权文章数量超过2500万篇,内容涵盖时政、管理、财经、文学、艺术、哲学、历史、社会、科普、军事、教育、家庭、体育、休闲、健康、时尚、职场等全领域。

认证主体北京龙源网通电子商务有限公司
IP属地四川
统一社会信用代码/组织机构代码
91110113721412769J

1亿VIP精品文档

相关文档

相关课程推荐