信息检索第二篇.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.1 信息检索基本概念 2.1.1 什么是信息检索? 信息检索(Information Storage and Retrieval): 是指将信息按一定的方式组织和存储(Storage)起来,并根据信息用户的需要找出(Retrieval)相关信息的过程。 信息检索是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法和过程。完整的信息检索含义包括信息的存储和检索,由此可知,信息检索的全过程应包括信息标引和存储过程及信息的需求分析和检索过程两个主要方面。 2.1.2 信息检索的意义与作用 1.充分利用信息资源,避免重复劳动 2.为人们更新知识,实现终生学习提供门径。 2.1.3 信息检索的类型与特点 按信息检索的目的和对象,可分为: 文献(document)检索 数据(data) 检索 事实(fact) 检索 按信息检索的技术手段可分为: 手工检索 计算机检索 网络信息检索 信息检索的类型 根据检索的内容和查找的对象划分 (1)数据信息检索 (2)事实信息检索 (3)文献信息检索(书目信息检索、全文信息检索) (1) 数据检索(Data Retrieval)——确定性检索 以数值或图表形式表示的数据为检索对象的信息检索,又称数值检索。是利用参考工具书、数据库等找出包含在信息中的某一数字数据(电话号码、银行帐号、各种统计数据、参数等)和市场行情、图表、公式、化学分子式等非数字数据的检索。 典型的提问式:锑的原子量是多少 (121.75) 检索结果回答用户提出的问题。 (2)事实检索(Fact Retrieval) ——确定性检索 以文献中抽取的事项为检索内容的信息检索,又称事项检索。它是利用参考工具书、数据库等从存储事实的信息系统中查找出指定事实的一种信息检索,包括某一事物或事件的性质、定义、原理以及发生的时间、地点、过程等。如:某事实发生的时间,地点或过程等.侧重于检索对象的质的方面. 典型的提问式:中国辛亥革命是哪一年发生的? (1911) 是信息检索中比较复杂的一种,一般不能直接回答用户的具体问题,必须进行分析、推理后才能得出结果。 (3)文献检索(Document Retriveal)——相关性检索 以文献为对象的信息检索,利用相应的检索方式与手段,在存储文献的检索工具或数据库中,查找检索用户口所需文献的过程。凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏地等,都属于文献检索的范畴。文献检索又分书目检索(目录、题录、文摘)和全文检索。 典型的提问式:有关于“如何平衡人际关系”的书吗? 我到哪里可以找到 ?关于汽车排放废气造成公害的情况有哪些文献报道 ? 文献检索是信息检索的核心部分,它与数据检索和事实检索比较内容更为丰富,方法更为多样。它是一种相关性的检索,带有很大的不确定性,是使用最广,效果最大,最重要的一种。 所用检索工具之不同 数据检索:更多的利用参考性工具书(包括百科全书,年鉴,手册,图表,图谱等等)和有关学术专著; 事实检索:主要利用参考性工具书和有关学术专著; 文献检索:利用检索检索性工具书(如目录,索引,文摘等)和计算机检索系统. 2.2 信息检索原理 从原理上讲,我们可以把整个信息检索过程刻画为三个方面:即信息的存储与组织、信息的检索实施、信息的展示。其中的关系如下图所示: 2.2.1信息检索效率 查全率(Recall Ratio, 简称R) 查全率(R)= 检出相关信息数量(w)/系统中相关信息总量(x) R=w/x×100% 查准率(Precision Ratio, 简称P) 查准率(P)= 检出相关信息数量(w)/检出信息总量(m) P=w/m ×100% 查全率与查准率之间是互逆相关的,即任何提 高查全率的措施会导致查准率下降,反之亦然。 2.2.1信息检索效率 专家们认为查全率和查准率处于最佳比例关系时,查全率大致在60%—70%,而查准率大致在40%—50%,一旦查全率超过70%时,要想提高查全率,就必须以牺牲查准率为前提。 例如,要利用某个检索系统查某课题。假设在该系统文献库中共有相关文献为1500篇,而检索出来2000篇,其中相关文献1000篇,那么查全率、查准率是多少? 2.2.2 信息检索系统的类型 信息检索系统(Information Retrieval System,IRS):是根据一定社会需求和为达到特定的信息交流目的而建立的一种有序化的信息资源集合体。通常拥有选择、整理、加工、存储、检索信息的设备与方法、并能向用户提供信息服务。 2.2.2 信息检索系统类型 1.信息检索系统分类: 手工检索系统:以印刷型检索工具为主体,读者手

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档