《信息资源检索与利用》课程要点
1.信息资源
信息是普遍存在的,但并非所有的信息都是信息资源,信息只有经过人类加工后,可被利用的信息才能称为信息资源。
2.信息资源的分类
按信息资源的存在状态可将其分为潜在的信息资源和现实的信息资源两大类。其中现实的信息资源依据其载体可分为体载信息资源、文献信息资源、实物信息资源和网络信息资源。
(1)体载信息资源
体载信息资源指以人体为载体并能为他人识别的信息资源,按其表达方式又可分为口语信息资源和体语信息资源。口语信息资源是人类以口头语言表达出来但未被记录下来的信息资源,如谈话、授课、讲演、讨论等;体语信息资源是以人的体态表达出来的信息资源,如表情、手势、姿态、舞蹈等。
(2)文献信息资源:文献信息资源是以文献为载体的信息资源。
A.按信息资源出版类型划分(10大信息源)
①科技图书;②科技期刊;③科技报告;④会议文献;⑤专利文献;⑥学位论文;⑦标准文献;⑧出版物;⑨产品样本;⑩技术档案
word . .
. .
B.按加工层次划分
①一次信息资源。一次信息的载体形式称为一次信息资源,也称原始文献。它是以作者本人的科研工作成果为依据而创作的原始文献,如期刊论文、科技报告、会议论文、专利文献、学位论文等,它具有新颖性、创造性和系统性等特征,参考和使用的价值较高。
个人专著(某某著书,而某某编的书不是一次文献而是二次或三次文献)。
②二次信息资源。浓缩二次信息的载体形式称为二次信息资源,是查找一次信息资源的工具。它是将分散的、无序的一次信息资源进行加工整理,使之成为系统有序的信息资源。二次信息资源具有浓缩性、汇集性、有序性等特点,它的作用不仅在于报道信息的内容,更重要的是可以提供原一次信息资源的线索。 例如:书目(marc数据)、题录、文摘、索引等。 (图书馆检索室)
③三次信息资源。三次信息的载体形式称为三次信息资源,它是指对一次信息资源进行综合分析、研究和评述而编写出来的成果。如手册、百科全书、年鉴以及其他综述和评论性文章等。三次信息资源源于一次信息资源,又高于一次信息,是一种再创性文献。
它可分为两大类:一类是综述、述评等,如各种综述、动态、进展报告;另一类是参考性工具书,如百科全书、年鉴、手册、词典、文献指南等
④零次信息资源。零次信息的载体形式称为零次信息资源。它是指未经正式出版发行的最原始的记录,如书信、手稿、笔记、实验记录等。其主要特点是内容新颖,具有原始性,但不成熟,分散,难于检索。 如书信、手稿、笔记、记录等。也有人认为是科技人员口头交谈及直接作用于人的感觉器官的非文献知识,如操作技能、诊疗经验等。也可以说,
word . .
. .
零次文献是以文献所有者本身为载体的未公布于世的科技知识。
以上四级信息资源的关系是,零次信息资源是一次信息资源的素材;一次信息资源是二次、三次信息资源的来源和基础;二次、三次信息资源是对一次信息资源进行组织、加工、综合后形成的,它们编写的目的明确,专指性强。
(3)实物信息资源
实物信息资源是指以实物为载体的信息资源。
(4)网络信息资源
网络信息资源是指从计算机、通信技术、多媒体技术相互融合而形成的网络上可查找到的资源。网上可利用的信息资源是多种多样的,从网络信息管理和利用的角度出发,人们对已存在于网络中的信息资源进行了类型化和系统化研究,不同的角度有不同的分类形式,一般有以下几种:
① 按信息表现形式分有电子出版物和非电子出版物信息资源。
② 按信息的媒体形式分本为文本信息资源、超文本信息资源、多媒体信息资源和超媒体信息资源。
③ 按网络信息资源加工层次,可以分为网络资源指南和搜索引擎,联机馆藏目录、数据库信息资源、电子出版物、网上参考工具和其它动态信息。
④ 按照用户采用的不同的网络协议来划分,可以分为基于超文本传输协议(HTTP)
word . .
. .
的信息资源、基于文件传输协议(FTP)的信息资源、基于远程登录(TELNET)的信息资源、新闻组(Usenet/Newsgroups)资源和电子邮件(E-mail)信息资源。
此外随着web2.0的发展信息资源也便及整个web2.0中,如博客,百科,维基,播客等等。
3.信息资源检索
信息资源检索是从信息资源集合中找出所需信息内容的过程。从广义上讲,信息资源检索包括两个过程,一是信息资源的存储(Information Storage),所谓存储是对有关信息进行选择,并对信息特征进行著录、标引和组织,建立信息数据库的过程;二是信息资源的检索(Information Retrieval),所谓检索是根据检索提问制定检索策略,利用信息数据库查找信息资源的过程。从狭义上讲,信息资源检索仅指后一部分。
4.信息资源检索的分类
(1)按信息资源检索结果的内容划分
①信息检索。信息检索按照其信息系统、内容及结果可分为以下两种类型:
信息线索检索。利用书目、文摘和书目型数据库等检索系统,检索的结果只是提供
了信息线索。
信息的全文检索。这种检索以查找到信息全文为目的,检索的结果是找到全文信息。
word . .
. .
②数据检索。数据检索是指从检索系统存储的数据中查出用户所需数据的检索,如科技数据、金融数据、人口统计数据等。
③事实检索。事实检索是指对特定的事件或事实的检索,包括事物的性质、定义、原理及发生的地点、时间、前因后果等。
(2)按信息资源检索技术划分
①全文文本检索。全文文本检索也称全文数据库检索,它通过计算机将文件的全貌,包括文字、图形和图像等信息转换成计算机可读形式,直接采用自然语言来设置检索入口,检索时以文中任意信息单元作为检索点,计算机自动进行高速比照,完成检索过程。
②多媒体检索。多媒体检索是指能够支持两种以上媒体的数据库检索。
③超文本检索。超文本检索是指超文本(hypertext)的内容排列是非线性的,它按知识(信息)单元及其关系建立起知识结构网络,如具有图形的信息又称超媒体(hypermedia),超文本(媒体)的检索是通过超文本(媒体)(hyperlink)来实现的。
④网络信息资源检索。网络信息资源检索是一种集合各种新型检索技术于一体,能够对各种类型、各种媒体的信息进行跨时间、跨地理检索的大系统。
5.信息资源检索系统
检索系统是用于报道、存储与查找信息的工具。检索系统的实质是将描述特定用户所需信息的提问特征与信息存储的检索标识进行异同比较,从中找出与提问特征一致或基本一致的信息。检索系统应包括以下两个主要的方面:
word . .
. .
(1)信息标引和存储过程。对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程。
(2)信息的需求分析和检索过程。分析用户的信息需求,利用已组织好的检索系统所提供的方法与途径检索有关信息,即检索系统的应用过程。
6.数据库及数据库类型
(1)数据库的定义。根据 ISO/DIS 5127 号标准,数据库(Database)的定义为:至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
(2)数据库类型。按照国际上通用的分类方法,数据库通常可划分为以下几个类型:
① 参考数据库(Reference Database)。参考数据库是指用户在这些数据库中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库。它包括书目数据库和指南数据库。
书目数据库(Bibliographic Database):它是存储某个学科领域二次信息资源的数据库,其显著特征是向用户提供信息线索,只能检索出信息的标题、出处、著者、主题等。例如,《EI Village 2》、《美国化学文摘数据库》、《中文科技期刊篇名数据库》等。
指南数据库(Directory Database):它是存储能够提供用户参考、给予用户指南的各类信息,如商业、企业等机构的名称、地址、,人物,出版物,项目,程序,活动等简要描述性信息的一类数据库,亦称指示性数据库。例如,公司名录数据库、人物传记数据库、
word . .
. .
技术标准数据库等均属此类。
② 源数据库(Source Database)。此类数据库在欧洲也称数据银行(Data Bank)。它是能够直接为用户提供原始资料或具体数据的一类数据库。
7.信息资源的检索方法
直接检索:指通过直接浏览或阅读原始文献获取所需信息的方法。通过它可以直接查找一次信息资源和三次信息资源。
间接检索:指借助检索工具或检索系统查得文献线索再获取原始文献的方法称为间接检索。它是文献检索常用的检索方法。
8.检索策略
广义地说,检索策略(Retrieval Strategy)是为实现检索目标而制定的全盘计划或方案,包括课题分析、检索系统选择、确定检索词及其相互间的逻辑关系、检索式的制定、调整检索方案等。狭义地说,检索策略是指填写的“检索提问单”。在计算机检索中,策略问题是明确提出来的,必须慎重考虑的,因为它可能要完成的是一个比较复杂、精细的检索课题,又是在人与机器的交互、对话中实现的。手检的策略考虑较少,因为比较简单,方案研究的余地不多。
9.课题检索步骤
分析研究课题(明确检索目的和要求)→选择检索工具和检索方法→选择检索途径和检索标志→查找文献线索→整理检索结果→索取原文。
word . .
. .
(1)课题分析
分析检索课题的目的是使用户搞清楚其课题要解决的实质问题,即它所包含的概念和具体要求以及它们之间的关系。这是制定检索策略的根本出发点,也是检索效率高低或成败的关键。课题分析需要明确以下具体问题:
①研究课题的主题、课题所涉及的学科范围、课题所需信息内容及其内容特征。
②课题所需信息的类型,包括文献信息载体、出版类型、所需文献量、年代范围、涉及的语种、有关著者、机构等。
③课题对查新、查准、查全的指标要求。
(2)检索系统或检索工具的选择
一个计算机检索系统通常可以提供多个可检索数据库,一个手工检索系统就是一种检索工具。选择检索工具和检索系统时,要考虑的主要问题是:
①从内容上和时间上,考虑检索工具和数据库对课题的覆盖和一致性,比如应综合考虑选择专业性强、收录范围广、检索途径多、编制质量高、使用方便的检索工具或数据库。
②在手段和技术上,有机检条件的一般就不选择手检工具,机检无疑有较高的效率。
③考虑价格和可获得性,选择手头容易获得的检索系统,注意数据库的价格,权衡价格效益比。
word . .
. .
(3)检索途径
不同的检索入口,有相应的检索路径(approach),称作检索途径。手检工具只提供比较常用的检索途径,如分类途径、主题途径、著者途径、号码途径、引文途径等;在计算机检索系统中,检索点很多,几乎文献的每一个特征都可作为检索点,并且可以实现全文检索。
(4)检索式的制定
依据检索词之间的逻辑关系,用检索系统识别的符号将检索词连接起来,反映研究内容、表达研究者意图的式子。
在手检系统中,每次检索只能从一个检索点出发,而且只能选择其中的一个属性值,比如主题检索,只能从某个概念出发,检索范围比较宽。
机检时利用检索式(各种途径结合)可以有效地控制检索范围。
(5)原文索取
用户无论是利用手工检索系统还是计算机检索系统,信息资源检索的目的都是找到适合的信息资源。这是检索过程的终结,也是进行信息资源检索的最终目的。原文获取主要有以下几种方法
①先电子后印刷,数字化出版特一般更新快、出版快,查询输出非常方便。
②先近后远,可以先查所在图书馆的馆藏,如果没有,可以利用联合目录数据库,查
word . .
. .
看附近的图书馆或其它信息机构是否有收藏。
③利用馆际互借及原文传递服务,许多图书馆设有此项服务,难以获取的外文文献可以向国外的图书馆和文献提供机构求助。
馆际互借ILL(Inter Library Loan)是指馆与馆间的图书资料借阅合作,是图书馆开放服务(Open Service)的一个重要方面。原始的办法是靠人去其他合作馆借还原件或取回复印件,这可由个人也可委托图书馆服务部门来完成。
文献传递DD(Document Delivery)是指利用各种通信手段、从各种文献服务中心获取文献信息的有效手段。其服务模式多样,比如:邮递(Mail)、快递(Express Mail)、电传(Telex)、传真(Fax)及电子邮件(E-mail)等。文献传递的电子化、网络化使传送的信息量更大,内容更丰富,使传送的速度更快捷,手续更简单,使用户获得文献信息的渠道更畅通。
④网络环境下的资源共享
目前基于互联网进行的全文服务大致可以分为两种类型:全文链接服务和原文传递服务。
全文链接服务(Link to Full Text)。用户在数据库中找到一篇适用的文献,系统在界面上提供了一个全文链接按钮,帮助用户直接链接到其他数据库或其他系统中的原文文献,称为全文链接服务。这种链接是通过系统与系统之间的协议或接口、数据库和数据库之间内容的整合实现的,是直接链接到具体文献(Title to Title),而不是超链接(Hyperlink),后者仅仅链接到期刊刊名或数据库一层,用户还必须再次检索。
word . .
. .
原文传递服务(Document Delievrey)。即二次文献数据库具备网上检索和发送原文传递请求的功能,用户检索到所需文献后,单击“原文传递”按钮,将索要全文的请求直接发送给数据库提供商,提供商或提供商委托的文献提供单位为用户提供原文传递服务。
目前有这项服务的国内数据库主要有:CALIS联合目录数据库和国家科技图书文献中心外文期刊目次库。
10.检索方式
(1)浏览检索
浏览检索,它是人工检索语言的应用与延伸,即由系统提供一个树状结构的概念等级体系,用户可以沿着这颗“树”进入不同的分支,到达叶子节点,并在节点看到检索结果列表。它的作用就是为用户提供一个知识体系,让用户可以俯瞰全貌,了解某一个方面的信息总体情况。如主题浏览、分类浏览、文献类型浏览、学科导航等等。
(2)简单检索
简单检索又称为基本检索、快速检索,即为用户提供一个简单的检索界面,帮助非专业事初入门用户方便地提交检索式。页面上通常只有一个检索框,用户提交检索式后,系统将提问发送到默认的一个或几个标引字段中进行匹配运算,检索出结果。
(3)高级检索
高级检索也称复杂检索、指南检索、专家检索,它是为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细致的检索式,帮助用户进行精确检索。命令检索就属
word . .
. .
于高级检索的一种。
命令检索通常用于联机检索系统,通过命令方式实施检索。检索式由若干检索词组配形成。这些检索词的扩展、限定的字段,它们之间的逻辑关系、位置关系等均可由算符的连接来表示。尽管不同的联机系统由各自定义的算符表示,命令形式不尽相同,但都有许多一致的检索功能。以下用国际上比较成熟的美国 Dialog 联机检索系统的命令方式为例来讨论命令检索基础。
(4)索引检索
索引是一个线性的表单,可以将任何一个标引字段中的概念按字母顺序线性排列起来,不分等级。用户通过检索,可以定位在索引中的任意某个位置,并浏览在这个位置附近的所有词语,进而查询所需词语对应的结果列表。索引的种类很多,如人名索引、出版物索相、地名索引、主题索引、机构索引等等。
(5)超文本检索
超文本检索是指超文本(hypertext)的内容排列是非线性的,它按知识(信息)单元及其关系建立起知识结构网络,如具有图形的信息又称超媒体(hypermedia),超文本(媒体)的检索是通过超文本(媒体)(hyperlink)来实现的。
11.评价指标
检索效果(Retrieval Effectiveness)是指信息资源检索系统检索信息资源的有效程度,反映信息资源检索系统的能力。克兰弗登(Cranfield)在分析用户基本要求的基础上,提
word . .
. .
出了 6 项评价系统性能的指标,包括收录范围、查全率、查准率、响应时间、用户负担及输出形式。
(1)查全率(recall ratio)
指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。用字母R表示。
R=检出的相关文献量 / 检索系统中相关文献量
(2)查准率(precision ratio)
指检出文献中合乎需要的文献数量占检出文献全部数量的比例。用字母P表示。
P=检出的相关文献量 / 检出的文献总量
一系列的试验结果表明,查全率和查准率之间存在互逆关系,如果对检索系统要求较高的查全率,则查准率必然下降,反之亦然。
12.检索匹配方式
(1)精确匹配:输入的检索词与检索结果完全一致,如检索词“ABC”,检索结果也为:“ABC”
(2)前项匹配:输入的检索词在检索结果的最前面,其余部分没有。如检索词“ABC”,检索结果为:“ABC×××”
word . .
. .
(3)后项匹配:输入的检索词在检索结果的最后面,其余部分没有。如检索词“ABC”,检索结果为:“×××ABC”
(4)模糊匹配:输入的检索词在检索结果的任意部分。如检索词“ABC”,检索结果可以为“ABC”、“ABC×××”、“×××ABC”或者“×××ABC×××”
13.参考数据库
参考数据库(reference database)是指包含各种数据、信息或知识的原始来源和属性的数据库。数据库中的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。一般说来,参考数据库主要是针对印刷型出版物而开发的。
参考数据库主要包括:书目数据库、文摘数据库、索引数据库。书目数据库主要是针对图书进行内容及存储地址的报道与提示,如各图书馆馆的馆藏目录;文摘和索引数据库则相对期刊论文、会议论文、专利文献、学位论文等进行内容和属性的认识与加工,它提供确定的文献来源信息,供人们查阅和检索,但一般不提供原始文献的馆藏信息。
14.四大检索工具:
美国《工程索引》(the Engineering Index,EI)。
美国《科学引文索引》(Science Citation Index,SCI)。
美国《科技会议录索引》(Index to Scientific & Technical Proceedings,简称ISTP)。
美国《科学评论索引》(ISR-Index to Scientific Reviews)
word . .
. .
国家科技部下属的“中国科学技术信息研究所”从 1987 年起,每年以国外四大检索工具 SCI 、ISTP 、Ei、ISR 为数据源进行学术排行。由于 ISR(《科学评论索引》) 收录的论文与 SCI 有较多重复,且收录我国的论文偏少,因此1993年起不再把 ISR 作为论文的统计源。而其中的 SCI(科学引文索引 )、EI(工程索引 )、ISTP(科技会议录索引 ) 就是我们常说的国外三大检索工具,是国际公认的进行科学统计与科学评价的主要检索工具,其中以SCI最为重要。
15.外文参考数据库常见检索结果实例(分清各部分的表示含义)
(1)EI (the Engineering Index)
①光盘版与网络版的区别,是否有主题标引和分类标引。
②EI详细记录中,各部分的含义。
(2)SPE(石油工程师协会Society of Petroleum Engineers)会议论文
SPE的具体应用,记录中各部分的含义。
16.常用搜索引擎检索技巧
(1)检索指定格式的文档。“filetype:doc 检索词”
(2)检索在网页标题中含有检索词的网页。“intitle: 检索词”
(3)在google同义词的搜索。“~检索词”
word . .
. .
(4)在google定义的搜索。“define: 奥运会”
(5)搜索与该网页存在链接的网页。“link:.xsyu.edu.cn”
17.了解图书馆借书的整个过程
(1)检索——选书——记索取号和藏书地点——到藏书地点找书——到借阅台借书
(2)检索时如果没有找到图书,可以通别网络检索别的学校的馆藏资源,然后利用馆际互借证或者通过该学校的朋友进行借阅,此外还可以考虑文献传递服务。
word . .
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- sarr.cn 版权所有 赣ICP备2024042794号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务