信息检索心得
考试时间6月5日下午1点到2点半
我们班应该是在2202
笔试分70平时分30
卷面100分=选择40+名词解释+简答+论述
个人觉得,论述题应该只有一个
毕竟一个15分
简答题应该是有6、7个
名词解释历年来看大概4、5个一共10来分
平时分两次作业20分吧
理论课上机课两次点名应该每次5分
个人猜测,不一定准
这种小科内容很少
千万不要想着补考
希望今年我能为它的降低做一点微小的贡献
加上少许往届学霸的总结
还要感谢一位不愿透露姓名的学渣同志提供的资料~
一、文献
1、概念:记录有知识的一切载体
信息>知识>情报
2、类型
(1)按文献加工深度分
①一次文献
文献作者以本人的研究成果为基本素材撰写而成
包括期刊论文、技术报告、学位论文等
特点:创造性、新颖性、系统性
②二次文献
将量大、无序、分散的一次文献收集起来,进行加工、整理、简化和排序,形成检索一次文献线索的新的文献形式
包括大多数的检索工具
特点:浓缩性、汇集性、系统性、检索性
③三次文献
是综合一、二次文献,将有关内容进行系统整理,“浓缩”而成的新的文献形式。一般是在充分研究现有相关文献的基础上,综述已取得的进展或存在的问题,或加评论、分析,或预测发展趋势,可使读者不必大量阅读一次文献,就可了解当前的研究水平,动态,是属于经过高度智力加工的高层次信息产品
三次文献分为两类
?期刊文献型:期刊中的综述性文献
综述性文献:综合分析和描述一定时间内,某一学科或专业科研的现状、进展并预测未来的一类文献
常见表达形式:XX学科综述、现状、进展、述评、评论
?图书文献型:参考工具书,如辞典、指南、百科全书、年鉴、手册等
特点:信息含量高、综合性强、参考价值大
④零次文献
指未经情报加工直接记录在载体上的原始信息,是非出版型文献
包括实验数据记录、原始调查、观测记录资料、口头交流的信息等
特点:零散性、不成熟性、客观性
(2)按出版形式
①图书
?概念:一些记录的知识比较系统、成熟的文献。一般都有固定的装祯,并通过出版发行
?每一种正式出版的图书都有一个ISBN号(国际标准书号),具有检索唯一性
?医学书籍最常用的是:教科书、专科参考书、专著、系列丛书、工具书
②期刊
?概念:一种定期或不定期出版的连续出版物,有固定的名称、版式和编辑出版单位,有连续的年、卷、期号、出版日期,每期有多篇文章
?特点:内容专深新颖,出版周期短,传播面广,连续性强,能较快地反映科技发展的水平和动态,是科技人员最重视的一类资料
?连续性标识:期刊用卷(Volume, Vol.)和期(Number, No.或Issue)作连续出版的标识,对一定期限内(一般为一年)出版的期刊划分为一卷或几卷,每卷再分为若干期。卷号自创刊开始累计,期号在一卷内连续计数
ISSN(国际标准连续出版物编码):是国际上用于识别连续出版物的国际标准化编码系统,可用于查询特定的期刊
?核心期刊:刊载某学科文献数量大,被引用率和利用率较高,学术水平较高和实用性较强的部分学术期刊(布拉德福定律)
?四大检索系统 英文全称需要认识
①SCI《科学引文索引》(Science Citation Index)
③ISTP《科技会议录索引》 (Index to Scientific and Technical Proceedings)
检索应用加菲尔德定律
?学术期刊的评价指标
影响因子(IF)
定义:用某刊的被引用次数除以该刊刊载的论文数
是国际上通用的期刊评价指标
Ⅱ即时指数
又称即时指标或当年指标,是指期刊文献当年被引用的程度
就是当前一年的影响因子
用来表示某种期刊揭示科学上研究热点的快慢程度
?学术期刊的评价工具
中国:中文核心期刊样目总览,北京大学图书馆发布
分区:前5%、5~20%、21~50%、后50%
美国:Journal Citation Reports(期刊引用报告,JCR),ISI(美国科学情报研究所)发布
分区:前25%、25~50%、50~75%、后25%
③特种文献
?政府出版物
?科技报告
?专利文献
?会议文献
?学位论文
?标准文献
?产品资料
?广告
?技术档案与图纸
二、检索
1、检索三大方法(掌握科学前沿信息的方法)
①现刊浏览法
③检索工具法
【引文索引:依据文献之间的相互引证关系,收录编辑大量来源文献及其引文的检索工具称为引文索引(越查越新)】
2、检索与科研的关系
?了解问题的历史和现状,避免重复劳动
②实验阶段:解决具体问题
3、标引
对文献给予分类号标识的过程,称为分类标引
主题标引
是根据一定社会需要和为达到特定的信息交流目的而建立的一种有序化的信息资源集合体
用以报道、存储和查找相关信息的工具与设备
①美国医学索引IM
③美国化学文摘CA
⑤荷兰医学文摘EM
①定义:至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合
?书目数据库
?数值数据库
?多媒体数据库
③结构
?字段(Field):记录的下级数据单位,用来描述实体的某一属性?文档:数据库中一部分记录的集合,是数据库的下位词
从另一种意义上说,文档是数据库的结构
④顺排文档: 以文献记录作为信息存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档。又称主文档
倒排文档:把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档,又称辅助文档
7、检索途径
不同检索网站检索途径不同
自由词检索、主题词检索、分类检索、著者检索、引文检索、机构检索、期刊检索等
8、检索语言
根据检索的需要而创制的人工语言。又称标引语言、情报语言等
9、关键词法
直接采用文献作者所用的语词作标识,不加规范化处理,或者只作极少量的规范化处理,同时也不显示概念之间的关系,是在情报检索中直接采用自然语言的一种方法,是主题词法系统中的一种
关键词是在文献的篇名、章节标题、文摘、正文中出现的作者原用词
10、MeSH医学主题词表
MeSH全称:Medical Subject Headings
由NLM编制的用来标引PUBMED记录的词表
包括字顺表、树状结构表
①字顺表:反映主题词之间横向的关系
何时应用字顺表?
?所拟检索词不规范,可参考用代参照
?欲扩大检索范围,可参考相关参照
?字顺表中词的倒置处理,在一定情况下可提供族性检索的方便
?通过字顺表中主题词的树状结构号可以确定选词的准确性
②树状结构表:反映主题词间纵向的关系
何时应用?
?当科研选题为一个广义概念时
③副主题词表(83个副主题词)
副主题词的作用
?对主题词起着方面限定的作用
?扩大词汇量
常用副主题词
还有CT、内窥镜那个
CT/不组配副主题词
疾病/影像学诊断(diagnostic imaging)
组配:依合理的逻辑联系和确切的语义概念,将主题词与主题词、主题词和副主题词进行有限条件的组合
11、检索技术
①布尔检索
?AND:常用*来表示,要求AND所连接的检索词必须同时出现在一个记录中
?OR:常用+来表示,OR连接的检索词中有一个出现即为命中文献
?NOT:常用-来表示,要求包含NOT所连接的左边检索词而不包含其右检索词的文献为命中文献
②位置(邻近)检索
限定两词的位置(同一字段、同一句等)或相隔词数
把检索词截断,取其中的一部分片段,再加上截词符号一起输入检索,系统按照词的片段与数据库里的索引词对比匹配,凡是包含这些词的片段的文献均被检索出来
④扩展检索
系统基于词表,自动或半自动地对多个检索词执行逻辑或(OR)的检索
作用是提高查全率
⑤加权检索
侧重判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度
运用加权检索可以命中核心概念文献,因此它是一种缩小检索范围提高检准率的有效方法
12、四个检索步骤
①分析拟检课题,明确检索要求
③选择检索途径,确定检索策略表达式
三、PUBMED
1、美国国立医学图书馆(NLM)下属的美国生物技术信息中心(NCBI)开发
MEDLINE:1966年以来
OLDMEDLINE:1946~1965
PREMEDLINE:MEDLINE的中尚未经规范处理的数据
Records supplied by publisher:由出版商提供的电子文献
不能检索被引情况
2、检索机制
对于输入检索框中的检索词,将按一定的词表顺序进行对照,然后进行检索。如果在各个表中都找不到相匹配的词,PubMed将把短语分开,以单词为单位,分别重复以上的过程,检索时各个词之间是逻辑与(AND)关系。如果仍找不到相匹配的词,则用单个词在所有字段查找,各个词之间也是逻辑与(AND)关系
3、主要字段
AD:第一著者的单位、地址
AU:著者
DP:出版日期
IS:ISSN号
MH:MeSH词
PT:文献类型
SH:MeSH副主题词
TA:刊名缩写
TI:篇名
SO:文献出处
AB:文献摘要
4、检索途径
①基本检索(Search)
③期刊检索(Journal)
Citation Matcher)
?单一文献查找(Single Citation Matcher)
⑤临床查询(Clinical Queries)
四、CBM
1、基本信息
中国生物医学文献数据库(CBM)
1978至今
2、检索途径
①快速检索
③主题检索
⑤期刊检索
⑦机构检索
⑨引文检索
五、CNKI
1915至今的中文文献
检索途径
①快速检索
②高级检索
③文献分类目录检索
④专业检索
⑤期刊导航
六、搜索引擎
1、概念
以人工或网络机器人软件的方法采集、标引Web资源和其他类型的网络资源,并将索引信息内容存储于大型数据库中,以Web网站的方式提供给网络用户查询的信息服务系统
2、类型及特点
①索引式搜索引擎
特点:
?交互性强
?提供二次检索,允许在查询结果中进一步限定,从而缩小检索结果范围,提高查准率
②目录式搜索引擎
特点:
?比较适合主题浏览、一般主题检索或为用户检索提供有价值的提示,而且通过这种体系分类来归整资源,体现了知识概念的系统性,有利于族性检索。
?查全率有限。信息涵盖量不大,更新能力有限是这类检索引擎的一个弊端。
③元搜索引擎
特点
?查全率大大提高,但查准率更难保障;
?运作机制有别于目录式和索引式;
下面是一些历年的重点题
老师给的重点里没有,难道那是七年制的重点?
1、提高查全率的方法
①用“OR”扩检
②用各种形式的自由词检索(同义词、近义词、全称、错别字、上/下位词等)
③由精确检索转为模糊检索
④适当放宽限定条件
⑤调整字段(全文>摘要>关键词)
⑥使用多库检索
⑦主题词检索
?使用全部的副主题词组配
?使用上位词
?选用多个相关的主题词
?利用词表的扩展树
2、提高查准率的方法
①用运算符(AND、NOT、NEAR、WITH等)限定检索
②增加主题概念面、加词检索;选择下属概念
③词组检索,利用双引号
④条件限定检索:使用出版年,文献类型,语种等
⑤设定子集或子库
⑥字段限定检索:(关键词>摘要>全文)
⑦主题词检索
?与副主题词组配
?使用下位词检索
?加权检索
?不扩展
?与自由词联合检索
3、如何提高全文库的检索效率
①选词方式(检索词处理方式)
提高查全率,则用各种形式自由词检索等
提高查准率,则增加主题概念面,加词检索,选下属概念等
②检索字段的选择
提高查全率,则全文>摘要>关键词
提高查准率,则关键词>摘要>全文
③逻辑算符等检索技术的应用
提高查全率,则使用OR、截词检索,模糊检索,减少次要主题等
提高查准率,则使用AND、NOT、词组检索等
④检索知识、专业知识的灵活应用
⑤规范化的检索语言
4、选题过程中检索的一般原则
①先近后远
②先内后外
③先专业后广泛
④先综述后论述
⑤先文摘后全文
5、综述性文献的作用
①节省阅读文献的精力和时间,短时间内了解某方面的样貌和发展趋势
②对选题、定题、开题有重要意义
③综述的写作能提高归纳分析综合能力,有利于独立工作能力和科研能力的提升
6、信息检索:是根据用户的需求,利用检索工具或检索系统,查找出符合用户需要的信息的过程
原理
7、获得主题词的方法
①专业知识法
②拆词浏览法
③树状结构法(利用主题词表)
④高级检索法(利用主题词字段)
8、没有专指主题词时
①选用上位词
②结合自由词(尽量查全自由词)
③直接快速检索或高级检索
9、主题标引的作用:提高查全率、查准率
(1)主题标引能提高查准率的原因
①确定主题词时,只有文献中的重点内容才能成为主题词
②可加副主题词,对主题词进行限制
(2)主题标引能提高查全率的原因
主题标引过程中,不同形式的概念被标注为同一个主题词,因此在使用该主题词进行检索时,可以查到此概念的不同表达形式,从而扩大检索范围
老师的两次作业
检索思路还要再看一下
可能(一定?)在里面出论述题
论述题一定多写一点
方便老师给分
现在最慌的就是选择题。。
完全不知道难度和类型。。
只能靠大家平时的积累
还有我现在资料看多了有种抓不住重点的错觉
老师不会是在骗我们吧
为啥资料上面的题好多都不在老师划的内容里
希望大家能够不依靠这篇总结
自己再去看一些自己认为重要的东西
万一出题老师再搞点什么幺蛾子
我。。我负不起这个泽任呦
祝大家考试顺利!