关键词、主题词、自由词的区别及自由词检索的特点
关键词是文献中为了文献索引或检索而选取的、能够表达全文主题、具有实际意义的单词或短语。关键词包括主题词和自由词:主题词是从自然语言的主要词汇中选取的、经过规范化、用于文献索引或检索的单词或短语;自由词是尚未规范化、即尚未被纳入主题词表的单词或短语。
自由词不受词库限制,直接从文章标题、摘要、层级标题或文章内容中选取,能简洁、明确地反映文章的研究主题,是汉语词库中的上位词、下位词、替代词等非正式词库,以及词库中无法查到的词。自由词检索是指使用未经规范化的自然语言词语来检索信息,其特点是用户负担小、检索方便,但准确率较差。
2. 在文献检索中使用主题词和关键词有哪些优点和缺点?
主题词在文献检索中经常使用。主题词是从主题词表中的词汇中选取的,是标准化、受控的术语。主题词用于文献的标引和检索。标引有手工标引和计算机自动标引两种。美国数据库至今仍采用手工标引,标引质量很好。
主题词检索的主要问题是,一些重要的内容和主题概念没有被索引,缺失索引会影响文档检索的完整性;有些文档被错误地索引,错误索引会影响文档检索的完整性和准确性。
关键词是自由词,包括文本词、文献词和搜索者搜索时想到的词。关键词可以从作者关键词、参考文献关键词或搜索者自己选择的关键词中选择。
仅使用主题词或关键词并不容易找到所有相关文献,应将主题词和关键词相互配合使用,并不断调整检索词和检索策略,以获得最佳的检索结果。
你可以在主题词类别表中选取最合适的主题词,需要看清楚主题词的上下类别是什么,分清不同类别的主要概念。
3. 检索文献时使用主题词而不是自由词有哪些优势?
使用主题词虽然会使文献主题的语言表达有所不同,但可以将具有相同概念的文献聚集在一起。例如,检索“先天性心脏病”的文献时,使用自由词形式只能检索到有关先天性心脏病的文献,而先天性心脏缺陷、先天性心脏异常、异位心脏、心脏畸形等具有相同概念的文献很可能会被遗漏。
如果使用主题词“心脏病,先天性”,则可以检索出所有概念相同但词不同的文献,主题词命中的文献数量不仅准确,而且比自由词命中的文献数量多。例如,搜索“食管癌化疗”的文献,使用自由词“食管癌化疗”或“食管癌化疗”都很难找到文献。如果将主题词“食管肿瘤”和子主题词“药物治疗”结合起来进行搜索,则可以检索出所有与食管癌化疗相关的文献。
主题词组合可以表达复杂的概念,且关系明确。例如,使用自由词搜索“肝肿瘤肺转移”,很可能出现概念颠倒、概念分裂,难以区分哪个是原发性肿瘤,哪个是继发性肿瘤。使用主题词“肝肿瘤,病理”和“肺肿瘤,继发性”的组合来搜索文献,可以保证较高的召回率和准确率。
4.CNKI中“摘要”和“主题”检索字段有什么区别?
CNKI文章关键词检索是指在文章标题、关键词、摘要范围内进行检索。
主题检索是在CNKI收录的主题字段中进行检索,该字段的内容包含了一篇文章的全部主题特征。同时,在检索过程中嵌入了专业词典、主题词库、汉英词典、停用词表等工具,并使用关键词截断算法对低相关或微相关文献进行截断和排除。
5.主题词检索的加权和扩展是什么意思?
加权检索:在CBM的主题词检索中,“加权检索”是指只对文档主题词字段中带星号(*)的主题词(主概念主题词)进行检索。若不选择“加权检索”,则对带星号和不带星号的主题词(非主概念主题词)都进行检索。加权检索可以从主题的紧密相关度角度提高检索的准确率。
扩展搜索:同时搜索选定的主题词及其树结构上下位词。若选择不扩展搜索,则只搜索当前主题词。一个主题词可以属于几棵不同的树。例如,主题词“心律失常,心脏性质”有“主题树1”和“主题树2”(图4-8)。扩展搜索可以扩展所有树的上下位词。扩展搜索可以从概念类别的角度提高搜索的召回率。
系统默认设置是“无加权,扩展”。