截词检索(模糊检索)的特点

截词检索是指在检索式中用专门的符号(截词符号)表示检索词的某一部分,允许有一定的词形变化,在中文数据库中也称为模糊检索,其作用主要是提高查全率,主要应用于西文数字资源的检索。 截词符一般用“?”或“*”表示,按截词位置可分为前截词、后截词、中间截词和前后截词。

前截词又称左截词,后方一致,允许检索词前有若干变化。 例如,“*physics”就可检索到physics、astrophysics、biophysics、chemophysics、geophysics等词的结果。 “?Computer”可检索到computer、minicomputer、microcomputer等结果。

后截词又称右截词,前方一致,允许检索词尾有若干变化。 例如,“comput*”将检索出computer、computing、computerised、computerized、computerization等结果。

中间截词,又称前后方一致,允许检索词中间有若干变化。 例如,“wom*n”,检索到woman、women的结果。 英美的不同拼法,“defen*e”可同时检出defence和defense的结果。

前后截词:词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式。 例如,“?computer?”可检索到computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等结果。

(1)在使用截词符时,既要考虑到使用截词符以避免漏检,也要考虑到不恰当的使用会使查准率大大降低。 如截词的长度要适合,不能太短,否则会使检索结果过多。 一般对于英文单词来说,如“electro*”将检索出含有electron,electronic,electrostatic等的文献,如果写成“elec*”就可能检索出许多意思完全不相关的文献。

(2)在不同的数据库和联机检索系统中,所使用的截词符号没有统一的标准,有的用“?”,有的用“*”,有的用“#”,有的用“$”等。

(3)即便常用的“?”和“*”在不同的数据库中其用法也是不一定相同的。

声明:准根文档网所有作品(图片、文字)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系 saizw@outlook.com