第四章检索式编制

指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。

主要逻辑算符

布尔逻辑算符:与或非

优先算符

邻接算符

字段算符

截词算符

加权算符

词组或短语

如何构建合理的检索式?

常用检索方法与策略【补充教材2.4-4章】

【主要内容】

1、检索式和运算符

检索式:用运算符将检索词连接起来构成的能让计算机识别的式子。

运算符:又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可缺的构件。

2、布尔逻辑算符

1)逻辑“与”

逻辑“与”可用“AND”或“*”表示,检索词用“AND”或“*”相连,含义是检出的记录中同时含有所有检索词。逻辑“与”运算符的基本作用是对检索词加以限定,逐步缩小检索范围,减少命中文献量,提高检索结果的查准率,适用于不同概念组面之间以及同一组面内不同含义的词之间的组配。

2)逻辑“或”

逻辑“或”可用“OR”或“+”表示,检索词用“OR”或“+”相连,含义是检出的记录中,至少含有检索词中的一个。

逻辑“或”算符的基本作用是扩大检索范围,增加命中文献量,防止漏检,提高检索结果的查全率。适用于同义词或同族概念的组配,如同义词、近义词等。

3)逻辑“非”

逻辑“非”可用“NOT”或“-”表示,检索词用“NOT”或“-”相连,表示排除“NOT”或“-”算符后的词语,检出含有算符前检索词的所有记录。

逻辑“非”算符的基本作用是缩小检索范围,减少文献输出量的作用,但不一定能提高文献命中的准确率。同时应注意在有两个以上运算符的复杂逻辑式中,“NOT”出现次数不能太多,否则检出结果极少,影响检出效果。

使用布尔检索需要注意问题:

(1)布尔检索执行顺序:

布尔检索运算执行顺序通常是NOT、AND、OR。有括号时,先执行括号内的逻辑运算。有多层括号时,先执行最内层括号中的运算。

(2)绝大部分网络信息检索工具都支持布尔检索功能,但不同的检索工具之间有差别。

第一,不同的检索工具表示布尔逻辑关系时使用的符号不同,有的用“&”、“︳”和“!”分别表示布尔关系的AND、OR和NOT,有的用+、-分别表示布尔关系的AND、OR,有的则用表格、文字、空格或菜单来体现不同的布尔关系。使用的时候要注意使用帮助系统了解代表某种逻辑关系的符号。

第二,有的检索工具检索词之间默认关系为AND,有的检索工具检索词之间默认关系为OR。

第三,支持布尔逻辑的程度不同,有的完全支持三种运算,如Infoseek;有的仅在高级检索中完全支持,而简单检索中则部分支持,如Lycos;而Yahoo则不支持布尔关系NOT。

3、优先处理算符

优先处理算符用“()”表示,含义是优先对()内的算符进行逻辑运算,在实际检索中,有时要调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配,或者是简化逻辑算式,在这些情况下,将使用算符“()”。

4、邻接算符

邻接算符又称词位置逻辑检索符、全文查找逻辑算符,相邻度检索算符,原文检索符。

在检索中,会遇到如下一些情况:

某个概念需用词组形式表达;

两个或两个以上的词要紧密相邻;

在这些情况下,需要用邻接算符限定检索词之间的间隔距离或是词语出现的顺序。

1)(W)

W的含义是“With”,其用法为A(W)B,表示(W)前后所连接的A、B两个检索词在检出结果中必须紧密相邻,且词序不能颠倒。

2)(nW)

W的含义是“Word”,n代表单词个数,用法为A(nW)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,同时A、B两词的前后顺序保持不变。

3)(N)

N的含义是“Near”,用法为A(N)B,表示在检出结果中A、B两词必须紧密相邻,并允许词序发生颠倒。

4)(nN)

N的含义仍是“Near”,用法为A(nN)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,两词的前后顺序可以颠倒。

5、(X),这是无间隔有序检索符。检索式为A(X)B,表示这个算符两边的检索词必须完全一致,并以指定的顺序相邻,中间不允许插入任何单词或字母。

6、(nX),这是有间隔有序检索符。检索式为A(nX)B,表示两个检索词之间最多可以插入n个单元词,两边的检索词必须完全一致。

5、字段限制

在联机数据库或光盘数据库检索系统中,都提供字段限制的检索功能,其作用是检索范围限定在某一字段内如题目、作者等。以DIALOG检索系统,基本字段限制为四个:题目(TI)、叙词(DE)、标引词(ID)、文摘(AB)。

例8:检索式COMPUTER/TI

表示在题目中查找含有COMPUTER一词的文献。

除了基本字段以外,检索系统中的其它字段都可称为辅助字段,其表达方式与基本字段有所不同,它是在检索词前面加上字段代码和运算符“=”,

例9:检索式CS=BEIJINGUNIBERSITY

表示检索著者单位为北京大学的所有文献。

网络检索的字段限制

字段“site:”表示检索应该在一定的站点上进行,

“url:”表示检索词应该是网址的一部分,

“title:”表示检索词应在网页标题中出现,

“alt:”表示检索词应在图像替代文字中。

在搜索引擎Google的检索框键入link:可以得到所有链接到Google主页的网页。

6、截词算法

截词检索是利用检索词的词干或不完整的词形查找信息的一种检索方法。

用户可以在检索式中用截词符号(如“*”、“?”或“$”等等)表示检索词的某一部分允许有一定的词形变化,而不必输入完整的检索词。

检索时,检索工具将用户输入的检索式到数据库中进行查找,凡是与检索式相匹配的字符,不论其后或其前是什么字符都属命中内容。

截词检索可以降低输入次数,简化检索程序,扩大检索范围,提高查全率。

一般情况下,“?”代表一个字符,而“﹡”表示通配所有字符。

1)按截断的字符数量划分

截词检索可以分为有限截词和无限截词。

有限截词,又称有限截断,指对词干以外可以出现的字母数量进行限定。如:studen,截词符“”表示检索含有studen和studen后只跟有两个字母的检

索词的文献。

无限截词,又称无限截断,指对词干前后出现的字母数量不作限定,一切与输入的词干相匹配的字符串,不论词干后或词干前是什么字符串、有多少字

符串都属于要检索的信息。

2)按截断的位置划分

截词检索可以分为前截词、后截词、前后截词和中间截词。

前截词,又称左截词,前截断

允许检索词的前端有一定形式的变化。检索时将截词符放在一个字符串的左方,表示其右的有限或无限个字符不影响该字符串的检索。这实际上是一种

后方一致的检索,对汉语中的复合词组的检索非常方便。

后截词,又称右截词,后截断

允许检索词的尾部有若干形式的变化。检索时将截词符号放在一个字符串的右方,凡是有截词符左方所有字符串的文献都符合检索要求。这实际上是一

THE END
1.python二级考试3, 4, 5, 5, 5, 6, 9]# 定义列表numbers=[3,1,4,1,5,9,2,6,5,3,5]# 使用sorted()函数进行排序sorted_numbers=sorted(numbers)# 使用sorted()函数进行逆序排序sorted_numbers_reverse=sorted(numbers,reverse=True)print(sorted_numbers)# 输出: [1, 1, 2, 3, 3, 4, 5, 5, 5, 6, 9]...https://www.jianshu.com/p/35963a00cf94
2.第6章5列表元素个数的加权和(1)第一层每个元素算一个元素,第二层每个元素算2个元素,第三层每个元素算3个元素,第四层每个元素算4个元素,...,以此类推! 输入格式: 在一行中输入一个列表。 输出格式: 在一行中输出加权元素个数值。 输入样例: 在这里给出一组输入。例如: [1,2,[3,4,[5,6],7],8] 输出样例: 在...https://pintia.cn/problem-sets/1111652100718116864/exam/problems/type/7?problemSetProblemId=1163035698160459784&page=0
3.Excel函数教程图6 粘贴函数列表 三、函数的种类 excel函数一共有11类,分别是数据库函数、日期与时间函数、工程函数、财务函数、信息函数、逻辑函数、查询和引用函数、数学和三角函数、统计函数、文本函数以及用户自定义函数。 1.数据库函数--当需要分析数据清单中的数值是否符合特定条件时,可以使用数据库工作表函数。例如,在一个包...http://www.360doc.com/content/11/0305/21/1444297_98449311.shtml
4.运动矢量细化和其他编解码工具之间的相互作用的制作方法1.相关申请的交叉引用 2.根据适用的专利法和/或依据巴黎公约的规则,本技术旨在及时要求于 2019年6月5日提交的第pct/cn2019/090201号国际专利申请、2019年7 月4日提交的第pct/cn2019/094767号国际专利申请和2019年7月16日提交的第pct/cn2019/096180号国际专利申请的优先权和利益。出于根据法律的所有目的,前述...http://mip.xjishu.com/zhuanli/62/202080041806.html
5.中华影像医学·分子影像学卷最新章节王培军著第二阶段,20世纪80年代初到90年代初,已经成熟的MRI技术开始被广泛应用到临床诊断和生物医学的基础研究中,但此时MRI成像主要还局限于断面成像(T 1 和T 2 加权成像技术),所以它更多被用于观测生理和病理条件下生物体在解剖结构以及形态学上的变化。第三阶段,20世纪90年代,随着快速成像技术(如EPI)、弥散加权成像、...https://m.zhangyue.com/readbook/12862404/28.html?showDownload=1
6.高中数学知识点总结(最全版)重点函数,数列,三角函数,平面向量,圆锥曲线,立体几何,导数1知识点 第一章集合与函数概念 〖1.1〗集合 【1.1.1】集合的含义与表示 (1)集合的概念 集合中的元素具有确定性、互异性和无序性. (2)常用数集及其记法 表示自然数集,或表示正整数集,表示整数集,表示有理数集,表示实数集. ...https://www.360doc.cn/document/76407869_1018929759.html
1.list集合操作对图书馆的题目// 5. 根据图书名称查询是否在列表中 val bookTitleToFind = "西游记" val bookExists = books.exists(_.name == bookTitleToFind) // 使用_.name println(s"要找的书'$bookTitleToFind' 是否在列表中? $bookExists") // 6. 从列表中删除第4本图书 ...https://blog.csdn.net/rylshe1314/article/details/143856268
2.python基础篇(四)——Python数据类型之列表(中)从上面的代码可以看出:由于两条print语句都缩进了,因此它们都将针对列表中的每位魔术师执行一次。第二条print语句中的换行符"\n"在每次执行结束后都插入一个空行,从而整洁地将针对各位魔术师的消息编组,运行结果如下: 在for循环中,想包含多少行代码都可以。实际上,我们会发现使用for循环对每个元素执...https://www.365seal.com/y/xPnQgOWOVK.html
3.pythonpth的作用mob64ca13f937ae的技术博客返回一个新的 set 包含 s 中有但是 t 中没有的元素 s.symmetric_difference(t) s ^ t 返回一个新的 set 包含 s 和 t 中不重复的元素 s.copy() 返回set “s”的一个浅复制 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. ...https://blog.51cto.com/u_16213587/12578025
4.Python教程笔记(2)zip() 与 * 运算符相结合可以用来拆解一个列表 >>>x=[ 1,2,3]>>>y=[4,5,6]>>>list(zip(x,y))[(1,4),( 2,5),(3,6)]>>>x2,y2=zip(*zip(x,y))>>>x==list(x2)andy==list(y2)True 5.7 深入条件控制 not 的优先级最高, or 的优先级最低 ...https://www.miaokee.com/2787402.html
5.浙大版《Python程序设计》题目集6.字符串对象和元组对象是不可变对象,列表对象为可变对象。T 7.列表lst=[12, -5, -22, -10, -26, 35, 0, 49, 3, -21],lst[::]的结果是[12, -5, -22, -10, -26, 35, 0, 49, 3, -21]。T b[:] ##单独一个冒号,代表从头取到尾,步长默认为1 ...https://www.iotword.com/19667.html
6.北师大版八年级数学上册教案(通用18篇)5、课堂小结: (1)判定三角形全等的方法:3个公理1个推论(SAS、ASA、AAS、SSS) 在这些方法中,每一个都需要3个条件,3个条件中都至少包含条边。 (2)三种方法的综合运用 让学生自由表述,其它学生补充,自己将知识系统化,以自己的方式进行建构。 6、布置作业: ...https://www.unjs.com/fanwenwang/jiaoan/20230814181800_7472953.html
7.初二上册数学知识点总结5.函数图象性质:当k相同,且b不相等,图像平行;当k不同,且b相等,图象相交于Y轴;当k互为负倒数时,两直线垂直。 6.平移时:上加下减在末尾,左加右减在中间。 直角三角形 1.勾股定理及其逆定理 定理:直角三角形的两条直角边的等于的平方。 逆定理:如果三角形两边的平方和等于第三边的平方,那么这个三角形是...https://www.oh100.com/chuer/5567605.html
8.初二数学上册知识点总结(集锦8篇)5.函数图象性质:当k相同,且b不相等,图像平行;当k不同,且b相等,图象相交于Y轴;当k互为负倒数时,两直线垂直。 6.平移时:上加下减在末尾,左加右减在中间。 直角三角形 1.勾股定理及其逆定理 定理:直角三角形的两条直角边的等于的平方。 逆定理:如果三角形两边的平方和等于第三边的平方,那么这个三角形是...https://www.ruiwen.com/zhishidianzongjie/6771164.html
9.从原理到落地,七大维度读懂协同过滤推荐算法,它们对应的向量(即图2中矩阵的列向量,分别是第i列和第j列)如下,其中n是用户数。 那么 的相似度计算,我们可以细化如下: 公式1:计算 相似度 我们仔细看一下上述公式,公式的分子就是下图矩阵中对应的i列和j列中同一行中的两个元素(红色矩形中的一对元素)相乘,并且将所有行上第i列和第j列的元素相乘得到的...https://cloud.tencent.com/developer/article/1487831
10.全面了解风控策略体系消费金融风控联盟本文由正阳执笔,思茂校正,同时感谢正阳学院近300位策略师的协同,全文总计5.0w字(公众号文字数极限,所以...1.策略先行之道 本章内容偏心法和方法论,更适合管理层或者架构者。为求准确,本章大部分概念的解释来自...头部效应是指在一个领域中,第一名往往会获得更多的关注,拥有更多的资源,所在领域的赛道,要么高价值...https://www.shangyexinzhi.com/article/6849659.html
11.智能车竞赛技术报告智能车视觉中国矿业大学▲图 5智能视觉模块安装效果图 1.6整车效果图 ▲图 6整车效果图 第二章 硬件系统设计 2.1主控板 ▲图 7主控板 主控板对称布置,每个电源网络均设置LED显示各个供电芯片是否正常工作,减少故障排查时间,其中包括主 3.3V,5V,总钻风摄像头 3.3V和舵机可调稳压。根据各个传感器的车身分布位置合理安排接口位置,为减轻质量...https://www.eefocus.com/article/503552.html
12.自动驾驶汽车嘲测评参数生成方法及代表性指标汽车技术自动驾驶汽车开发的一个重要层面是评估自动驾驶汽车在安全性、舒适性、效率性方面的质量和性能[1]-[3]。由于真实开放道路测试昂贵且耗时[4][5],因此提出了一种基于场景的测评方法[2][6]-[11]。基于场景的测评方法在众多场景中对自动驾驶汽车被测系统的响应进行测试,并评估该响应在真实世界的场景中引起变化。场...https://www.auto-testing.net/news/show-117044.html
13.计算机网络(第5版)习题答案(56章)谢希仁编著潇洒的qi士跃的计算机网络(第5版) 习题答案(5-6章) 谢希仁 编著 第1章-第4章答案 第五章传输层 5—01试说明运输层在协议栈中的地位和作用,运输层的通信和网络层的通信有什么 重要区别?为什么运输层是必不可少的? 答:运输层处于面向通信部分的最高层,同时也是用户功能中的最低层,向它上面的应 ...https://blog.sina.com.cn/s/blog_511364b10100pl9w.html