内容正文:
导入
如何规划旅行行程(路线、景点、酒店、美食)?
行业PPT模板http:///hangye/
自学指导
阅读课本p56~p64页,用笔勾画出,信息检索的概念,信息检索的四种模型和布尔逻辑运算符。
用时:10min
信息检索的概念
信息检索 通过网络搜索工具或浏览等方式,根据信息用户特定的需要将相关信息准确的查找出来的过程。
我们可以在互联网上检索到那些信息?这些信息为我们的生活提供了那些便利?
信息检索的特点
1. 检索范围广:网络信息检索能够覆盖全球范围内的信息资源,用户可以通过网络检索到来自世界各地的信息。
2. 界面友好、便于操作:网络信息检索工具通常采用友好的用户界面设计,使得用户能够轻松上手,快速掌握检索技巧,提高检索效率。
3. 检索空间拓宽:网络信息检索不仅限于文本信息,还可以检索图像、音频、视频等多种类型的信息,从而拓宽了信息检索的空间和范围。
信息检索的模型
我们平时上网能准确的搜索到自己想要的信息吗?
影响信息检索效率和质量的因素有很多,选择合适的信息检索模型,有助于提高信息检索、查询的效率。
01
03
02
04
布尔模型
向量空间模型
概率模型
语言模型
信息检索的模型
布尔模型(应用最多)
用布尔逻辑运算符来表达检索词与检索词之间的逻辑运算关系。
布尔逻辑运算符
逻辑“与”
逻辑“或”
逻辑“非”
信息检索的模型
布尔逻辑“与”
运算符的表示方式有“and”“*”“并且”等。
含义:检出的每一条记录中,必须同时含有进行“与”运算的所有检索词。
作用:对检索词表达的概念加以限定,缩小检索范围,提高检索结果的查准率。
陕西
泡馍
?
关键词=(陕西and泡馍)
交通大学
信息检索的模型
西安交通大学
布尔逻辑“或”
运算符的表示方式有“or”“+”“或者”等。
含义:检出的每一条记录中,至少含有一个进行“或”运算的检索词。
作用:对检索词表达的概念加以扩充,扩大检索范围,防止漏检,提高检查结果的查全率。
比较俩组检索词检索结果的异同
信息检索的模型
布尔逻辑“非”
运算符的表示方式有“not”“-”“不包含”等
含义:从含有某个检索词的信息集合中,排除含有另一检索词的信息集词检索结果的异同。
作用:缩小检索范围,减少信息输出量,但有排除掉相关信息的可能,慎索结果的查全率。
关键词=(泡馍not陕西)
陕西
泡馍
信息检索的模型
优先运算符“( )”
作用:改变逻辑运算符的执行顺序。
含义:逻辑运算符的优先执行顺序一般为not--and--or,优先运算符可改变上述逻辑运算符的执行顺序。加入“()”后,则可优先运算括号内的表达式。
作用:改变逻辑运算符的执行顺序。
发现:运算顺序改变,则结果不同。
A and B or C
A
B
C
A and B or C
C
A
B
C
A
B
A and B or C
信息检索的模型
A and B or C
A
B
C
A and B or C
C
A
B
C
A
B
A and B or C
A and (B or C)
A
B
C
C
A
B
A
B
A and (B or C)
A and (B or C)
C
运算顺序改变,则结果不同
练一练
例:文档集合包含三个文档:
文档1:a b c f g h
文档2:a f c x y z
文档3:b r f z u n
用户查询:(a or b)and z,那么出现的文档应该是 。
文档2、3
查询到的两篇文档在排序上有先后顺序之分吗?
没有。布尔模型本身不提供排序功能,且词汇的出现次数不影响文档是否满足查询条件。
信息检索的模型
向量空间模型
向量空间模型把信息库中的文本以及用户的查询,都表示成向量空间中的线(向量),用它们之间夹角的余弦作为相似性度量。
相比于布尔模型,向量空间模型采用了“部分匹配”的检索策略,是现在的文本检索系统以及网络搜索引擎的基础。
向量空间模型的特点:基于多值相关性判断,基于统计学方法的词加权处理模式,采用检索结果的排序输出策略。
概率模型
概率模型主要基于概率排序原则,即如果文档按照查询概率相关性的大小进行排序,那么排在最前面的,是最有可能被获取的文档。
它主要针对信息索中相关性判断的不确定性,以及查询信息表示的模糊性问题。
信息检索的模型
C
X1
X2
. . .
Xn
信息检索的模型
语言模型
语言模型指基于统计语言模型的信息检索模型,产生于语音识别中。智能拼音输入就是使用了语言模型。例如,用智能拼音输入法输入“yizhixiaohuamao”,语言模型的处理如下:
yi zhi xiao hua miao
一 之 小 话 毛
以 只 笑 华 冒
已 知 校 化 猫
易 枝 晓 花 帽
. . . . . . . . . . . . . . .
P(“一只小花猫”)>(“一枝小花猫”)>P(任何其他候选字符)
拓展
行业PPT模板http:///hangye/
课堂小结
Lavf58.20.100
$$