信息检索复习(5)——相关反馈及查询扩展

2018-06-27  本文已影响0人  Eylen

查询优化

  1. 全局方法
  1. 局部方法

相关反馈和伪相关反馈


Rocchio相关反馈算法


基于概率的相关反馈方法


相关反馈的作用时机

  1. 用户需要有足够的知识来建立一个不错的初始查询。
  2. 相关反馈要求相关文档间非常相似。Rocchio相关反馈模型通过计算簇质心向量,隐式的将相关文档看成单个簇。如果相关文档包括多个不同子类,即它们在向量空间中可以聚成多个簇,那么Rocchio方法效果会不太好。

Web上的相关反馈


相关反馈策略的评价

  1. q0的正确率-召回率曲线,qm的正确率-召回率曲线,一般MAP指标会有50%的提升。(只对用户没有看过的文档进行评价)
  2. 利用剩余文档对反馈后的结果进行评价
  3. 给出两个文档集,一个用于初始查询和相关性判定,另一个用于比较和评价

伪相关反馈(pseudo relevance)(盲相关反馈 blind relevance feedback)

它将相关反馈的人工操作部分自动化,因此,不同于Rocchio算法,用户不再需要进行额外的交互。该方法首先进行正常的检索过程,返回最相关的文档构成初始集,然后假设排名靠前的k篇文档时相关的,最后在此假设上像以往一样进行相关反馈。


间接相关反馈(隐相关反馈 implicit relevance feedback)

上一篇 下一篇

猜你喜欢

热点阅读