A Secure and Dynamic Multi-Keywo

2019-05-10  本文已影响0人  SeanC52111

系统框架

image.png

数据拥有者DO构建加密索引树,将加密文档和索引外包给云服务。
云存储服务根据数据使用者Data User发来的数据搜索token和已经存好的加密索引树进行搜索,返回top K个排序结果。
排序的计量方法根据TF-IDF公式计算相似度。
Term Frequency: the number of times a given term appears within a document
Inverse Document Frequency: dividing the cardinality of document collection by the number of documents containing the keyword.

创新点

关注非加密索引树的构建:

利用非加密索引树的Top-K检索

搜索算法为一个基于递归的‘贪心深度优先搜索’算法。需要使用RList作为存储找到结果前的当前结果列表。RList中记录了对应文件的<RScore,FID>. RScore为文件和查询Q之间的相似度,FID为文件的编号。


Formula of the Relevance Score

在RList中,tuple是按照对应RScore降序排列的。在搜索的过程中可以动态更新RList以寻求Top-K结果。


非加密的搜索算法
步骤十分简单

可能改进或应用到科研场景中的因素

上一篇下一篇

猜你喜欢

热点阅读