Bloom Filter
2019-01-01 本文已影响0人
池塘游泳的蜗牛
我们都知道Hash表具有很高的查询效率,但是Hash也具有致命的缺点冲突。Bloom Filter 的方法就是使用多重哈希来避免单个Hash冲突率过高的问题。如果其告诉你某个元素存在,那只能说明其可能存在。如果不存在那么表明肯定不存在。
举个例子,搜索引擎一般都是模糊匹配,但是当我们在地址栏输入某个特定url时我们明确告诉搜索引擎我要访问这个这个地址。人一般都是不可靠的,更何况对于这么复杂的地址,所以出错在所难免。如果每次百度或者Google都真实的给你去爬这个地址,那么再强大的系统都得瘫痪。如果使用Bloom Filter 对你的Url进行过滤一下,最差的结果也能将错误过滤掉。对于数据库检索使用这个也很实用。网上有很多人介绍我就不费口角了,收集了一些讲的不错的文章大家自己看吧。