文章 62
浏览 15135
布隆过滤器使用

布隆过滤器使用

什么是布隆过滤器 布隆过滤器(Bloom Filter)是1970年由布隆提出的。 它实际上是一个很长的二进制向量 和一系列随机映射函数 。 布隆过滤器可以用于检索一个元素是否在一个集合中 。 它的优点是空间效率和查询时间都比一般的算法要好的多 ,缺点是有一定的误识别率和删除困难。 上面这句话可以理解为:有个二进制的集合 ,里面存放的0和1,0代表不存在,1代表存在,可以通过一些定义好的方法 快速判断元素是否在集合中。内部逻辑如下图展示 布隆过滤器有哪些作用 由于布隆过滤器的特性,能够判断一个数据可能在集合中 ,和一个数据绝对不在集合中 ,所以他可以用于以下场景 网页URL的去重(爬虫,避免爬取相同的 URL 地址) 垃圾邮件的判别 集合重复元素的判别 查询加速(比如基于key-value的存储系统) 数据库防止查询击穿,使用 BloomFilter 来减少不存在的行或列的磁盘查找(缓存穿透 )。 ... 演示一下布隆过滤器的用法 如何解决布隆过滤器无法删除数据的问题 升级版的布隆过滤器(Coun....

人民有信仰 民族有希望 国家有力量