当前位置：首页 > wzjs >正文

石家庄疫情全面放开上海百度seo牛巨微

wzjs 2025/7/20 15:36:35

石家庄疫情全面放开,上海百度seo牛巨微,贴吧怎么做网站视频,安卓网页编辑器文章目录什么是布隆过滤器简介布隆过滤器的优点布隆过滤器的缺点布隆过滤器的原理数据结构增加元素查询元素使用场景数据去重缓存穿透问题的解决项目实战springboot集成application.yml配置redis创建布隆过滤器 Bean使用布隆过滤器测试代码执行日志 redis存储结构查询redis…

文章目录

什么是布隆过滤器
- 简介
- 布隆过滤器的优点
- 布隆过滤器的缺点
布隆过滤器的原理
- 数据结构
- 增加元素
- 查询元素
使用场景
- 数据去重
- 缓存穿透问题的解决
项目实战
- springboot集成
- - application.yml配置redis
  - 创建布隆过滤器 Bean
  - 使用布隆过滤器
  - 测试代码
  - 执行日志
- redis存储结构
- - 查询redis key
  - 查询key类型
  - 遍历hash
  - - hash字段含义
  - 查看bitmap置1数
  - 查看bitmap存储长度

什么是布隆过滤器

简介

布隆过滤器是一个很长的二进制向量和一系列随机映射函数。可以用于检索一个元素是否在一个集合中。
布隆过滤器其内部维护了一个全为 0 的 bit 数组，需要说明的是，布隆过滤器有一个误判的概念，误判率越低，则数组越长，所占空间越大。误判率越高则数组越小，所占的空间多少。

布隆过滤器的优点

时间复杂度低，增加和查询元素的时间复杂为 $O (N)$ ，（N为哈希函数的个数，通常情况比较小）。
保密性强，布隆过滤器不存储元素本身。
存储空间小，如果允许存在一定的误判，布隆过滤器是非常节省空间的（相比其他数据结构如Set集合）。

布隆过滤器的缺点

有一定的误判率，但是可以通过调整参数来降低。
无法获取元素本身。
无法删除元素。

布隆过滤器的原理

数据结构

以Redis中的布隆过滤器实现为例，Redis中的布隆过滤器底层是一个大型位数组（二进制数组）+多个无偏hash函数。

一个大型位数组（二进制数组）：
多个无偏hash函数：无偏hash函数就是能把元素的hash值计算的比较均匀的hash函数，能使得计算后的元素下标比较均匀的映射到位数组中。

增加元素

往布隆过滤器增加元素，添加的key需要根据k个无偏hash函数计算得到多个hash值，然后对数组长度进行取模得到数组下标的位置，然后将对应数组下标的位置的值置为1。

通过k个无偏hash函数计算得到k个hash值。
依次取模数组长度，得到数组索引。
将计算得到的数组索引下标位置数据修改为1。

例如，key = Liziba，无偏hash函数的个数k=3，分别为hash1、hash2、hash3。三个hash函数计算后得到三个数组下标值，并将其值修改为1。

如下图所示：
在这里插入图片描述

查询元素

布隆过滤器最大的用处就在于判断某样东西一定不存在或者可能存在，而这个就是查询元素的结果。其查询元素的过程如下：

通过k个无偏hash函数计算得到k个hash值。
依次取模数组长度，得到数组索引。
判断索引处的值是否全部为1，如果全部为1则存在（这种存在可能是误判），如果存在一个0则必定不存在

使用场景

数据去重

场景描述：在一些需要对大量数据进行去重的场景，例如用户提交表单、数据同步等，布隆过滤器可以迅速判断某个数据是否已存在，避免重复插入。
应用实例：在用户提交表单时，使用布隆过滤器判断该用户是否已经提交过相同的数据，从而防止重复提交。

缓存穿透问题的解决

场景描述：当缓存中不存在某个数据，而用户频繁查询该数据时，可能导致缓存穿透问题。布隆过滤器可以在缓存层之前迅速过滤掉不存在的数据，减轻数据库的压力。
应用实例：在缓存中存储热门商品的ID列表，并使用布隆过滤器判断某个商品ID是否存在于列表中，从而决定是否查询数据库获取数据。

项目实战

springboot集成

使用springboot的redisson创建布隆过滤器，由redis的bitset（位图）作为存储结构。

application.yml配置redis

spring:application:name: bloomredis:host: 127.0.0.1port: 6379

创建布隆过滤器 Bean

@Configuration
public class BloomFilter {@Autowiredprivate RedissonClient redissonClient;private RBloomFilter<String> bloomFilter;@PostConstructpublic void initBloomFilter() {bloomFilter = redissonClient.getBloomFilter("userIdFilter");// 初始化参数：预期元素数量为100000，误判率为1%bloomFilter.tryInit(100000L, 0.01);}public void addUserId(String userId) {// 预加载数据bloomFilter.add(userId);}public boolean checkUserId(String userId) {return bloomFilter.contains(userId);}
}

使用布隆过滤器

@Service
@Slf4j
public class UserService {@Autowiredprivate BloomFilter bloomFilter;// 代替数据库存到缓存private List<User> users = new ArrayList<>();public User selectUserId(Integer userId) {if (bloomFilter.checkUserId(String.valueOf(userId))) {User user = getUser(userId);log.info("user id: {} is selected. User: {}", userId, user);return user;}log.info("user id: {} not found", userId);return null;}public void addUsers() {String name = "peter";Integer age = 20;for (int i = 1; i <= 100; i++) {users.add(new User(i, name + i, age));bloomFilter.addUserId(String.valueOf(i));}}public User getUser(Integer userId) {for (User user : users) {if (user.getId().equals(userId)) {return user;}}return null;}
}

测试代码

@SpringBootTest
class BloomApplicationTests {@Autowiredprivate UserService userService;@Testvoid testBloomFilter() {userService.addUsers();assert userService.selectUserId(10) != null;assert userService.selectUserId(100) != null;assert userService.selectUserId(200) == null;assert userService.selectUserId(300) == null;}}

执行日志

2025-03-23 12:27:16.275  INFO 15908 --- [    Test worker] com.example.bloom.service.UserService    : user id: 10 is selected. User: User(id=10, name=peter10, age=20)
2025-03-23 12:27:16.280  INFO 15908 --- [    Test worker] com.example.bloom.service.UserService    : user id: 100 is selected. User: User(id=100, name=peter100, age=20)
2025-03-23 12:27:16.282  INFO 15908 --- [    Test worker] com.example.bloom.service.UserService    : user id: 200 not found
2025-03-23 12:27:16.283  INFO 15908 --- [    Test worker] com.example.bloom.service.UserService    : user id: 300 not found

redis存储结构

查询redis key

127.0.0.1:6379> keys "*userIdFilter*"
1) "{userIdFilter}:config"
2) "userIdFilter"

查询key类型

127.0.0.1:6379> type "{userIdFilter}:config"
hash
127.0.0.1:6379> type "userIdFilter"
string

遍历hash

127.0.0.1:6379> HGETALL "{userIdFilter}:config"
1) "size"
2) "958505"
3) "hashIterations"
4) "7"
5) "expectedInsertions"
6) "100000"
7) "falseProbability"
8) "0.01"

hash字段含义

expectedInsertions = 100000      # 预期处理10万用户ID
falseProbability = 0.01         # 允许1%的误判率
hashIterations = 7               # 自动计算出的哈希函数数量
size = 958505                   # 所需位数组长度约95.8万位（约117KB）

查看bitmap置1数

127.0.0.1:6379> BITCOUNT userIdFilter
(integer) 700

我们存了100个userId，7个hash函数给我们置了700个1。

查看bitmap存储长度

127.0.0.1:6379> strlen userIdFilter
(integer) 119734

使用了119734个字节，119734 * 8 = 957872位，与size = 958505接近。

个人小游戏

查看全文

http://www.dtcms.com/wzjs/25692.html

龙口做网站自己做网站建设

做网站能传电影网站多少钱衡阳seo

单位网站怎么制作seo算法是什么

南昌哪里学做网站seowhy论坛

上海自贸区注册公司流程seo优化推广技巧

精美网站建设百度快照网址

遂宁微章建设举报网站现在有哪些网址

在哪个网站找事做靠谱昆明网络推广优化

wordpress标题大小优化设计三要素

网站开发发表文章教育机构加盟

廊坊关键词优化seo排名优化app

北京服饰网站建设网络营销的基本职能

做网站做软件怎么赚钱吗论述搜索引擎优化的具体措施

北京高端网站建设系统优化排名推广技术网站

代写网站未来网络营销的发展趋势

宿迁住房和城乡建设网站网址查询注册信息查询

绍兴建设网站制作站长工具果冻传媒

网站排名优化多少钱软文写作网站

如何建立一个企业的网站查询seo

创建一个购物网站百度网盘客服

设计师互动网站百度关键词怎么优化

温州网站上排名荆门网站seo

旅游预定型网站建设seo优化排名易下拉用法

wordpress支持多少并发宁波seo

兰州网页制作公司网站营销案例分享

php商业网站制作关键词诊断优化全部关键词

怎样做企业手机网站正规推广赚佣金的平台

体育直播网站开发数据源获取如何在手机上制作网站

微网站幻灯片尺寸怎么快速优化关键词排名

云南网站建设产品介绍项目推广计划书