Java面试合集-Redis篇(1)
redis是java后端面试的高频考点,本篇总结自redis常见的面试题,将带你快速了解什么是redis的缓存穿透、缓存击穿和缓存雪崩,以及学习对应的解决方案。
一、使用场景
当面试问到redis的使用场景时,可根据自己简历上的业务具体回答。比如
1、缓存:穿透、击穿、雪崩、双写一致、持久化、数据过期、淘汰策略
2、分布式锁:setnx、redisson
常见问题:
1、在你最近的项目中有哪些场景用到了Redis?
2、什么是缓存穿透、击穿、雪崩?如果发生了缓存穿透、击穿、雪崩,该如何解决?
1、缓存穿透
1)什么是缓存穿透?
是指查询一个不存在的数据,mysql查询不到数据,也不会直接写入缓存,每次请求都要去查数据库。可能导致数据库挂掉,这种情况大概率是遭到了攻击。
2)关于缓存穿透,有哪些解决方案?
答:一般来说有两种方案,分别是缓存空数据和使用布隆过滤器,(这里再具体展开论述)
方案1:缓存空数据。
当查询返回的数据为空,仍把这个空结果进行缓存。如 {key:1,value:null}
缺点:消耗内存,且可能发生不一致的问题(如刚开始对null进行缓存,但后面添加了值后,不为null)
方案2:使用布隆过滤器
1、作用: 布隆过滤器可用于检索一个元素是否在一个集合中。
2、优点:内存占用较少,没有多余key
3、缺点:实现复杂,存在误判
bitmap(位图)︰相当于是一个以(bit)位为单位的数组,数组中每个单元只能存储二进制数0或1
以下为产生误判的情况。id3经过3次哈希之后都得到的元素都为1,说明该数据存在,但实际是id为3的数据不存在。
误判率:数组越小误判率就越大,数组越大误判率就越小,但是同时带来了更多的内存消耗。
下方右图为一段简单的测试误判率的代码
3)简述使用redisson实现布隆过滤器的原理?是否存在缺点?
实现原理:其底层主要是先去初始化一个比较大的数组,里面存放的二进制0或1。在一开始都是0,当一个key来了之后经过3次hash计算,模于数组长度找到数据的下标然后把数组中原来的0改为1,这样的话,三个数组的位置就能标明一个key的存在。查找的过程也是一样的。
有缺点,布隆过滤器有可能会产生一定的误判,一般可以设置这个误判率,大概不会超过5%,其实这个误判是必然存在的,要不就得增加数组的长度,其实已经算是很划分了,5%以内的误判率一般的项目也能接受,不至于高并发下压倒数据库。
2、缓存击穿
1)什么是缓存击穿?
是指给某一个key设置了过期时间,当key过期的时候,恰好这时间点对这个key有大量的并发请求过来,这些并发的请求可能会瞬间把DB压垮(DB即数据库DataBase)
2)关于缓存击穿,有哪些解决方案?
答:一般来说有两种方案,分别是互斥锁和逻辑过期,(这里再具体展开论述)
方案1:互斥锁
特点:强一致,性能差
方案2:逻辑过期
特点:高可用,性能优
需要根据具体的业务逻辑选择对应的方案,两种方案的实现步骤比较如下。
第一可以使用互斥锁:当缓存失效时,不立即去load db,先使用如 Redis 的 setnx 去设置一个互斥锁,当操作成功返回时再进行 load db的操作并回设缓存,否则重试get缓存的方法
第二种方案可以设置当前key逻辑过期,大概是思路如下:
①:在设置key的时候,设置一个过期时间字段一块存入缓存中,不给当前key设置过期时间
②:当查询的时候,从redis取出数据后判断时间是否过期
③:如果过期则开通另外一个线程进行数据同步,当前线程正常返回数据,这个数据不是最新
最后是方案的选择,两种方案各有利弊:
如果选择数据的强一致性,建议使用分布式锁的方案,性能上可能没那么高,锁需要等,也有可能产生死锁的问题
如果选择key的逻辑删除,则优先考虑高可用性,性能比较高,但是数据同步这块做不到强一致。
3、缓存雪崩
1)什么是缓存雪崩?
是指在同一时段大量的缓存key同时失效或者Redis服务宕机,导致大量请求到达数据库,带来巨大压力。
2)关于缓存雪崩,有哪些解决方案?
方案1:给不同的Key的TTL添加随机值
方案2:利用Redis集群提高服务的可用性(哨兵模式、集群模式)
方案3:给缓存业务添加降级限流策略(ngxin或spring cloud gateway)
注:降级可做为系统的保底策略,适用于穿透、击穿、雪崩
方案4:给业务添加多级缓存(Guava或Caffeine)
关于缓存三兄弟(穿透、击穿和雪崩),可用如下一首诗来助记:
穿透无中生有key,布隆过滤null隔离。缓存击穿过期key,锁与非期解难题。雪崩大量过期key,过期时间要随机。面试必考三兄弟,可用限流来保底。
3)缓存雪崩与缓存击穿有什么区别?
缓存雪崩,是指设置缓存时采用了相同的过期时间, 导致缓存在某一时刻同时失效,请求全部转发到 DB,DB瞬时压力过重雪崩。
与缓存击穿的区别:雪崩是很多 key,击穿是某一个 key 缓存。 解决方案主要是可以将缓存失效时间分散开,比如可以在原有的失效时间基础上增加一个随机值,比如 1-5 分钟随机, 这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件。