redis

2020-07-05 本文已影响0人达文西_Huong

Redis 学习篇【转】

原文:https://www.jianshu.com/p/cf8600a9c0f3

推荐阅读原文，本篇文章的记载只是为了复习的时候方便！！

日常的开发中，无不都是使用数据库来进行数据的存储，由于一般的系统任务中通常不会存在高并发的情况，所以这样看起来并没有什么问题

一旦涉及大数据量的需求，如一些商品抢购的情景，或者主页访问量瞬间较大的时候，单一使用数据库来保存数据的系统会因为面向磁盘，磁盘读/写速度问题有严重的性能弊端。

在这一瞬间成千上万的请求到来，需要系统在极短的时间内完成成千上万次的读/写操作，这个时候往往不是数据库能够承受的，极其容易造成数据库瘫痪，最终导致服务器宕机的严重生成问题

为了克服上述的问题，项目通常会引入NoSQL技术，这是一种基于内存的数据库，并且提供一定的持久化能力。

Redis技术就是NoSQL技术中的一种。Redis缓存的使用，极大的提升了应用程序的性能和效率，特别是数据查询方面。

但同时，它也带来了一些问题。其中，最要害的问题，就是数据的一致性问题，从严格意义上讲，这个问题无解。如果对数据的一致性要求很高，那么就不能使用缓存

另外的一些典型问题就是，缓存穿透，缓存击穿和缓存雪崩。本篇文章从实际代码操作，来提出解决这三个缓存问题的方案，毕竟Redis的缓存问题是实际面试中的高频问点，理论和实操都要兼得。

缓存穿透

缓存穿透是指查询一条数据库和缓存都没有的一条数据，就会一直查询数据库，对数据库的访问压力就会增大，缓存穿透的解决方案，有以下两种:

缓存空对象：代码维护简单，但是效果不好

布隆过滤器：代码维护复杂，但是效果好

缓存空对象

缓存空对象是指当一个请求过来，缓存中和数据库中都不存在该请求的数据，第一次请求就会跳过缓存进行数据库的访问，并且访问数据库后返回空，此时也将该空对象进行缓存。

若是再次进行访问该空对象的时候，就会直接击中缓存，而不是再次访问数据库，缓存空对象实现的原理图

image

缓存空对象的实现代码

    public class UserServiceImpl {
        @Autowired
        UserDAO userDAO;
        @Autowired
        RedisCache redisCache;

        public User findUser(Integer id) {
            Object object = redisCache.get(Integer.toString(id));
            // 缓存存在，直接返回
            if(object != null) {
                // 检验该对象是否为缓存空对象，是则直接返回null
                if(object instanceof NullValueResultDO) {
                    return null
                }
                return (User)object;
            } else {
                // 缓存中不存在，查询数据库
                User user = userDAO.getUser(id);
                // 存入缓存
                if(user != null) {
                    redisCache.put(Integer.toString(id),user);
                } else {
                    // 将空对象存进缓存
                    redisCache.put(Interger.toString(id), new NullValueResultDO());
                }
                return user;
            }
        }
    }

缓存空对象的实现代码很简单，但是缓存空对象会带来比较大的问题，就是缓存中回存在很多空对象，占用内存空间，浪费资源，一个解决办法就是设置空对象的较短的过期时间，代码如下:

    // 缓存的时候，添加一个该空对象的过期时间60s
    redisCache.put(Integer.toString(id), new NullValueResultDO(),60)

布隆过滤器

布隆过滤器是一种基于概率的数据结构，主要用来判断某个元素是否在集合内，它具有运行速度(时间效率)，占用内存小的优点(空间效率)，但是有一定的误识别率和删除困难的问题。它只能告诉你某个元素一定不在集合内或可能在集合内。

在计算机科学中有一种思想:空间换时间，时间换空间。一般两者不可兼得，而布隆过滤器运行效率和空间大小都兼得，它是如何做到的呢?

布隆过滤器中引用了一个误判率的概念，即它可能会把不属于这个集合的元素认为可能属于这个集合，但是不会把属于这个集合的认为不属于这个集合，布隆过滤器的特点如下：

一个非常大的**二进制数组(数组里只有0和1)

若干个哈希函数

空间效率和查询效率高

不存在漏报：某个元素在某个集合中，肯定能报出来

可能存在漏报：某个元素不在某个集合中，可能也被报出来

不提供删除方法，代码维护困难

位数组初始化都为0，它不存在元素的具体值，当元素经过哈希函数哈希后的值也就是数组下标），对应的数组位置值改为1

实际布隆过滤器存储数据和查询数据原理图如下:

image

可能很多读者还是很迷糊，下面将通过图解一步一步讲解布隆过滤器，总而言之一句简单的话概括，就是布隆过滤器是一个很大二进制的位数组，数组里面只存0和1

初始化布隆过滤器的结构图如下：

image

以上只是画了布隆过滤器的很小很小的一部分，实际布隆过滤器是非常大的数组（这里的大是指它的长度大，并不是指它所占的内存空间大）。

那么一个数据是怎么存进布隆过滤器的呢?

当一个数据进行存入布隆过滤器的时候，会经过若干个哈希函数进行哈希，得到对应哈希值作为数组的下标，然后将初始化的数组对应的下标的值修改为1

image

当再次进行存入第二个值得时候，修改后的结果原理如下

image

所以每次存入一个数据，就会哈希函数的计算，计算的结果就会作为下标，在布隆过滤器中有多少个哈希函数就会计算出多少个下标，布隆过滤器的插入流程如下

将要添加的元素给m个哈希函数
得到对应于位数组上的m个位置
将这m个位置设为1

那么为什么会有误判率呢?

假设我们在多次存入值后，在布隆过滤器中存在 x,y,z 这三个值，布隆过滤器的存储结构如下图

image

当我们要查询的时候，比如查询 a 这个数，实际中这个数是不存在布隆过滤器中的，经过2个哈希函数计算后的到 a 的哈希值分别为 2 和 13 ,结构原理图如下

image

经过查询之后，发现2和13位置所存储的值都为1，但是2和13的下标分别是x和z经过计算后的下标位置的修改，改布隆过滤器中实际不存在a，那么布隆过滤器就会误判改值可能存在，因为布隆过滤不存在元素值，所以存在误判率

具体布隆过滤的判断的准确率与以下两个因素有关：

布隆过滤器的大小：越大，误判率就越小，所以说布隆过滤器一般长度都是非常大的
哈希函数的个数：哈希函数的个数越多，那么误判率就越小

那么为什么不能删除元素呢？

原因很简单，因为删除元素后，将对应元素的下标设置为零，可能别的元素的下标也引用该下标，这样别的元素的判断就会受到影响，如图

image

当你删除z元素之后，将对应的下标10和13设置为0，这样导致x和y元素的下标受到影响，导致数据的判断不准确，所以直接不提供删除元素的api

以上说的都是布隆过滤器的原理，只有理解了原理，在实际的运用才能如鱼得水，下面就来编写一个简单的布隆过滤器

对于手写一个布隆过滤器，首先需要明确布隆过滤器的核心

若干的哈希函数
存值的api
判断值的api

代码如下

    public class MyBloomFilter {
        // 布隆过滤器长度
        private static final int SIZE = 2 << 10;
        // 模拟实现不同的哈希函数
        private static final int [] num = new int[] {5, 19, 23, 31, 47, 71};
        // 初始化位数组
        private BitSet bits = new BitSet(SIZE);
        // 用于存储哈希函数
        private MyHash[] function = new MyHash[num.length];

        // 初始化哈希函数
        public MyBloomFilter() {
            for(int i = 0;i < num.lenght; i++) {
                function [i] = new MyHash(SIZE, num[i]);
            }
        }

        // 存储api
        public void add(String value) {
            // 对存入得值进行哈希计算
            for(MyHash f : function) {
                // 将为数组对应的哈希下标的位置的值改为1
                bits.set(f.hash(value), true)
            }
        }

        // 判断是否存在该值的api
        public boolean contains(String value) {
            if(value == null) {
                return false;
            }
            boolean result = true;
            for(MyHash f : func) {
                result = result&& bits.get(f.hash(value));
            }
            return result;
        }
    }

哈希函数代码如下:

    public static class MyHash {
        private int cap;
        private int seed;
        // 初始化数据
        public MyHash(int cap,int seed) {
            this.cap = cap;
            this.seed = seed;
        }
        // 哈希函数
        public int hash(String value) {
            int result = 0;
            int len = value.length();
            for(int i = 0; i < len; i++) {
                result = seed * result + value.charAt(i);
            }
            retsult (cap - 1) & result;
        }
    }

布隆过滤器测试代码如下:

    public static void test {
        String value = "4243212355312";
        MyBloomFilter filter = new MyBloomFilter();
        System.out.println(filter.contains(value));
        filter.add(value);
        System.out.println(filter.contains(value));
    }

以上就是手写一个非常简单的布隆过滤器，但是实际项目中可能由牛人或者大公司已经帮你写好的，比如谷歌的Google Guava，只需要在项目中引入一下依赖:

    <dependency>
        <groupId>com.google.guava</groupId>
        <artifactId>guava</artifactId>
        <version>27.0.1-jre</version>
    </dependency>

实际项目中具体的操作代码如下:

    public static void MyBloomFilterSysConfig {
        @Autowired
        OrderMapper orderMapper

        // 1.创建布隆过滤器  第二个参数为预期数据量10000000，第三个参数为错误率0.00001
        BloomFilter<CharSequence> bloomFilter =  BloomFilter.create(Funnels.stringFunnel(Charset.forName("utf-8")),10000000, 0.00001);
        // 2.获取所有的订单，并将订单的id放进布隆过滤器里面
        List<Order> orderList = orderMapper.findAll();
        for (Order order;orderList ) {
            Long id = order.getId();
            bloomFilter.put("" + id);
        }
    }

在实际项目中会启动一个系统任务或者定时任务，来初始化布隆过滤器，将热点查询数据的id放进布隆过滤器里面，当用户再次请求的时候，使用布隆过滤器进行判断，该订单的id是否在布隆过滤器中存在，不存在则直接返回null，代码如下

    // 判断订单id是否在布隆过滤器中存在
    bloomFilter.mightContain(""+ id)

布隆过滤器的缺点就是要维持容器中的数据，因为订单数据肯定是频繁变化的，实时要更新布隆过滤器中的数据为最新。

缓存击穿

缓存击穿是指一个key非常热点，在不停的扛着大并发，大并发集中对这一个点进行访问，当这个key在失效的瞬间，持续的大并发就穿破缓存，直接请求数据库，瞬间对数据库的访问压力增大。

缓存击穿这里强调的是并发，造成缓存击穿的原因有以下两个:

该数据没有人查询过，第一次查询就大并发（冷门数据）
添加到了缓存，redis有设置数据失效的时间，这条数据刚好失效，大并发访问（热点数据）

对于缓存击穿的解决方案就是枷锁，具体实现原理如下:

image

当用户出现大并发访问的时候，在查询缓存的时候和查询数据库的过程加锁，只能第一个进来的请求进行执行，当第一个请求把该数据放进缓存中，接下来的访问就会直接集中缓存，防止了缓存击穿。

业界比较普遍的一种做法，即根据key获取value 值为空时，锁上，从数据中load数据后再释放锁。若其他线程获取锁失败，则等待一段时间后重试。这里要注意，分布式环境中要使用分布式锁，单机的话用普通的锁就(synchronized,Lock)够了。

下面以一个获取商品库存的案例进行代码演示，单机版的锁实现具体实现的代码如下:

    public String getProduceNum(String key) {
        try {
            // 缓存中取数据，并存入缓存中
            int num = Integer.parseInt(redisTemplate.opsForValue().get(key))

            if(num > 0) {
                // 每查一次库存 - 1
                redisTemplate.opsForValue().set(key, (num-1)+"");
                System.out.println('剩余的库存为num :' + (num - 1));
            } else {
                System.out.println('库存为0')
            }
            
        } catch (NumberFormatException e ){
            e.printStackTrace()
        } finally {
            
        }
        return 'OK'
    }

分布式的锁实现具体代码如下:

    public String getProduceNum(String key) {
        // 获取分布式锁
        RLock lock = redissonClient.getLock(key);
        try {
            // 获取库存数
            int num= Integer.parseInt(redisTemplate.opsForValue().get(key));  
            // 上锁           
            lock.lock();
            if (num> 0) {
                //减少库存，并存入缓存中
                redisTemplate.opsForValue().set(key, (num - 1) + "");
                System.out.println("剩余库存为num：" + (num- 1));
            } else {
                System.out.println("库存已经为0");
            }
        } catch (NumberFormatException e) {
            e.printStackTrace();
        } finally {
            //解锁
            lock.unlock();
        }
        return "OK";
    }

缓存雪崩

缓存雪崩是指在某一个时间段，缓存集中过期失效。此刻无数的请求直接绕过开缓存，直接请求数据库。

造成缓存雪崩的原因，有以下两种

redis宕机
大部分数据失效

比如天猫双十一，马上就要双十一零点，很快就会迎来一波抢购，这波商品再23点集中的放入了缓存，假设缓存一个小时，那么到了凌晨24点的时候，这批商品就都过期了。

而对这批商品的访问查询，都落在了数据库上，对于数据库而言，就会产生周期性的压力波峰，对数据库造成压力，甚至压垮数据库。

缓存雪崩的原理图如下，当正常情况下，key没有大量失效的用户访问原理图如下:

image

当某一时间点，key大量失效，造成的缓存雪崩原理图如下:

image

对于缓存雪崩的解决方案有以下两种：

搭建高可用的集群，防止单击的redis宕机
设置不同的过期时间，防止同一时间内大量的key失效

针对业务系统，永远都是具体情况具体分析，没有最好，只有最合适。于缓存其它问题，缓存满了和数据丢失等问题，我们后面继续深入的学习。最后也提一下三个名词 ```LRU,RDB,AOF``,通常我们采用LRU策略处理溢出，Redis的RDB和AOF持久化策略来保证一定情况下数据安全。

以上

redis

Redis 学习篇【转】

推荐阅读原文，本篇文章的记载只是为了复习的时候方便！！

缓存穿透

缓存空对象

布隆过滤器

缓存击穿

缓存雪崩

猜你喜欢

热点阅读

redis

Redis 学习篇 【转】

推荐阅读原文，本篇文章的记载只是为了复习的时候方便！！

缓存穿透

缓存空对象

布隆过滤器

缓存击穿

缓存雪崩

猜你喜欢

热点阅读

Redis 学习篇【转】