面试突击 | Redis 如何从海量数据中查询出某一个 Key?视频版

面试突击 | Redis 如何从海量数据中查询出某一个 Key?视频版

做者 | 王磊
面试突击 | 第 001 期
1 考察知识点面试

本题考察的知识点有如下几个:redis

  1. Keys 和 Scan 的区别
  2. Keys 查询的缺点
  3. Scan 如何使用?
  4. Scan 查询的特色
    2 解答思路服务器

  5. Keys 查询存在的问题
  6. Scan 的使用
  7. Scan 的特色
    3 Keys 使用相关

1)Keys 用法以下
面试突击 | Redis 如何从海量数据中查询出某一个 Key?视频版微信

2)Keys 存在的问题ide

此命令没有分页功能,咱们只能一次性查询出全部符合条件的 key 值,若是查询结果很是巨大,那么获得的输出信息也会很是多;
keys 命令是遍历查询,所以它的查询时间复杂度是 o(n),因此数据量越大查询时间就越长。
4 Scan 使用相关code

咱们先来模拟海量数据,使用 Pipeline 添加 10w 条数据,Java 代码实现以下:视频

import redis.clients.jedis.Jedis;
import redis.clients.jedis.Pipeline;
import utils.JedisUtils;

public class ScanExample {
    public static void main(String[] args) {
        // 添加 10w 条数据
        initData();
    }
    public static void initData(){
        Jedis jedis = JedisUtils.getJedis();
        Pipeline pipe = jedis.pipelined();
        for (int i = 1; i < 100001; i++) {
            pipe.set("user_token_" + i, "id" + i);
        }
        // 执行命令
        pipe.sync();
        System.out.println("数据插入完成");
    }
}

咱们来查询用户 id 为 9999* 的数据,Scan 命令使用以下: blog

127.0.0.1:6379> scan 0 match user_token_9999* count 10000
1) "127064"
2) 1) "user_token_99997"
127.0.0.1:6379> scan 127064 match user_token_9999* count 10000
1) "1740"
2) 1) "user_token_9999"
127.0.0.1:6379> scan 1740 match user_token_9999* count 10000
1) "21298"
2) 1) "user_token_99996"
127.0.0.1:6379> scan 21298 match user_token_9999* count 10000
1) "65382"
2) (empty list or set)
127.0.0.1:6379> scan 65382 match user_token_9999* count 10000
1) "78081"
2) 1) "user_token_99998"
   2) "user_token_99992"
127.0.0.1:6379> scan 78081 match user_token_9999* count 10000
1) "3993"
2) 1) "user_token_99994"
   2) "user_token_99993"
127.0.0.1:6379> scan 3993 match user_token_9999* count 10000
1) "13773"
2) 1) "user_token_99995"
127.0.0.1:6379> scan 13773 match user_token_9999* count 10000
1) "47923"
2) (empty list or set)
127.0.0.1:6379> scan 47923 match user_token_9999* count 10000
1) "59751"
2) 1) "user_token_99990"
   2) "user_token_99991"
   3) "user_token_99999"
127.0.0.1:6379> scan 59751 match user_token_9999* count 10000
1) "0"
2) (empty list or set)

从以上的执行结果,咱们看出两个问题:token

  1. 查询的结果为空,但游标值不为 0,表示遍历还没结束;
  2. 设置的是 count 10000,但每次返回的数量都不是 10000,且不固定,这是由于 count 只是限定服务器单次遍历的字典槽位数量 (约等于),而不是规定返回结果的 count 值。
    相关语法:scan cursor [MATCH pattern] [COUNT count]
    其中:
    • cursor:光标位置,整数值,从 0 开始,到 0 结束,查询结果是空,但游标值不为 0,表示遍历还没结束;
    • match pattern:正则匹配字段;
    • count:限定服务器单次遍历的字典槽位数量 (约等于),只是对增量式迭代命令的一种提示 (hint),并非查询结果返回的最大数量,它的默认值是 10。
      5 Scan 代码实战

本文咱们使用 Java 代码来实现 Scan 的查询功能,代码以下:ip

import redis.clients.jedis.Jedis;
import redis.clients.jedis.Pipeline;
import redis.clients.jedis.ScanParams;
import redis.clients.jedis.ScanResult;
import utils.JedisUtils;

public class ScanExample {
    public static void main(String[] args) {
        Jedis jedis = JedisUtils.getJedis();
        // 定义 match 和 count 参数
        ScanParams params = new ScanParams();
        params.count(10000);
        params.match("user_token_9999*");
        // 游标
        String cursor = "0";
        while (true) {
            ScanResult<String> res = jedis.scan(cursor, params);
            if (res.getCursor().equals("0")) {
                // 表示最后一条
                break;
            }
            cursor = res.getCursor(); // 设置游标
            for (String item : res.getResult()) {
                // 打印查询结果
                System.out.println("查询结果:" + item);
            }
        }
    }
}

以上程序执行结果以下:

查询结果:user_token_99997
查询结果:user_token_9999
查询结果:user_token_99996
查询结果:user_token_99998
查询结果:user_token_99992
查询结果:user_token_99994
查询结果:user_token_99993
查询结果:user_token_99995
查询结果:user_token_99990
查询结果:user_token_99991
查询结果:user_token_99999

6 总结

经过本文咱们了解到,Redis 中若是要在海量的数据数据中,查询某个数据应该使用 Scan,Scan 具备如下特征:

  1. Scan 能够实现 keys 的匹配功能;
  2. Scan 是经过游标进行查询的不会致使 Redis 假死;
  3. Scan 提供了 count 参数,能够规定遍历的数量;
  4. Scan 会把游标返回给客户端,用户客户端继续遍历查询;
  5. Scan 返回的结果可能会有重复数据,须要客户端去重;
  6. 单次返回空值且游标不为 0,说明遍历还没结束;
  7. Scan 能够保证在开始检索以前,被删除的元素必定不会被查询出来;
  8. 在迭代过程当中若是有元素被修改, Scan 不保证能查询出相关的元素。
    7 视频版

【END】
近期热文

阿里巴巴2020招聘正式启动!附内推和微信联系信息
面试珍藏:最多见的200多道Java面试题(2019年最新版)
阿里面试官给你的一些忠告,这样作确定错不了!附视频
Java面试详解(2020版):500+ 面试题和核心知识点详解

关注下方二维码,订阅更多精彩内容

面试突击 | Redis 如何从海量数据中查询出某一个 Key?视频版

相关文章
相关标签/搜索