Redis 存储对象信息是用 Hash 仍是 String

时间 2021-05-20

标签 html 数据库编程数组缓存网络数据结构 async 编程语言工具栏目 Redis 繁體版

原文原文链接

Redis 内部使用一个 RedisObject 对象来表示全部的 key 和 value，RedisObject 中的 type，则是表明一个 value 对象具体是何种数据类型，它包含字符串（String）、链表（List）、哈希结构（Hash）、集合（Set）、有序集合（Sorted set）。html

平常工做中咱们存储对象信息的时候，通常有两种作法，一种是用 Hash 存储，另外一种是 String 存储。但好像并无所谓的最佳实践，那么实际上到底用什么数据结构存储更好呢？数据库

首先简单回顾下，Redis 的 Hash 和 String 结构。编程

String

String 数据结构是简单的 key-value 类型，value 其实不只是 String，也能够是数字。Redis 中的 String 能够表示不少语义：数组

字符串（bits）
整数
浮点数

这三种类型，Redis 会根据具体的场景完成自动转换，而且根据须要选取底层的承载方式。String 在Redis 内部存储默认就是一个字符串，被 RedisObject 所引用，当遇到 incr、decr 等操做时会转成数值型进行计算，此时 RedisObject 的 encoding 字段为int。缓存

在存储过程当中，咱们能够将用户信息使用 Json 序列化成字符串，而后将序列化后的字符串存入 Redis 进行缓存。网络

因为 Redis 的字符串是动态字符串，能够修改，内部结构相似于 Java 的 ArrayList，采用预分配冗余空间的方式来减小内存的频繁分配。如上图所示，内部为当前字符串实际分配的空间 capacity，通常高于实际字符串长度 len。数据结构

假设咱们要存储的结构是：async

{
  "name": "xiaowang",
  "age": "35"
}

若是此时将此用户信息的 name 改成“xiaoli”，再存到 Redis 中，Redis 是不须要从新分配空间的。并且咱们在读取和存储数据的时候只须要对作 Json 序列化与反序列化，比较方便。编程语言

Hash

Hash 在不少编程语言中都有着很普遍的应用，而在 Redis 中也是如此。在 Redis 中，Hash 经常用来缓存一些对象信息，如用户信息、商品信息、配置信息等，所以也被称为字典（dictionary），Redis 的字典使用 Hash table 做为底层实现，一个 Hash table 里面能够有多个哈希表节点，而每一个哈希表节点保存了字典中的一个键值对。实际上，Redis 数据库底层也是采用 Hash table 来存储键值对的。工具

Redis 的 Hash 至关于 Java 的 HashMap，内部结构实现与 HashMap 一致，即数组+链表结构。只是 reHash 方式不同。

前面说到 String 适合存储用户信息，而 Hash 结构也能够存储用户信息，不过是对每一个字段单独存储，所以能够在查询时获取部分字段的信息，节省网络流量。不过 Redis 的 Hash 的值只能是字符串，存储上面的那个例子还好，若是存储的用户信息变为：

{
  "name": "xiaowang",
  "age": 25,
  "clothes": {
    "shirt": "gray",
    "pants": "read"
  }
}

那么该如何存储"clothes"属性又变成了该用 String 仍是 Hash 的问题。

String 和 Hash 占用内存的比较

既然两种数据结构均可以存储结构体信息。到底哪一种更加合适呢？

首先咱们用代码先插入 10000 条数据，而后用可视化工具来看看内存的占用状况。

const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});


const user = {
  name: 'name12345',
  age: 16,
  avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
  phone: '13111111111',
  email: '1111111@11.email',
  lastLogon: '2021-04-28 10:00:00',
}


async function main() {
  for (let i = 0; i < 10000; i++) {
    await Redis0.set(`String:user:${i}`, Json.Stringify(user));
    await Redis1.hmset(`Hash:user:${i}`, user);
  }
}

main().then(process.exit);

先看 Redis0：

再来看看 Redis1：

能够看到仍是有点差距的，可是差距并不明显。

网友讨论

网上的用户也有一样的疑问，由于值的长度是不肯定的，因此不知道采用 String 仍是 Hash 存储更有效率。

这里我主要给你们翻译下该问题下优质的答案：

适合用 String 存储的状况：

每次须要访问大量的字段
存储的结构具备多层嵌套的时候

适合用 Hash 存储的状况：

在大多数状况中只须要访问少许字段
本身始终知道哪些字段可用，防止使用 mget 时获取不到想要的数据

总结

本文主要介绍了Redis 存储对象信息是用 Hash 仍是 String，建议是大部分状况下使用 String 存储就好，毕竟在存储具备多层嵌套的对象时方便不少，占用的空间也比 Hash 小。当咱们须要存储一个特别大的对象时，并且在大多数状况中只须要访问该对象少许的字段时，能够考虑使用 Hash。

Redis 存储对象信息是用 Hash 仍是 String

String

Hash

String 和 Hash 占用内存的比较

网友讨论

总结

推荐阅读