Twitter snowflake ID 算法之 golang 实现

是什么?

snowflake ID 算法是 twitter 使用的惟一 ID 生成算法,为了知足 Twitter 每秒上万条消息的请求,使每条消息有惟1、有必定顺序的 ID ,且支持分布式生成。node

主要解决了高并发时 ID 生成不重复的问题

结构

snowflake ID 的结构是一个 64 bit 的 int 型数据。git

如图所示 :github

snowflake-id 64 bit

1 bit:不使用,能够是 1 或 0算法

41 bit:记录时间戳 (当前时间戳减去用户设置的初始时间,毫秒表示),可记录最多 69 年的时间戳数据segmentfault

10 bit:用来记录分布式节点 ID,通常每台机器一个惟一 ID,也能够多进程每一个进程一个惟一 ID,最大可部署 1024 个节点安全

12 bit:序列号,用来记录不一样 ID 同一毫秒时的序列号,最多可生成 4096 个序列号并发

时间戳、节点 ID 和序列号的位数能够根据业务自由浮动调整

惟一 ID 原理

假设在一个节点 (机器) 上,节点 ID 惟一,并发时有多个线程去生成 ID。
知足以上条件时,若是多个进程在同一毫秒内生成 ID,那么序列号步进 (加一),这里要保证序列号的操做并发安全,使同一毫秒内生成的 ID 拥有不一样序列号。若是序列号达到上限,则等待这一毫秒结束,在新的毫秒继续步进。分布式

这样保证了:
全部生成的 ID 按时间趋势递增 (有序)
整个分布式系统内不会产生重复 ID (惟一)

用 go 实现的思路

why go ?

go 有封装好的协程 goroutine,能够很好的处理并发,能够加锁保证数据的同步安全,有很好的性能。固然其它语言如 Java、Scala 也是彻底能够的。函数

思路

一、肯定惟一的节点 ID
二、设置一个初始时间戳 (毫秒表示)
三、处理并发时序列号步进和并发安全问题
四、组装各个 bits ,生成最终的 64 bit ID高并发

编码实现

首先咱们要引入基础的模块

import (
    "fmt"        // 测试、打印
    "time"      // 获取时间
    "errors"    // 生成错误
    "sync"      // 使用互斥锁
)

基础常量定义

这里求最大值使用了位运算,-1 的二进制表示为 1 的补码,感兴趣的同窗能够本身算算试试 -1 ^ (-1 << nodeBits) 这里是否是等于 1023
const (
    nodeBits  uint8 = 10          // 节点 ID 的位数
    stepBits  uint8 = 12            // 序列号的位数
    nodeMax   int64 = -1 ^ (-1 << nodeBits)   // 节点 ID 的最大值,用于检测溢出
    stepMax   int64 = -1 ^ (-1 << stepBits)    // 序列号的最大值,用于检测溢出
    timeShift uint8 = nodeBits + stepBits    // 时间戳向左的偏移量
    nodeShift uint8 = stepBits  // 节点 ID 向左的偏移量
)

设置初始时间的时间戳 (毫秒表示),我这里使用 twitter 设置的一个时间,这个能够随意设置 ,比如今的时间靠前便可。

var Epoch int64 = 1288834974657 // timestamp 2006-03-21:20:50:14 GMT

ID 结构和 Node 结构的实现
这里咱们申明一个 int64 的 ID 类型 (这样能够为此类型定义方法,比直接使用 int64 变量更灵活)

type ID int64

Node 结构用来存储一个节点 (机器) 上的基础数据

type Node struct {
    mu sync.Mutex         // 添加互斥锁,保证并发安全
    timestamp int64      // 时间戳部分
    node      int64      // 节点 ID 部分  
    step      int64      // 序列号 ID 部分          
}

获取 Node 类型实例的函数,用于得到当前节点的 Node 实例

func NewNode(node int64) (*Node, error) {
    // 若是超出节点的最大范围,产生一个 error
    if node < 0 || node > nodeMax {
        return nil, errors.New("Node number must be between 0 and 1023")
    }
    // 生成并返回节点实例的指针
    return &Node{
        timestamp: 0,
        node:      node,
        step:       0,
    }, nil
}

最后一步,生成 ID 的方法

func (n *Node) Generate() ID {
    
    n.mu.Lock() // 保证并发安全, 加锁
    defer n.mu.Unlock() // 方法运行完毕后解锁

    // 获取当前时间的时间戳 (毫秒数显示)
    now := time.Now().UnixNano() / 1e6

    if n.timestamp == now {
        // step 步进 1 
        n.step ++

        // 当前 step 用完
        if n.step > stepMax {
            // 等待本毫秒结束
            for now <= n.timestamp {
                now = time.Now().UnixNano() / 1e6
            }
        }

    } else {
        // 本毫秒内 step 用完
        n.step = 0
    }
    
    n.timestamp = now
    // 移位运算,生产最终 ID
    result := ID((now - Epoch) << timeShift | (n.node << nodeShift) | (n.step))

    return result
}

测试

咱们使用循环去开启多个 goroutine 去并发生成 ID,而后使用 map 以 ID 做为键存储,来判断是否生成了惟一的 ID

main 函数代码

func main() {
    // 测试脚本

    // 生成节点实例
    node, err := NewNode(1)

    if err != nil {
        fmt.Println(err)
        return
    }

    ch := make(chan ID)
    count := 10000
    // 并发 count 个 goroutine 进行 snowflake ID 生成
    for i := 0; i < count; i++ {
        go func() {
            id := node.Generate()
            ch <- id
        }()
    }    
        
    defer close(ch)

    m := make(map[ID]int)
    for i := 0; i < count; i++  {
        id := <- ch
        // 若是 map 中存在为 id 的 key, 说明生成的 snowflake ID 有重复
        _, ok := m[id]
        if ok {
            fmt.Printf("ID is not unique!\n")
            return
        }
        // 将 id 做为 key 存入 map
        m[id] = i
    }
    // 成功生成 snowflake ID
    fmt.Println("All ", count, " snowflake ID generate successed!\n")
}

完整的程序实例 :点我查看

上线使用

你能够用 go 的 net/http 包处理并发请求,生成 ID 而且返回 http 响应结果。
Just do it

参考文章

【1】理解分布式id生成算法SnowFlake
【2】bwmarrin/snowflake

相关文章
相关标签/搜索