UUIDpython
UUID是通用惟一识别码(Universally Unique Identifier)的缩写,开放软件基金会(OSF)规范定义了包括网卡MAC地址、时间戳、名字空间(Namespace)、随机或伪随机数、时序等元素。利用这些元素来生成UUID。git
UUID是由128位二进制组成,通常转换成十六进制,而后用String表示。github
550e8400-e29b-41d4-a716-446655440000web
UUID的优势:redis
UUID的缺点:算法
数据库主键自增数据库
你们对于惟一标识最容易想到的就是主键自增,这个也是咱们最经常使用的方法。例如咱们有个订单服务,那么把订单id设置为主键自增便可。flask
单独数据库 记录主键值网络
业务数据库分别设置不一样的自增起始值和固定步长,如并发
第一台 start 1 step 9 第二台 start 2 step 9 第三台 start 3 step 9
优势:
缺点:
Redis
熟悉Redis的同窗,应该知道在Redis中有两个命令Incr,IncrBy,由于Redis是单线程的因此能保证原子性。
优势:
缺点:
雪花算法-Snowflake
Snowflake是Twitter提出来的一个算法,其目的是生成一个64bit的整数:
上面只是一个将64bit划分的标准,固然也不必定这么作,能够根据不一样业务的具体场景来划分,好比下面给出一个业务场景:
这个时候咱们根据上面的场景能够再次合理的划分62bit,QPS几年以内会发展到百万,那么每毫秒就是千级的请求,目前10台机器那么每台机器承担百级的请求,为了保证扩展,后面的循环位能够限制到1024,也就是2^10,那么循环位10位就足够了。
机器三地部署咱们能够用3bit总共8来表示机房位置,当前的机器10台,为了保证扩展到百台那么能够用7bit 128来表示,时间位依然是41bit,那么还剩下64-10-3-7-41-1 = 2bit,还剩下2bit能够用来进行扩展。
时钟回拨
由于机器的缘由会发生时间回拨,咱们的雪花算法是强依赖咱们的时间的,若是时间发生回拨,有可能会生成重复的ID,在咱们上面的nextId中咱们用当前时间和上一次的时间进行判断,若是当前时间小于上一次的时间那么确定是发生了回拨,算法会直接抛出异常.
# Twitter's Snowflake algorithm implementation which is used to generate distributed IDs. # https://github.com/twitter-archive/snowflake/blob/snowflake-2010/src/main/scala/com/twitter/service/snowflake/IdWorker.scala import time import logging class InvalidSystemClock(Exception): """ 时钟回拨异常 """ pass # 64位ID的划分 WORKER_ID_BITS = 5 DATACENTER_ID_BITS = 5 SEQUENCE_BITS = 12 # 最大取值计算 MAX_WORKER_ID = -1 ^ (-1 << WORKER_ID_BITS) # 2**5-1 0b11111 MAX_DATACENTER_ID = -1 ^ (-1 << DATACENTER_ID_BITS) # 移位偏移计算 WOKER_ID_SHIFT = SEQUENCE_BITS DATACENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATACENTER_ID_BITS # 序号循环掩码 SEQUENCE_MASK = -1 ^ (-1 << SEQUENCE_BITS) # Twitter元年时间戳 TWEPOCH = 1288834974657 logger = logging.getLogger('flask.app') class IdWorker(object): """ 用于生成IDs """ def __init__(self, datacenter_id, worker_id, sequence=0): """ 初始化 :param datacenter_id: 数据中心(机器区域)ID :param worker_id: 机器ID :param sequence: 其实序号 """ # sanity check if worker_id > MAX_WORKER_ID or worker_id < 0: raise ValueError('worker_id值越界') if datacenter_id > MAX_DATACENTER_ID or datacenter_id < 0: raise ValueError('datacenter_id值越界') self.worker_id = worker_id self.datacenter_id = datacenter_id self.sequence = sequence self.last_timestamp = -1 # 上次计算的时间戳 def _gen_timestamp(self): """ 生成整数时间戳 :return:int timestamp """ return int(time.time() * 1000) def get_id(self): """ 获取新ID :return: """ timestamp = self._gen_timestamp() # 时钟回拨 if timestamp < self.last_timestamp: logging.error('clock is moving backwards. Rejecting requests until {}'.format(self.last_timestamp)) raise InvalidSystemClock if timestamp == self.last_timestamp: self.sequence = (self.sequence + 1) & SEQUENCE_MASK if self.sequence == 0: timestamp = self._til_next_millis(self.last_timestamp) else: self.sequence = 0 self.last_timestamp = timestamp new_id = ((timestamp - TWEPOCH) << TIMESTAMP_LEFT_SHIFT) | (self.datacenter_id << DATACENTER_ID_SHIFT) | \ (self.worker_id << WOKER_ID_SHIFT) | self.sequence return new_id def _til_next_millis(self, last_timestamp): """ 等到下一毫秒 """ timestamp = self._gen_timestamp() while timestamp <= last_timestamp: timestamp = self._gen_timestamp() return timestamp if __name__ == '__main__': worker = IdWorker(1, 2, 0) print(worker.get_id())