最佳实践(置顶)
针对大家在测试过程中,经常出现的性能问题,以下给出3组最佳实践配置:
如果生成ID速度不超过5W/s,不用修改任何配置参数
如果生成ID速度超过5W/s,低于50W,推荐修改:SeqBitLength=10
如果生成ID速度超过50W/s,接近500W,推荐修改:SeqBitLength=12
总之,增加 SeqBitLength 会让性能更高,但生成的 ID 也会更长。
算法介绍
这是优化的雪花算法(雪花漂移),它生成的ID更短、速度更快。
支持 k8s 等容器环境自动扩容(自动注册 WorkerId),可在单机或分布式环境生成数字型唯一ID。
原生支持 C#/Java/Go/C/Rust/Python/Node.js/PHP(C扩展)/SQL/ 等语言,并提供多线程安全调用动态库(FFI)。
兼容所有雪花算法(号段模式或经典模式,大厂或小厂),将来你可做任意的升级切换。
这是计算机历史上最全面的雪花ID生成工具。【截至2022年8月】
需求来源
作为架构设计的你,想要解决数据库主键唯一的问题,特别是在分布式系统多数据库中。
你希望数据表主键用最少的存储空间,索引速度更快,Select、Insert 和 Update 更迅速。
你要考虑在分库分表(合库合表)时,主键值可直接使用,并能反映业务时序。
如果这样的主键值太长,超过前端 js Number 类型最大值,须把 Long 型转换为 String 型,你会觉得有点沮丧。
尽管 Guid 能自增,但占用空间大,索引速度慢,你不想用它。
应用实例可能超过50个,每个并发请求可达10W/s。
要在容器环境部署应用,支持水平复制、自动扩容。
不想依赖 redis 的自增操作获得连续的主键ID,因为连续的ID存在业务数据安全风险。
你希望系统运行 100 年以上。
传统算法问题
生成的ID太长。
瞬时并发量不够。
不能解决时间回拨问题。
不支持后补生成前序ID。
可能依赖外部存储系统。
新算法特点
整形数字,随时间单调递增(不一定连续),长度更短,用50年都不会超过 js Number类型最大值。(默认配置)
速度更快,是传统雪花算法的2-5倍,0.1秒可生成50万个(基于8代低压i7)。
支持时间回拨处理。比如服务器时间回拨1秒,本算法能自动适应生成临界时间的唯一ID。
支持手工插入新ID。当业务需要在历史时间生成新ID时,用本算法的预留位能生成5000个每秒。
不依赖任何外部缓存和数据库。(k8s环境下自动注册 WorkerId 的动态库依赖 redis)
基础功能,开箱即用,无需配置文件、数据库连接等。
性能数据
极致性能:500W/s~3000W/s。(所有测试数据均基于8代低压i7计算)
如何处理时间回拨
当发生系统时间回拨时,算法采用过去时序的预留序数生成新的ID。
回拨生成的ID序号,默认靠前,也可以调整为靠后。
允许时间回拨至本算法预设基数(参数可调)。
ID组成说明
本算法生成的ID由3部分组成(沿用雪花算法定义):
+-------------------------+--------------+----------+
| 1.相对基础时间的时间差 | 2.WorkerId | 3.序列数 |
+-------------------------+--------------+----------+
第1部分,时间差,是生成ID时的系统时间减去 BaseTime 的总时间差(毫秒单位)。
第2部分,WorkerId,是区分不同机器或不同应用的唯一ID,最大值由 WorkerIdBitLength(默认6)限定。
第3部分,序列数,是每毫秒下的序列数,由参数中的 SeqBitLength(默认6)限定。
能用多久
能用多久的解释,是指生成的ID数字,何时能增长到超过 long(有符号64位,8字节)最大值。
在默认配置下,ID可用 71000 年不重复。
在支持 1024 个工作节点时,ID可用 4480 年不重复。
在支持 4096 个工作节点时,ID可用 1120 年不重复。
参数设置
WorkerIdBitLength,机器码位长,决定 WorkerId 的最大值,默认值6,取值范围 [1, 19],实际上有些语言采用 无符号 ushort (uint16) 类型接收该参数,所以最大值是16,如果是采用 有符号 short (int16),则最大值为15。
WorkerId,机器码,最重要参数,无默认值,必须 全局唯一(或相同 DataCenterId 内唯一),必须 程序设定,缺省条件(WorkerIdBitLength取默认值)时最大值63,理论最大值 2^WorkerIdBitLength-1(不同实现语言可能会限定在 65535 或 32767,原理同 WorkerIdBitLength 规则)。不同机器或不同应用实例 不能相同,你可通过应用程序配置该值,也可通过调用外部服务获取值。针对自动注册WorkerId需求,本算法提供默认实现:通过 redis 自动注册 WorkerId 的动态库,详见“Tools\AutoRegisterWorkerId”。
特别提示:如果一台服务器部署多个独立服务,需要为每个服务指定不同的 WorkerId。
SeqBitLength,序列数位长,默认值6,取值范围 [3, 21](建议不小于4),决定每毫秒基础生成的ID个数。如果每秒请求数不超过5W,保持默认值6即可;如果超过5W,不超过50W,建议赋值10或更大,以此类推。规则要求:WorkerIdBitLength + SeqBitLength 不超过 22。
MinSeqNumber,最小序列数,默认值5,取值范围 [5, MaxSeqNumber],每毫秒的前5个序列数对应编号0-4是保留位,其中1-4是时间回拨相应预留位,0是手工新值预留位。
MaxSeqNumber,最大序列数,设置范围 [MinSeqNumber, 2^SeqBitLength-1],默认值0,真实最大序列数取最大值(2^SeqBitLength-1),不为0时,取其为真实最大序列数,一般无需设置,除非多机共享WorkerId分段生成ID(此时还要正确设置最小序列数)。
BaseTime,基础时间(也称:基点时间、原点时间、纪元时间),有默认值(2020年),是毫秒时间戳(是整数,.NET是DatetTime类型),作用是:用生成ID时的系统时间与基础时间的差值(毫秒数)作为生成ID的时间戳。基础时间一般无需设置,如果觉得默认值太老,你可以重新设置,不过要注意,这个值以后最好不变。
第二版计划增加参数:
DataCenterId,数据中心ID(机房ID,默认0),请确保全局唯一。
DataCenterIdBitLength,数据中心ID长度(默认0)。
TimestampType,时间戳类型(0-毫秒,1-秒),默认0。
配置变更
配置变更是指系统运行一段时间后,再调整运行参数(IdGeneratorOptions 对象属性),请注意:
1.首要原则是:BaseTime 只能更旧(距现在更远),让生成的ID值较历史最大值更大,确保没有时间重叠区,不产生重复ID。[不推荐 在系统运行之后调整 BaseTime]
2.任何时候增加 WorkerIdBitLength 或 SeqBitLength,都是允许的,但应慎用 “减小”操作,因为这可能导致在未来某天生成的 ID 与旧配置时相同。[允许在系统运行之后 增加 任何一个 xxxBitLength 值]
3.如果必须减小 WorkerIdBitLength 或 SeqBitLength 其中的一项,一定要满足条件:新的两个 xxxBitLength 之和要大于旧值之和。[不推荐 在运行之后缩小任何一个 BitLength 值]
4.上述3条规则,并未在本算法内做逻辑控制,使用者应在确认新配置符合要求后,再实施配置变更。
自动注册WorkerId
唯一ID生成器,依赖WorkerId,当业务服务需要水平无差别复制(自动扩容)时,这就要求能自动注册全局唯一WorkerId,然后才能生产唯一ID。
本算法提供开源动态库(go语言实现),能在容器 k8s 等容器环境下,通过 redis 自动注册 WorkerId。
通过redis注册WorkerId,并非唯一方法。你还可以开发中心化的配置服务,各端点服务启动时,通过中心服务获取唯一 WorkerId。
当然,如果你的服务无需自动扩容,那就不必自动注册WorkerId,而是为它们分别设置全局唯一值。
方法还有很多,例如:开发中心化的ID生成服务,由它为各端点服务(单个或批量)生成可用ID。
使用示例,POM引入:
<dependency> <groupId>com.github.yitter</groupId> <artifactId>yitter-idgenerator</artifactId> <version>1.0.6</version> </dependency>
示例代码:
package com.example.springboot.tool.creator; import com.github.yitter.contract.IdGeneratorOptions; import com.github.yitter.idgen.YitIdHelper; /** * 多语言新雪花算法(SnowFlake IdGenerator) * https://gitee.com/yitter/idgenerator */ public class SnowflakeByYitter { public static void main(String[] args) { IdGeneratorOptions options = new IdGeneratorOptions(); // 雪花计算方法 (1-漂移算法|2-传统算法),默认1 options.Method = 1; // 机器码 必须由外部设定,最大值 2^WorkerIdBitLength-1 // 默认值6,限定 WorkerId 最大值为2^6-1,即默认最多支持64个节点。 options.WorkerId = 1; // 序列数位长 默认值6,取值范围 [3, 21](要求:序列数位长+机器码位长不超过22) // 默认值6,限制每毫秒生成的ID个数。若生成速度超过5万个/秒,建议加大 SeqBitLength 到 10。 options.SeqBitLength = 6; // 基础时间(ms单位) 不能超过当前系统时间 // 如果要兼容老系统的雪花算法,此处应设置为老系统的BaseTime。 // options.BaseTime = 1582206693000L; // 机器码位长 默认值6,取值范围 [1, 15](要求:序列数位长+机器码位长不超过22) options.WorkerIdBitLength = 6; // 序列数位长 默认值6,取值范围 [3, 21](要求:序列数位长+机器码位长不超过22) options.SeqBitLength = 6; // 保存参数(务必调用,否则参数设置不生效): YitIdHelper.setIdGenerator(options); long newId = YitIdHelper.nextId(); System.out.println("====================================="); System.out.println("生成Id:" + newId); } }
参数可以参考源码。
Java小强
未曾清贫难成人,不经打击老天真。
自古英雄出炼狱,从来富贵入凡尘。
发表评论: