雪花算法中非常好用的数字ID生成器yitter

2023-8-4 1924 0

最佳实践（置顶）

针对大家在测试过程中，经常出现的性能问题，以下给出3组最佳实践配置：

如果生成ID速度不超过5W/s，不用修改任何配置参数

如果生成ID速度超过5W/s，低于50W，推荐修改：SeqBitLength=10

如果生成ID速度超过50W/s，接近500W，推荐修改：SeqBitLength=12

总之，增加 SeqBitLength 会让性能更高，但生成的 ID 也会更长。

算法介绍

这是优化的雪花算法（雪花漂移），它生成的ID更短、速度更快。

支持 k8s 等容器环境自动扩容（自动注册 WorkerId），可在单机或分布式环境生成数字型唯一ID。

原生支持 C#/Java/Go/C/Rust/Python/Node.js/PHP(C扩展)/SQL/ 等语言，并提供多线程安全调用动态库（FFI）。

兼容所有雪花算法（号段模式或经典模式，大厂或小厂），将来你可做任意的升级切换。

这是计算机历史上最全面的雪花ID生成工具。【截至2022年8月】

需求来源

作为架构设计的你，想要解决数据库主键唯一的问题，特别是在分布式系统多数据库中。

你希望数据表主键用最少的存储空间，索引速度更快，Select、Insert 和 Update 更迅速。

你要考虑在分库分表（合库合表）时，主键值可直接使用，并能反映业务时序。

如果这样的主键值太长，超过前端 js Number 类型最大值，须把 Long 型转换为 String 型，你会觉得有点沮丧。

尽管 Guid 能自增，但占用空间大，索引速度慢，你不想用它。

应用实例可能超过50个，每个并发请求可达10W/s。

要在容器环境部署应用，支持水平复制、自动扩容。

不想依赖 redis 的自增操作获得连续的主键ID，因为连续的ID存在业务数据安全风险。

你希望系统运行 100 年以上。

传统算法问题

生成的ID太长。

瞬时并发量不够。

不能解决时间回拨问题。

不支持后补生成前序ID。

可能依赖外部存储系统。

新算法特点

整形数字，随时间单调递增（不一定连续），长度更短，用50年都不会超过 js Number类型最大值。（默认配置）

速度更快，是传统雪花算法的2-5倍，0.1秒可生成50万个（基于8代低压i7）。

支持时间回拨处理。比如服务器时间回拨1秒，本算法能自动适应生成临界时间的唯一ID。

支持手工插入新ID。当业务需要在历史时间生成新ID时，用本算法的预留位能生成5000个每秒。

不依赖任何外部缓存和数据库。（k8s环境下自动注册 WorkerId 的动态库依赖 redis）

基础功能，开箱即用，无需配置文件、数据库连接等。

性能数据

极致性能：500W/s~3000W/s。（所有测试数据均基于8代低压i7计算）

如何处理时间回拨

当发生系统时间回拨时，算法采用过去时序的预留序数生成新的ID。

回拨生成的ID序号，默认靠前，也可以调整为靠后。

允许时间回拨至本算法预设基数（参数可调）。

ID组成说明

本算法生成的ID由3部分组成（沿用雪花算法定义）：

+-------------------------+--------------+----------+

| 1.相对基础时间的时间差 | 2.WorkerId | 3.序列数 |

+-------------------------+--------------+----------+

第1部分，时间差，是生成ID时的系统时间减去 BaseTime 的总时间差（毫秒单位）。

第2部分，WorkerId，是区分不同机器或不同应用的唯一ID，最大值由 WorkerIdBitLength（默认6）限定。

第3部分，序列数，是每毫秒下的序列数，由参数中的 SeqBitLength（默认6）限定。

能用多久

能用多久的解释，是指生成的ID数字，何时能增长到超过 long（有符号64位，8字节）最大值。

在默认配置下，ID可用 71000 年不重复。

在支持 1024 个工作节点时，ID可用 4480 年不重复。

在支持 4096 个工作节点时，ID可用 1120 年不重复。

参数设置

WorkerIdBitLength，机器码位长，决定 WorkerId 的最大值，默认值6，取值范围 [1, 19]，实际上有些语言采用无符号 ushort (uint16) 类型接收该参数，所以最大值是16，如果是采用有符号 short (int16)，则最大值为15。

WorkerId，机器码，最重要参数，无默认值，必须全局唯一（或相同 DataCenterId 内唯一），必须程序设定，缺省条件（WorkerIdBitLength取默认值）时最大值63，理论最大值 2^WorkerIdBitLength-1（不同实现语言可能会限定在 65535 或 32767，原理同 WorkerIdBitLength 规则）。不同机器或不同应用实例不能相同，你可通过应用程序配置该值，也可通过调用外部服务获取值。针对自动注册WorkerId需求，本算法提供默认实现：通过 redis 自动注册 WorkerId 的动态库，详见“Tools\AutoRegisterWorkerId”。

特别提示：如果一台服务器部署多个独立服务，需要为每个服务指定不同的 WorkerId。

SeqBitLength，序列数位长，默认值6，取值范围 [3, 21]（建议不小于4），决定每毫秒基础生成的ID个数。如果每秒请求数不超过5W，保持默认值6即可；如果超过5W，不超过50W，建议赋值10或更大，以此类推。规则要求：WorkerIdBitLength + SeqBitLength 不超过 22。

MinSeqNumber，最小序列数，默认值5，取值范围 [5, MaxSeqNumber]，每毫秒的前5个序列数对应编号0-4是保留位，其中1-4是时间回拨相应预留位，0是手工新值预留位。

MaxSeqNumber，最大序列数，设置范围 [MinSeqNumber, 2^SeqBitLength-1]，默认值0，真实最大序列数取最大值（2^SeqBitLength-1），不为0时，取其为真实最大序列数，一般无需设置，除非多机共享WorkerId分段生成ID（此时还要正确设置最小序列数）。

BaseTime，基础时间（也称：基点时间、原点时间、纪元时间），有默认值（2020年），是毫秒时间戳（是整数，.NET是DatetTime类型），作用是：用生成ID时的系统时间与基础时间的差值（毫秒数）作为生成ID的时间戳。基础时间一般无需设置，如果觉得默认值太老，你可以重新设置，不过要注意，这个值以后最好不变。

第二版计划增加参数：

DataCenterId，数据中心ID（机房ID，默认0），请确保全局唯一。

DataCenterIdBitLength，数据中心ID长度（默认0）。

TimestampType，时间戳类型（0-毫秒，1-秒），默认0。

配置变更

配置变更是指系统运行一段时间后，再调整运行参数（IdGeneratorOptions 对象属性），请注意：

1.首要原则是：BaseTime 只能更旧（距现在更远），让生成的ID值较历史最大值更大，确保没有时间重叠区，不产生重复ID。[不推荐在系统运行之后调整 BaseTime]

2.任何时候增加 WorkerIdBitLength 或 SeqBitLength，都是允许的，但应慎用 “减小”操作，因为这可能导致在未来某天生成的 ID 与旧配置时相同。[允许在系统运行之后增加任何一个 xxxBitLength 值]

3.如果必须减小 WorkerIdBitLength 或 SeqBitLength 其中的一项，一定要满足条件：新的两个 xxxBitLength 之和要大于旧值之和。[不推荐在运行之后缩小任何一个 BitLength 值]

4.上述3条规则，并未在本算法内做逻辑控制，使用者应在确认新配置符合要求后，再实施配置变更。

自动注册WorkerId

唯一ID生成器，依赖WorkerId，当业务服务需要水平无差别复制（自动扩容）时，这就要求能自动注册全局唯一WorkerId，然后才能生产唯一ID。

本算法提供开源动态库（go语言实现），能在容器 k8s 等容器环境下，通过 redis 自动注册 WorkerId。

通过redis注册WorkerId，并非唯一方法。你还可以开发中心化的配置服务，各端点服务启动时，通过中心服务获取唯一 WorkerId。

当然，如果你的服务无需自动扩容，那就不必自动注册WorkerId，而是为它们分别设置全局唯一值。

方法还有很多，例如：开发中心化的ID生成服务，由它为各端点服务（单个或批量）生成可用ID。

使用示例，POM引入：

<dependency>
    <groupId>com.github.yitter</groupId>
    <artifactId>yitter-idgenerator</artifactId>
    <version>1.0.6</version>
</dependency>

示例代码：

package com.example.springboot.tool.creator;

import com.github.yitter.contract.IdGeneratorOptions;
import com.github.yitter.idgen.YitIdHelper;

/**
 * 多语言新雪花算法（SnowFlake IdGenerator）
 * https://gitee.com/yitter/idgenerator
 */
public class SnowflakeByYitter {
    public static void main(String[] args) {
        IdGeneratorOptions options = new IdGeneratorOptions();
        // 雪花计算方法 （1-漂移算法|2-传统算法），默认1
        options.Method = 1;
        // 机器码 必须由外部设定，最大值 2^WorkerIdBitLength-1
        // 默认值6，限定 WorkerId 最大值为2^6-1，即默认最多支持64个节点。
        options.WorkerId = 1;
        // 序列数位长 默认值6，取值范围 [3, 21]（要求：序列数位长+机器码位长不超过22）
        // 默认值6，限制每毫秒生成的ID个数。若生成速度超过5万个/秒，建议加大 SeqBitLength 到 10。
        options.SeqBitLength = 6;
        // 基础时间（ms单位） 不能超过当前系统时间
        // 如果要兼容老系统的雪花算法，此处应设置为老系统的BaseTime。
        // options.BaseTime = 1582206693000L;
        // 机器码位长 默认值6，取值范围 [1, 15]（要求：序列数位长+机器码位长不超过22）
        options.WorkerIdBitLength = 6;
        // 序列数位长 默认值6，取值范围 [3, 21]（要求：序列数位长+机器码位长不超过22）
        options.SeqBitLength = 6;

        // 保存参数（务必调用，否则参数设置不生效）：
        YitIdHelper.setIdGenerator(options);

        long newId = YitIdHelper.nextId();
        System.out.println("=====================================");
        System.out.println("生成Id：" + newId);
    }

}

雪花算法中非常好用的数字ID生成器

参数可以参考源码。

上一篇: Minio的安装和Java使用示例

下一篇: dynamic动态数据源编码切换数据源