news 2026/5/6 5:28:54

雪花算法ID重复了?惨痛教训:请勿轻易造轮子!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
雪花算法ID重复了?惨痛教训:请勿轻易造轮子!

来源:juejin.cn/post/7507203999102648360

👉 欢迎加入小哈的星球,你将获得:专属的项目实战(多个项目) / 1v1 提问 /Java 学习路线 /学习打卡 / 每月赠书 / 社群讨论

  • 新项目:《Spring AI 项目实战》正在更新中..., 基于 Spring AI + Spring Boot 3.x + JDK 21;

  • 《从零手撸:仿小红书(微服务架构)》 已完结,基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍;演示地址:http://116.62.199.48:7070/

  • 《从零手撸:前后端分离博客项目(全栈开发)》2期已完结,演示链接:http://116.62.199.48/;

  • 专栏阅读地址:https://www.quanxiaoha.com/column

截止目前,累计输出 100w+ 字,讲解图 4013+ 张,还在持续爆肝中..后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,Spring Cloud Alibaba 等等,戳我加入学习,解锁全部项目,已有4100+小伙伴加入

最近我们线上系统发生了一起严重事故:订单号/流水号出现了重复,影响了核心业务流程。最终定位到根源:一个自研的二方包雪花算法ID生成器出现了问题。

下面我们来回顾一下雪花算法的标准结构,分析问题出在哪,并总结一些通用的设计建议。

一、标准雪花算法(Snowflake)

标准的Snowflake ID由一个64位long型整数构成:

+----------------------------------------------------------------------------------------------------+ | 1 Bit | 41 Bits 时间戳 | 5 Bits 数据中心ID | 5 Bits 机器ID | 12 Bits 序列号 | +----------------------------------------------------------------------------------------------------+
  • 1位符号位:始终为0,确保生成正数。

  • 41位时间戳:记录与固定起始时间的毫秒差,可支持约69年。

  • 10位机器ID:用于标识不同节点。

  • 12位序列号:在同一毫秒内生成多个ID时使用,最多支持每毫秒生成4096个ID。

优点:

  • 高性能生成唯一ID,按时间有序,适用于分布式环境。

二、我们的“定制版”雪花算法:问题在哪?

我们使用的二方包雪花算法结构如下(根据排查推测):

+----------------------------------------------------------------------------------------------------+ | 31 Bits 时间戳Delta | 13 Bits 数据中心ID | 4 Bits 工作ID | 8 Bits 业务ID | 8 Bits 序列号 | +----------------------------------------------------------------------------------------------------+

看起来字段丰富,但存在严重问题:

1. 时间戳仅保留31位,最多支持24.85天!
  • 左移33位后只用31位时间戳,

  • 超过 2^31 毫秒后开始循环,

  • 我们自定义的起始时间是2018年,2025年时早已绕了无数圈。

2. BusinessId 用的是 IP 最后一段

使用的IPy用点分隔的最后一位,即192.168.0.1的1,极容易重复。

3. WorkId 和 DataCenterId 未配置,全为0

相当于所有实例共享同一节点标识,唯一性形同虚设。

最终结果:时间轮回 + IP冲突 + 序列重复,ID彻底撞车。

三、教训总结

通用组件不建议自研

雪花算法涉及时钟回拨、位运算、分布式协调等关键细节,成熟组件更稳妥。

不盲信二方包

无论谁写的代码,都要看清实现逻辑,理解其唯一性保障机制。

合理设置机器ID

靠IP后缀太脆弱,建议集中规划,统一分配Worker ID和DataCenter ID。

提前覆盖边界场景

模拟长时间运行、序列号溢出、时间回拨等极端情况,确保系统稳健。

四、推荐做法

使用成熟的开源实现,如 Hutool、Baomidou 等:

// Hutool 示例 Snowflake snowflake = IdUtil.getSnowflake(1, 1); long id = snowflake.nextId(); // Baomidou 示例(支持从 IP/MAC 自动推导,也可手动指定) DefaultIdentifierGenerator generator = new DefaultIdentifierGenerator(1, 1); // workerId=1, dataCenterId=1 long id = generator.nextId("user");

对于中大型系统,DataCenterId 一般用来标识不同的机房或者 AZ (Availability Zone)。

WorkerId 的配置策略可以根据系统规模逐步演进:

  • 简单方式:通过配置文件手动指定。这种方式配置简便,适用于开发环境或单机部署。

  • 标准方式:将 IP 与端口号(或进程号)拼接后进行哈希,再对 WorkerId 总数取模。具备一定自动化能力,不依赖外部系统,适用于中小规模部署。

  • 中级方案:依赖注册中心(如 Eureka、Nacos),在服务注册时分配编号,结合服务ID保障唯一性。

  • 高级方案:使用 Redis、Zookeeper 等集中协调 WorkerId 分配与释放,支持动态扩容、避免冲突。

随着系统规模扩大,推荐逐步引入更复杂但更稳妥的机制,避免一开始就过度设计。

五、其它建议:不要将业务标志拼入ID中

有时我们为了确保唯一性,会试图将业务信息(如类型前缀、模块编号)拼接进ID。但这种做法会带来一系列问题:

  • 会导致 ID 非全数字,失去原本按时间递增的排序特性,影响数据库索引效率;

  • ID长度变得不规则或偏长,可能增加存储成本,也会影响日志展示、用户体验;

  • 若业务字段含义变动,还可能造成数据兼容性问题。

更稳妥的做法是将业务字段单独存储,ID仅用于唯一标识和排序。

六、结语

别为造轮子而造轮子,尤其在通用组件上,不可抱侥幸心理。

👉 欢迎加入小哈的星球,你将获得:专属的项目实战(多个项目) / 1v1 提问 /Java 学习路线 /学习打卡 / 每月赠书 / 社群讨论

  • 新项目:《Spring AI 项目实战》正在更新中..., 基于 Spring AI + Spring Boot 3.x + JDK 21;

  • 《从零手撸:仿小红书(微服务架构)》 已完结,基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17..., 点击查看项目介绍;演示地址:http://116.62.199.48:7070/

  • 《从零手撸:前后端分离博客项目(全栈开发)》2期已完结,演示链接:http://116.62.199.48/;

  • 专栏阅读地址:https://www.quanxiaoha.com/column

截止目前,累计输出 100w+ 字,讲解图 4013+ 张,还在持续爆肝中..后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,Spring Cloud Alibaba 等等,戳我加入学习,解锁全部项目,已有4100+小伙伴加入

1. 我的私密学习小圈子,从0到1手撸企业实战项目~ 2. Spring Task定时任务:3行代码解放双手,告别重复劳动! 3. JDK25都出来了,但为什么很多公司还在坚持用JDK8? 4. 面试官:Git 如何撤回已 Push 的代码?问倒一大片。。。
最近面试BAT,整理一份面试资料《Java面试BATJ通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。 获取方式:点“在看”,关注公众号并回复 Java 领取,更多内容陆续奉上。
PS:因公众号平台更改了推送规则,如果不想错过内容,记得读完点一下“在看”,加个“星标”,这样每次新文章推送才会第一时间出现在你的订阅列表里。 点“在看”支持小哈呀,谢谢啦
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/6 5:27:30

编程实战终极指南:零基础到专家的完整创意项目库

编程实战终极指南:零基础到专家的完整创意项目库 【免费下载链接】app-ideas A Collection of application ideas which can be used to improve your coding skills. 项目地址: https://gitcode.com/GitHub_Trending/ap/app-ideas 你是否曾面对空白编辑器&a…

作者头像 李华
网站建设 2026/4/30 22:46:14

2025年中国生命科学十大进展公布!

中国科协生命科学学会联合体9日公布了2025年度中国生命科学十大进展。此次入选的科研成果中,有6个为知识创新类项目,4个为技术创新类项目,这些成果均面向生命科学前沿和人民生命健康,聚焦本领域的热点和难题,创新性强、…

作者头像 李华
网站建设 2026/5/6 5:28:17

2025年6大AI技术突破论文深度解析

2025年6大AI技术突破论文深度解析 【免费下载链接】ML-Papers-of-the-Week 每周精选机器学习研究论文。 项目地址: https://gitcode.com/GitHub_Trending/ml/ML-Papers-of-the-Week 作为AI研究者和开发者,你是否希望快速掌握2025年最具影响力的机器学习研究成…

作者头像 李华
网站建设 2026/4/30 14:55:47

哪种后端语言能养家糊口?(2025 年市场数据)

我有一支技术全面、经验丰富的小型团队,专注高效交付中等规模外包项目,有需要外包项目的可以联系我2025 选后端语言,真的像下注。押对了:系统跑得快、团队写得顺、老板掏钱也更痛快;押错了:你每天都在跟工具…

作者头像 李华
网站建设 2026/5/3 8:02:40

【鸿蒙开发案例篇】鸿蒙6.0的pdfService与pdfViewManager

大家好,我是V哥。 兄弟们抄家伙!今天给大家分享用鸿蒙6.0的PDF Kit撕碎文档开发防线,全程高能代码扫射,专治各种PDF开发不服!以下基于HarmonyOS 6.0(API 21)的ArkTS实战,弹药已上膛&…

作者头像 李华