news 2026/6/10 2:51:15

xxHash vs MurmurHash3:非加密哈希的王者之争

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
xxHash vs MurmurHash3:非加密哈希的王者之争

背景

长久以来,MD5 这个名字几乎成了“文件校验”的代名词。然而,在非加密哈希领域,更为现代的xxHash128和MurmurHash3都是顶尖算法,但它们在设计哲学、性能特征和适用场景上各有侧重。下来我们简单介绍两个算法的差异,然后实际上手测试比较。

核心对比

特性维度

xxHash (XXH3)

MurmurHash3

设计理念

大块数据现代CPU优化

短键哈希表优化

诞生时间

2019年(XXH3)

2011年

性能焦点

极致吞吐量,特别是>1KB数据

优异的随机分布,均衡性能

速度(现代CPU)

极快

较快

小数据性能

良好

优秀

随机分布质量

良好

极好

硬件优化

深度SIMD优化(AVX2等)

少量SIMD使用

可移植性

需考虑SIMD支持

高度可移植

社区采用

快速增长

RocksDB、ClickHouse等

广泛

Redis、Spark、Cassandra等

键值测试

无论是在数据库键值存储、数据键去重、分布式系统还是机器学习中,mmh3 均能发挥其强大的作用。

大块测试

本次测试的 cpu 是 Intel(R) Xeon(R) Silver 4214 CPU @ 2.20GHz,测试数据为 os.urandom() 生成内存数据。加入MD5作为基准,分别测试4KB、8KB、64KB、256KB、1MB、10MB、100MB的哈希计算耗时

数据大小

MD5耗时

单位 ms

mmh3-128

单位 ms

xxHash128耗时

单位 ms

说明

1KB

0.008

1.800

0.004

4KB

0.014

1.791

0.004

16KB

0.036

1.798

0.006

32KB

0.067

1.813

0.008

64KB

0.136

1.809

0.012

256KB

0.498

1.872

0.038

1MB

1.961

2.036

0.139

10MB

19.465

4.178

1.379

100MB

194.403

23.938

14.794

从测试可以看出,xxHash128 在1KB以及以上的数据大小上都表现最优,特别是对于大数据量,优势极为明显。实际测试上,xxHash128 比 MD5 能快 10 倍以上,在大块数据表现上是绝对的哈希王者。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/5 18:07:51

深度学习毕设选题推荐:基于python深度学习的餐桌美食识别机器学习

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/5/29 1:23:51

Vue3 项目本地图片正常显示,打包后无法显示

在 Vue3 项目开发过程中,常出现本地开发环境下图片显示正常,但执行打包构建后,图片无法加载(常见表现为 404 错误)的问题。该问题核心源于本地开发与生产打包的资源解析规则差异、路径配置不当或静态资源处理逻辑疏漏&…

作者头像 李华
网站建设 2026/5/29 0:47:29

站在2026望“十五五”:电力招标网助力清洁能源,共赴绿色发展新程

站在2026年的起点,回首2025年,我国清洁能源领域成绩斐然,为经济发展注入了强劲的“绿色”动能。在“双碳”目标的引领下,一大批清洁能源项目建成投产,不仅夯实了能源保供的基础,更成为经济稳增长的重要支撑…

作者头像 李华
网站建设 2026/5/28 17:11:44

云上稳着陆,就找天翼云Landing Zone!

在数字化转型浪潮中 越来越多大型企业将业务迁移至云端 然而,随着云系统增多 资源庞杂、权限交错 云上管理往往变得像一团“乱麻” 运维成本高、协作效率低、安全隐患多 正是许多企业 “上云容易管云难”的真实写照如何让企业在上云之初 就建立起清晰、安全、高效的…

作者头像 李华