news 2026/6/25 12:23:57

HarfBuzz概览

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
HarfBuzz概览

本文主要介绍:

1)什么是HarfBuzz

2)HarfBuzz名称来源

3)为什么需要HarfBuzz

4)HarfBuzz能做什么

5)HarfBuzz不能做什么

6)哪些平台在使用HarfBuzz

可以直接跳转感兴趣部分阅读。

一、什么是HarfBuzz

HarfBuzz 是一个用 C++ 编写的文字塑形引擎(Text Shaping),即将字符序列转换成字形序列(Glyph)。

二、HarfBuzz的名称来源

HarfBuzz的作者是Behdad Esfahbod(贝赫达德·埃斯法赫博德),HarfBuzz的命名最初来自于该作者​对 OpenType 的波斯语翻译​。

三、为什么需要HarfBuzz

我们回答清楚以下几个问题,「为什么需要HarfBuzz」这个问题就理解了。

1)一段字符串从输入到上屏,需要经历哪些过程?

可以用下面这张图概括:详细的流程可以参考从0到1自定义文字排版引擎:原理篇

在这里插入图片描述

图中红色部分就是HarfBuzz所能做的事情。

Text Shaping/文本塑形就是将一串 Unicode 字符码点(Codepoints),根据字体中的规则,转换为一串有序的字形(Glyphs)序列及其位置信息的过程。

2)为什么不能把字符串里的字符直接从字体文件里拿出来画在屏幕上?

在一文读懂Fon文件一文中,我们知道了Font文件中存储着字符的位图信息,那能直接取出每个字符的位图进行绘制吗,答案当然是不可以!

举几个例子:

例子一:

在 Tamil(泰米尔语)语言规则中,当字母“ட”后接元音符号“ு”时,这一对字符必须替换为单个字形“டு”,即字符序列 “ட,ு” 需要用字体中的单个“டு”字形来替代。

例子二:

在配置了连字 feature 的应用中,当遇到 f 和 i 相遇时,在很多英文字体中会合并成一个单独的 fi 字形。

以上这些连字、重排、字形替换等处理,都是在Shaping阶段完成的。

四、HarfBuzz能做什么

1)塑形

沿用上面对塑形的解释:HarfBuzz可以将一串 Unicode 字符码点(Codepoints),根据字体中的规则,转换为一串有序的字形(Glyphs)序列及其位置信息。

可以用下面这张图来概括HarfBuzz的塑形流程:

在这里插入图片描述

图片来自:https://mrandri19.github.io/2019/07/24/modern-text-rendering-linux-overview.html

可以看出

​HarfBuzz的输入是​:字体文件 + 分段好的字符

​HarfBuzz的输出是​:字形信息(Glyph)、position、kerning等

2)字体处理

除了核心的塑形功能,HarfBuzz还提供了访问其他字体功能的函数,比如:GSUB和GPOS表,可变字体,彩色字体,字体子集化等。

五、HarfBuzz不能做什么

1)HarfBuzz 不会处理双向文本问题

如果想排版LTR、RTL(如希伯来语、阿拉伯语)混排的字符串,需要确保在提交给HarfBuzz的输入中,字符串的顺序是一致的。

也就是在将文本输入HarfBuzz之前,需要进行分段。

2)HarfBuzz无法处理包含不同字体属性的文本

比如,对于字符串“a huge breakfast”,其中“huge”希望是斜体,那么我们需要向 HarfBuzz 分开发送三个字符串:

使用罗马字体的a

使用斜体字体的huge

以及再次使用罗马字体的breakfast。

同样,如果在字符串中包含不同的字体、字号、字体样式、语言或方向,那么需要独立地对每个文本段进行塑形。

HarfBuzz在处理字符串时要求字符串具有相同的属性。

3)HarfBuzz不会处理换行、连字符或对齐

HarfBuzz会​将字符串排列在一条理论上长度无限的单行上,​如果想找出文本中可能的单词、句子和换行点,需要使用ICU库的断句函数。

六、哪些平台在使用HarfBuzz

在这里插入图片描述

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/24 22:01:40

如何正确删除电脑的缓存文件?

新的电脑总是好的,各种干净整洁无垃圾。 还是新的好 表情包 使用了一段时间之后,小伙伴们就会发现电脑C盘飙红了。然后就各种论坛查找清除电脑垃圾的方法。 电脑正常使用下,是会产生很多缓存的,所以C盘红了也很正常。除非电脑组…

作者头像 李华
网站建设 2026/6/24 8:19:14

[python] 代码性能分析工具line_profiler使用指北

码分析能够评估各部分代码的时间消耗,即进行时间复杂度分析。通过这一过程,我们可以识别影响整体运行效率的关键部分,从而更高效地利用底层计算资源。此外,代码分析也可用于评估内存使用情况,即空间复杂度,…

作者头像 李华
网站建设 2026/6/24 16:56:36

《手搓》线程池

一、什么是《手搓》线程池手搓线程池并不是用来完全代替系统线程池的你可以把手搓线程池看做系统线程池的一部分就好比在东海用集装箱搞养殖一个集装箱里养鱼另一个集装箱里养虾搞好隔离,鱼虾都不耽搁二、最常用线程池的场景是什么当然是Task,是用TaskFactory.StartNew方法创建…

作者头像 李华
网站建设 2026/6/25 7:23:32

【MUSIC、最大似然与克拉美-罗下界】MUSIC与ESPRIT 算法来估计到达角(AoA),并尝试推导克拉美-罗下界(CRLB)以分析其性能研究附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…

作者头像 李华
网站建设 2026/6/22 21:19:24

LLM 场景下的强化学习技术扫盲

强化学习基础:行业黑话想象你正在和一个刚训练好的语言模型聊天。你问:“今天过得怎么样?”模型可能回:“还行。” 也可能回:“我是个 AI,没有感情。”人类觉得前者更自然、更友好——这就是偏好反馈。强化…

作者头像 李华