字根组字

2022-06-20 17:57:44.0

分類: 字体技术

「字根组字」为开发的方式之一,顾名思义,即以「字根」为汉字的做小单位,设计出该款字体所需使用的「字根」后,在造字工具中将字根组合成汉字字符,这通称「字根组字」字型开发方式。



字根组字技术业界称为Radical-base,透过此技术开发出来的TrueType字型产品全名称做Radical-base TrueType,简称RTT,透过字根可以重复使用的特性,来大幅降低字型的档案大小,此种方式使用在简体中文具有27,533个大量汉字的GB18030字符集最具有效益,以下使用黑体、楷体为例,说明笔画组字技术与字根组字技术两者在字型档案量大小的差异:

  笔画组字 字根組字
黑体 7 MB 2.5 MB
楷体 18 MB 2.5 MB

注:黑体为文鼎UD晶熙黑体G30,楷体为文鼎楷体G30 /文鼎晶栩楷体G30

有别于笔画组字的字型产品,为何笔画组字技术与字根组字技术两者在字型档案量的大小上有如此大的差异呢?除了利用字根可共享、重复使用的特性外,在字型质量上也可以定义,以常用字的字符,开发质量达到近似于笔画组字高质量的水平,罕用字(大部分使用者一辈子几乎不会用到的字符)使用现有字根,不特别增加字根的方式来组成,虽然定义上质量稍差,但不影响辨别与使用。

近年,以文鼎字型与Dalton Maag承制的企业订制字体案件中,如为HP订制的HP Simplified、为Intel订制的Intel Clear客户就希望字型档案兼容嵌入式系统(embedded system)环境使用的低档案量以及印刷的高质量需求,透过内部技术评估后,即以字根组字方式开发多字重的字型档案交付客户使用。

除了字型档案量的大小外,一般使用者并不容易辨视字根组字的字型产品,目前,一般的使用者使用到透过字根组字技术所开发的产品的机会并不高,主要的原因在于此机制早期是针对嵌入式环境所设计的字体开发方式,现阶段的硬件环境相对于10年前成熟,硬件中的记忆空间容许容纳档案量较大的字型,因此,厂商们开发出来的字型档案都会是以通用的TrueType/OpenType字型为主。


字体技术

units per em

字体设计的工程规格中,有个较少被人提及的专有名词「UPM」,UPM全名为units per em。Em为字体设计上的一个单位,传统上,em指的是活字印刷铅字字身的高度;在现今数字字体设计上,EM化身一个虚拟的数字画布,依字体设计的精细度需要,画分出一个坐标系统网格,这个坐标系统大小的设定值最常见的是1000或2048,这个设定值,就称为units per em,它决定了字体坐标网格的粒度大小。


关于UPM数值的设定,基于TrueType和OpenType TT的字体,UPM的设定值通常为2048,而OpenType PS字体UPM的设定值通常为1000,但是也有设为256或512的情况发生,这样主要是为了达到降低字体档案的数据量或在特殊情境所需要的设定。

这些UPM设定值的大小除了与字体应用情境搭配外,在字体质量会有差异吗?

我们以下方的图例做说明,我们若将这三个图形视为「点」来看,右方的点是基于UPM 256的设计,而左方的点是以UPM 2048作设计,我们可以看出两者都有达到一般所认知「点」的概念,但若前提是「圆点」、「正圆」,那么就一定是左方UPM 2048所设计的图形才能符合标准。

也就是说,UPM值设定的越高,可以获得更多包含曲线、造型等的设计细节,反过来说,若我们想要设计一款具备高质量、有细腻曲线描绘的字体产品,在UPM就会需要相对较高的设定值。

以中文字体产品来说,无论是TrueType或OpenType PS的字体,目前大多数的UPM设定都以1000为主,这是一个在产品质量与档案量大小可以取得平衡的设定。

字体技术

消除繁体中文缺字的困扰

流行音乐创作歌手陶喆,常看到他的名字是用「陶吉吉」的方式显示,而非直接写出「喆」,为什么有一些字型「喆」呈现不出来?必须用两个吉来表示呢? 

繁体中文最常使用的字体规格为Big5-2003(大五码),共收录13,060个汉字。但是,身处数字时代的用户,文字的使用大多透过输入法的方式呈现在软件上,有时候有可能是因为用户输入文字时,选字错误,积非成是,有时候也有可能是当下标新立异,选型不选字,取「意」不取「义」,透过输入法输入、贴文复制,而用到非Big5字集的字符,而造成缺字的情形。

为了降低使用者用字缺字的机率,文鼎字型以现有Big5-2003字集为基础,参考教育部字频总表、中研院现代汉语语料库词频统计、网络流行用字以及营销与客户服务所累积的信息,汇整389个汉字,整合成Big5_AR 2021规格。新增收录于Big5_AR 2021规格的字符,包含尘螨的「螨」、擀面的「擀」、尊称神明的「祢」、峰的异体字「峯」以及双、堃、宝、峯、昆、彣、喆、雫、邨……。



文鼎字型已着手规划,挑选经典、热销的字型产品逐步更新为Big5_AR 2021规格,目前已经更新至此规格的字型产品有:文鼎书苑宋体、文鼎书苑黑体、文鼎签字笔体、文鼎DC蔡燊轩行书体; iFontCloud文鼎云字库字体租赁服务的客户,已下载启用这些字型的用户,在租赁期间,字档会透过字库管理工具自动地做档案更新,若您是第一次下载启用,则会直接取得最新字型档案。未来,文鼎字型所开发的新产品,也会依此规格做产品化。