如何用Python获取TrueType字体字符的宽度,单位为1200分之一英寸?

7 投票
2 回答
10099 浏览
提问于 2025-04-16 07:08

我可以用PIL库获取一个字符的高度和宽度,单位是像素(见下面的代码),但(如果我没记错的话)像素的大小是和屏幕的DPI(每英寸点数)有关的,而DPI是会变化的。其实我想做的是计算一个字符在绝对单位下的宽度,比如英寸,或者是1200分之一英寸(也就是“Word Perfect单位”)。

>>> # Getting pixels width with PIL
>>> font = ImageFont.truetype('/blah/Fonts/times.ttf' , 12)
>>> font.getsize('a')
(5, 14)

我想这么做的原因是为了创建一个自动换行的功能,用于写二进制的Word Perfect文档。Word Perfect需要在文本中合适的位置插入换行代码,否则文件会损坏,无法打开。问题是,在可变宽度的字体中,我该在哪里添加这些换行代码。

我意识到我对像素、屏幕分辨率和字体大小之间的关系还不太理解。我这样做是不是错了?

2 个回答

0

这个对我来说效果更好:

def pixel_width(unicode_text): 
    width=len(unicode_text)*50 
    height=100 
    back_ground_color=(0,0,0) 
    font_size=64 
    font_color=(255,255,255) 

    im  =  Image.new ( "RGB", (width,height), back_ground_color ) 
    draw  =  ImageDraw.Draw (im) 
    unicode_font = ImageFont.truetype("./usr/share/fonts/truetype/dejavu/DejaVuSansMono.ttf", font_size) 
    draw.text ( (0,0), unicode_text, font=unicode_font, fill=font_color ) 
    im.save("/dev/shm/text.png") 
    box = Image.open("/dev/shm/text.png").getbbox() 
    return box[2] - box[0] 
12

原始文本的宽度通常是用排版点来计算的,但为了定义字体,1个点被定义为1/72英寸,所以你可以很容易地把它转换成其他单位。

要获取一个字符的设计宽度(用em单位表示),你需要访问字体的底层数据。最简单的方法是pip install fonttools,这个工具包提供了所有可以在字体定义的最低层次上工作的功能。

安装好fontTools后,你可以:

  1. 加载字体数据——这需要你提供实际字体文件的路径;

  2. 字符的宽度是以字形宽度存储的,这意味着你必须获取一个“字符到字形”的映射;这个映射在字体的cmap表中:

    a. 加载你字体的cmap。最有用的是Unicode映射——一个字体可能包含其他映射。
    b. 加载你字体的字形集。这是一份该字体中字形的名称列表。

  3. 然后,对于每个Unicode字符,首先查找它的名称,然后用这个名称来获取它在设计单位中的宽度。

  4. 别忘了,“设计单位”是基于字体的整体“设计宽度”。这可以是一个标准值,比如1000(对于Type 1字体来说很常见),2048(对于TrueType字体来说很常见),或者其他任何值。

这就引出了这个函数:

from fontTools.ttLib import TTFont
from fontTools.ttLib.tables._c_m_a_p import CmapSubtable

font = TTFont('/Library/Fonts/Arial.ttf')
cmap = font['cmap']
t = cmap.getcmap(3,1).cmap
s = font.getGlyphSet()
units_per_em = font['head'].unitsPerEm

def getTextWidth(text,pointSize):
    total = 0
    for c in text:
        if ord(c) in t and t[ord(c)] in s:
            total += s[t[ord(c)]].width
        else:
            total += s['.notdef'].width
    total = total*float(pointSize)/units_per_em;
    return total

text = 'This is a test'

width = getTextWidth(text,12)

print ('Text: "%s"' % text)
print ('Width in points: %f' % width)
print ('Width in inches: %f' % (width/72))
print ('Width in cm: %f' % (width*2.54/72))
print ('Width in WP Units: %f' % (width*1200/72))

结果是:

Text: "This is a test"
Width in points: 67.353516
Width in inches: 0.935465
Width in cm: 2.376082
Width in WP Units: 1122.558594

并且与Adobe InDesign报告的结果是正确的。(注意,这里没有应用每个字符的字距调整!这需要更多的代码。)

在字体中未定义的字符会被默默忽略,通常会使用.notdef字形的宽度。如果你想把这个当作错误报告,可以去掉函数中的if测试。

在函数getTextWidth中将值转换为float是为了让它在Python 2.7和3.5下都能工作,但请注意,如果你使用Python 2.7并且处理更大的Unicode字符(不是普通的ASCII),你需要重写这个函数以正确使用UTF8字符。

撰写回答