如何用Python获取TrueType字体字符的宽度,单位为1200分之一英寸?
我可以用PIL库获取一个字符的高度和宽度,单位是像素(见下面的代码),但(如果我没记错的话)像素的大小是和屏幕的DPI(每英寸点数)有关的,而DPI是会变化的。其实我想做的是计算一个字符在绝对单位下的宽度,比如英寸,或者是1200分之一英寸(也就是“Word Perfect单位”)。
>>> # Getting pixels width with PIL
>>> font = ImageFont.truetype('/blah/Fonts/times.ttf' , 12)
>>> font.getsize('a')
(5, 14)
我想这么做的原因是为了创建一个自动换行的功能,用于写二进制的Word Perfect文档。Word Perfect需要在文本中合适的位置插入换行代码,否则文件会损坏,无法打开。问题是,在可变宽度的字体中,我该在哪里添加这些换行代码。
我意识到我对像素、屏幕分辨率和字体大小之间的关系还不太理解。我这样做是不是错了?
2 个回答
这个对我来说效果更好:
def pixel_width(unicode_text):
width=len(unicode_text)*50
height=100
back_ground_color=(0,0,0)
font_size=64
font_color=(255,255,255)
im = Image.new ( "RGB", (width,height), back_ground_color )
draw = ImageDraw.Draw (im)
unicode_font = ImageFont.truetype("./usr/share/fonts/truetype/dejavu/DejaVuSansMono.ttf", font_size)
draw.text ( (0,0), unicode_text, font=unicode_font, fill=font_color )
im.save("/dev/shm/text.png")
box = Image.open("/dev/shm/text.png").getbbox()
return box[2] - box[0]
原始文本的宽度通常是用排版点来计算的,但为了定义字体,1个点被定义为1/72英寸,所以你可以很容易地把它转换成其他单位。
要获取一个字符的设计宽度(用em单位表示),你需要访问字体的底层数据。最简单的方法是pip install fonttools
,这个工具包提供了所有可以在字体定义的最低层次上工作的功能。
安装好fontTools后,你可以:
加载字体数据——这需要你提供实际字体文件的路径;
字符的宽度是以字形宽度存储的,这意味着你必须获取一个“字符到字形”的映射;这个映射在字体的
cmap
表中:a. 加载你字体的
cmap
。最有用的是Unicode映射——一个字体可能包含其他映射。
b. 加载你字体的字形集。这是一份该字体中字形的名称列表。然后,对于每个Unicode字符,首先查找它的名称,然后用这个名称来获取它在设计单位中的宽度。
别忘了,“设计单位”是基于字体的整体“设计宽度”。这可以是一个标准值,比如
1000
(对于Type 1字体来说很常见),2048
(对于TrueType字体来说很常见),或者其他任何值。
这就引出了这个函数:
from fontTools.ttLib import TTFont
from fontTools.ttLib.tables._c_m_a_p import CmapSubtable
font = TTFont('/Library/Fonts/Arial.ttf')
cmap = font['cmap']
t = cmap.getcmap(3,1).cmap
s = font.getGlyphSet()
units_per_em = font['head'].unitsPerEm
def getTextWidth(text,pointSize):
total = 0
for c in text:
if ord(c) in t and t[ord(c)] in s:
total += s[t[ord(c)]].width
else:
total += s['.notdef'].width
total = total*float(pointSize)/units_per_em;
return total
text = 'This is a test'
width = getTextWidth(text,12)
print ('Text: "%s"' % text)
print ('Width in points: %f' % width)
print ('Width in inches: %f' % (width/72))
print ('Width in cm: %f' % (width*2.54/72))
print ('Width in WP Units: %f' % (width*1200/72))
结果是:
Text: "This is a test"
Width in points: 67.353516
Width in inches: 0.935465
Width in cm: 2.376082
Width in WP Units: 1122.558594
并且与Adobe InDesign报告的结果是正确的。(注意,这里没有应用每个字符的字距调整!这需要更多的代码。)
在字体中未定义的字符会被默默忽略,通常会使用.notdef
字形的宽度。如果你想把这个当作错误报告,可以去掉函数中的if
测试。
在函数getTextWidth
中将值转换为float
是为了让它在Python 2.7和3.5下都能工作,但请注意,如果你使用Python 2.7并且处理更大的Unicode字符(不是普通的ASCII),你需要重写这个函数以正确使用UTF8字符。