7
30
2013
20

对比不同字体中的同一字符

本文来自依云's Blog,转载请注明。

有人在 openSUSE 中文论坛询问他的输入法打出的「妩媚」的「妩」字为什么显示成「女」+「元」。怀疑是字体的问题,于是空闲时用好友写的 python-fontconfig 配合 Pillow (PIL 的一个 fork)写了个脚本,使用系统上所有包含这个「妩」字的字体来显示这个字,看看到底是哪些字体有问题。

(更新后的)脚本如下:

Google Chrome / Chromium 用户请注意:如果复制得到的代码中含有不间断空格(0xa0),请手动替换下。

#!/usr/bin/env python3
# vim:fileencoding=utf-8

from PIL import Image, ImageDraw, ImageFont
import fontconfig

ch = '妩'
def get_fonts():
  ret = []
  for f in fontconfig.query():
    f = fontconfig.FcFont(f)
    if f.has_char(ch):
      ret.append((f.file, f.bestname))
  return ret

w, h = 800, 20000
image = Image.new('RGB', (w, h), 'white')
draw = ImageDraw.Draw(image)
pos = 0
w = 0
strs = ch
for fontfile, fontname in get_fonts():
  font = ImageFont.truetype(fontfile, 24)
  s = '%s: %s' % (fontname, strs)
  font_width, font_height = font.getsize(s)
  w = max((font_width, w))
  draw.text((10, pos), s, font=font, fill='black')
  pos += font_height
  h = pos

image = image.crop((0, 0, w+10, h))
image.save('fonts.png')

寻找字体,然后渲染到当前目录下的fonts.png文件中。寻找字体的过程挺花时间的,要耐心等待。最后结果如下:

我这里,文泉驿微米黑、方正魏碑、某个 Droid Sans Fallback 字体中「妩」字的字形不对。(我这里有三个字体文件都叫「Droid Sans Fallback」……)>

Category: python | Tags: python 字体 fontconfig 中文支持 | Read Count: 12624
Star Brilliant 说:
Jul 31, 2013 09:58:06 AM

遇到三个 Droid Sans Fallback 就对了。对应三个不同的地区。
我也跑一下试试看。

Star Brilliant 说:
Jul 31, 2013 10:01:38 AM

你的代码里面空格有问题啊……
我拿到手还需要 :%s/ / /g 一次才行……

muzuiget 说:
Jul 31, 2013 12:36:59 PM

魏碑那个也是「无」,只不过那撇凸出来不明显。

而微米黑是基于 Droid Sans Fallback 的,所以他们都错了。

Avatar_small
依云 说:
Jul 31, 2013 01:29:17 PM

哦哦,那个太不明显了,要放大后才会注意到= =

微历史 说:
Jul 31, 2013 04:28:00 PM

这个不懂,不过用kindle看书时,有的字的确是分开的,应该跟字体有关

abc 说:
Aug 02, 2013 04:21:23 PM

Traceback (most recent call last):
File "./font.py", line 23, in <module>
font = ImageFont.truetype(fontfile, 24)
File "/usr/lib/python3.3/site-packages/Pillow-2.1.0-py3.3-linux-i686.egg/PIL/ImageFont.py", line 239, in truetype
return FreeTypeFont(font, size, index, encoding)
File "/usr/lib/python3.3/site-packages/Pillow-2.1.0-py3.3-linux-i686.egg/PIL/ImageFont.py", line 146, in __init__
self.font = core.getfont(font, size, index, encoding)
OSError: invalid pixel size

我的会报错。

Star Brilliant 说:
Aug 02, 2013 04:28:00 PM

哎……
我虽然能跑,但是一跑就死机……三千字体不是闹着玩的!

Avatar_small
依云 说:
Aug 02, 2013 04:37:17 PM

你系统上有奇怪的字体?会 Python 的话把 fontfile 打出来看看。

abc 说:
Aug 02, 2013 04:41:41 PM

解决了,系统有两个特殊字体 18x18ja.pcf.gz 18x18ko.pcf.gz 可能不能识别

Muninn 说:
Aug 02, 2013 07:47:32 PM

赞这种认真精神
话说我一开始还以为你要做图像分析
让计算机自己查出来哪个是‘元’
震惊了一下
后来发现原来是人工核对哈哈哈

Avatar_small
依云 说:
Aug 02, 2013 09:04:04 PM

:-)

让计算机自己来识别这想法不错哦,只要判定指定的区域内的那一横中间有没有突起就可以了,好像(对于我来说)也不是不可能完成的任务呢=w=

Muninn 说:
Aug 02, 2013 09:51:08 PM

哈哈 还是挺难的 有的字体风格相差太大
比如华文彩云这样的就是难点。。。草书就不说了

自由建客 说:
Aug 03, 2013 11:20:01 PM

我记得我说过,谷歌那字体不是好东西。

yx_wh 说:
Aug 09, 2013 12:12:04 AM

哦,这个应该是因为各个地区同一个汉字的标准字形虽然不同但是unicode编码一样所导致的。

例如日语字体中「将」「過」等字的字形就不同于中国大陆……

Star Brilliant 说:
Aug 09, 2013 12:30:17 AM

确实是这样。
但是现代的很多字体,支持 OpenType 的区域设定。可以同时存储不同区域设置的字形。
可能是制作的疏忽,导致某一个字形的区域设置出错,这是有可能的。尤其是对于 Droid Sans Fallback 这么一款制作粗糙,利用字形链接来压缩体积到 2.8MiB,最初设计定位在 Fallback 字体的字体来说,bug 多是很正常嘛。

Avatar_small
依云 说:
Aug 09, 2013 12:15:54 PM

那请告诉我什么地区「妩」(wǔ)字写成那样的?——http://www.zdic.net/z/17/zy/59A9.htm

Avatar_small
h2ojile 说:
Aug 11, 2013 06:37:16 PM

兴冲冲的发现这段好玩的代码.
然后跑去安装
结果发现我是 windows, 被坑到了.

pillow要用c编译器, distutil 有bug找不到vs2012.好容易改掉了bug
又发现fontconfig在win上有点儿超出我能力范围.唉.
大神啊,这个能在win上用么?

Avatar_small
依云 说:
Aug 11, 2013 06:40:40 PM

Windows 上应该没有 fontconfig 吧=w=
另外,除非做开发,否则不建议用 vs。下个 mingw 来编译就好啦。

海南婚纱 说:
Mar 06, 2016 06:35:26 PM

最灵繁的人也看不见自己的背脊。


登录 *


loading captcha image...
(输入验证码)
or Ctrl+Enter

| Theme: Aeros 2.0 by TheBuckmaker.com