如何转换阿拉伯语Unicode
我正在用Python开发一个阿拉伯语的词干提取工具包。
我想把任何操作的结果从Unicode格式转换成阿拉伯字母。
我的代码:
import tashaphyne
form tashaphyne import *
>>> text = u"الْعَرَبِيّةُ"
>>> strip_tashkeel(text)
我希望它能显示“العربية”,而不是它的Unicode编码。
2 个回答
0
你看到的是 u'\u0627\u0644\u0639\u0631\u0628\u064a\u0629'
而不是 "العربية",这是因为 repr()
函数显示的unicode字符串是为了在7位终端上也能显示出来。
如果你想看到实际的文字而不是unicode,可以在调用 strip_tashkeel()
之后使用 print _
,或者直接使用 print strip_tashkeel(text)
。
1