如何转换阿拉伯语Unicode

3 投票
2 回答
4806 浏览
提问于 2025-04-17 15:39

我正在用Python开发一个阿拉伯语的词干提取工具包。
我想把任何操作的结果从Unicode格式转换成阿拉伯字母。

我的代码:

import tashaphyne
form tashaphyne  import *
>>> text = u"الْعَرَبِيّةُ"
>>> strip_tashkeel(text)

我希望它能显示“العربية”,而不是它的Unicode编码。

2 个回答

0

你看到的是 u'\u0627\u0644\u0639\u0631\u0628\u064a\u0629' 而不是 "العربية",这是因为 repr() 函数显示的unicode字符串是为了在7位终端上也能显示出来。

如果你想看到实际的文字而不是unicode,可以在调用 strip_tashkeel() 之后使用 print _,或者直接使用 print strip_tashkeel(text)

1

你可以使用encode()这个函数把unicode字符串转换成其他编码,方法如下:

text.encode('utf8')

这里有一个Python 2.7中可能的编码列表。

撰写回答