在Python3.3.2中转换为马拉雅拉马语文本

2024-06-17 15:15:14 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我的代码是这样的(python3.3.2)

fw = codecs.open('outputfile.txt','w')
if((unidata[i]==U'\u0d46' and unidata[i-1]==U'\u0d28') and (unidata[i+1]==U'\u0d24') and (unidata[i+2]==U'\u0d4d')):
    print ('code 1')
    if(var==1):
        x=unidata[0:i-1]+U'\u0d7b'+ ' + '+U'\u0d0e'+unidata[i+1:len(unidata)]
    first_word=unidata[0:i-1]+U'\u0d7b'
fw.write(str(first_word.encode('UTF-8')))

文件中的输出如下:

^{pr2}$

实际输出应为:

രാമൻ

如何解决这个问题?在


Tags: and代码txtifopenwordfirstunidata
2条回答

这很管用。。在

fw=open("myunicodefile.txt","w")
fw.write(firstword.encode('UTF-8'))

但我想你说的是文件中的字符串#### 是的,实际上,使用“”str()转换后,unicode将是这样的 “\xe0\xb4\xb0\xe0\xb4\xbe\xe0\xb4\xae\xe0\xb5\xbb”

这是unicode。但是要在马拉雅拉姆语中使用文本编辑器查看此内容,必须使用未编码模式打开 _如果使用python读取该文件,则必须打开该文件并将其编码为utf

示例: fr=打开(“我的文本.txt“,”r“) 数据=法语阅读() 独角数据=数据编码(“utf-8”) 打印unicodedata

这将印刷马拉雅拉姆语

unicode deconversion issues and solutions

我给了链接bc他们解释得比我能解释的更好,那里还有额外的函数定义,直接链接页面上的第3个我认为对你有帮助。在

相关问题 更多 >