Python - 如何编码Python可处理的外文字符?
我正在处理一些法语和德语的大文件。基本上就是把一个文件里的字符写到另一个文件里,收集数据等等。不过,我对该导入什么才能让Python处理这些字符完全没有头绪。
即使是从Python已经转换过的文件中收集数据(在法语中你会看到一些奇怪的东西,比如écouteur ça),当我检查字典里我知道已经放进去的东西时,还是会出现键错误,尤其是当这些项目里有特殊字符,比如écouteur ça时。
举个例子,当元组('écouteur', 'ça')被添加到一个字典中,这个字典用来统计任意一对单词一起出现的频率时,当你查这个字典看元组('écouteur', 'ça')时,就会出现键错误,但如果查其他不包含这些奇怪字符的元组就不会。
有没有人知道有什么快速的方法可以解决这个问题?
最好的,
Georgina