我有一个有趣的问题。假设有一个字符列表,其匹配的unicode表示形式:
list_of_special_chars = [
('Ą', b'\u0104'),
('ą', b'\u0105'),
('Ę', b'\u0118'),
('ę', b'\u0119'),
('Ó', b'\xd3'),
('ó', b'\xf3'),
('Ć', b'\u0106'),
('ć', b'\u0107'),
('Ł', b'\u0141'),
('ł', b'\u0142'),
('Ń', b'\u0143'),
('ń', b'\u0144'),
('Ś', b'\u015a'),
('ś', b'\u015b'),
('Ź', b'\u0179'),
('ź', b'\u017a'),
('Ż', b'\u017b'),
('ż', b'\u017c')
]
现在,考虑有一个文本文件,其中包含以下短语:Cześć,jak sięmasz?
如何将文本替换到文件中,以创建一个如下所示的新文件:Cze\u015b\u0107,jak si\u0119 masz?
我尝试了不同的方法,但我无法解决python处理字符串的方式这类问题。例如,"Czesć".replace("ć", "\u0107")
总是同一个单词。在
您需要转义反斜杠,以便
\u
不被视为Python转义序列的开头。在相关问题 更多 >
编程相关推荐