用unicode代码替换文件中的特殊字符(Python)

2024-04-19 18:01:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个有趣的问题。假设有一个字符列表,其匹配的unicode表示形式:

list_of_special_chars = [
    ('Ą', b'\u0104'),
    ('ą', b'\u0105'),
    ('Ę', b'\u0118'),
    ('ę', b'\u0119'),
    ('Ó', b'\xd3'),
    ('ó', b'\xf3'),
    ('Ć', b'\u0106'),
    ('ć', b'\u0107'),
    ('Ł', b'\u0141'),
    ('ł', b'\u0142'),
    ('Ń', b'\u0143'),
    ('ń', b'\u0144'),
    ('Ś', b'\u015a'),
    ('ś', b'\u015b'),
    ('Ź', b'\u0179'),
    ('ź', b'\u017a'),
    ('Ż', b'\u017b'),
    ('ż', b'\u017c')
]

现在,考虑有一个文本文件,其中包含以下短语:Cześć,jak sięmasz?

如何将文本替换到文件中,以创建一个如下所示的新文件:Cze\u015b\u0107,jak si\u0119 masz?

我尝试了不同的方法,但我无法解决python处理字符串的方式这类问题。例如,"Czesć".replace("ć", "\u0107")总是同一个单词。在


Tags: 文件of列表unicode字符形式listspecial