用unicode代码替换文件中的特殊字符（Python）

2024-04-19 18:01:35 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个有趣的问题。假设有一个字符列表，其匹配的unicode表示形式：

list_of_special_chars = [
    ('Ą', b'\u0104'),
    ('ą', b'\u0105'),
    ('Ę', b'\u0118'),
    ('ę', b'\u0119'),
    ('Ó', b'\xd3'),
    ('ó', b'\xf3'),
    ('Ć', b'\u0106'),
    ('ć', b'\u0107'),
    ('Ł', b'\u0141'),
    ('ł', b'\u0142'),
    ('Ń', b'\u0143'),
    ('ń', b'\u0144'),
    ('Ś', b'\u015a'),
    ('ś', b'\u015b'),
    ('Ź', b'\u0179'),
    ('ź', b'\u017a'),
    ('Ż', b'\u017b'),
    ('ż', b'\u017c')
]

现在，考虑有一个文本文件，其中包含以下短语：Cześć，jak sięmasz？

如何将文本替换到文件中，以创建一个如下所示的新文件：Cze\u015b\u0107，jak si\u0119 masz？

我尝试了不同的方法，但我无法解决python处理字符串的方式这类问题。例如，"Czesć".replace("ć", "\u0107")总是同一个单词。在

Tags：文件 of 列表 unicode 字符形式 list special

1条回答

网友

1楼 · 发布于 2024-04-19 18:01:35

您需要转义反斜杠，以便\u不被视为Python转义序列的开头。在

"Czesć".replace("ć", "\\u0107")

用unicode代码替换文件中的特殊字符（Python）

相关问题更多 >

编程相关推荐

热门问题

热门文章

用unicode代码替换文件中的特殊字符（Python）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >