将花式/艺术性unicode文本转换为ASCII

2024-04-20 06:47:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个unicode字符串,比如“𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊" 并希望将其转换为ASCII格式的“暴徒生活”

我知道我可以在Python中通过

import unidecode
print(unidecode.unidecode('𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊'))
// thug life

然而,这也将使我想要保留的其他unicode字符(如中文/日文字符、表情符号、重音字符等)变得更加透明

有没有办法检测这些类型的“艺术”unicode字符

还有一些例子:

𝓽𝓱𝓾𝓰 𝓵𝓲𝓯𝓮

𝓉𝒽𝓊𝑔 𝓁𝒾𝒻𝑒

𝕥𝕙𝕦𝕘 𝕝𝕚𝕗𝕖

thug life

谢谢你的帮助


Tags: 字符串import格式asciiunicode字符print日文
1条回答
网友
1楼 · 发布于 2024-04-20 06:47:47
import unicodedata
strings = [
  '𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊',
  '𝓽𝓱𝓾𝓰 𝓵𝓲𝓯𝓮',
  '𝓉𝒽𝓊𝑔 𝓁𝒾𝒻𝑒',
  '𝕥𝕙𝕦𝕘 𝕝𝕚𝕗𝕖',
  'thug life']
for x in strings:
  print(unicodedata.normalize( 'NFKC', x), x)

输出.\62803325.py

thug life 𝖙𝖍𝖚𝖌 𝖑𝖎𝖋𝖊
thug life 𝓽𝓱𝓾𝓰 𝓵𝓲𝓯𝓮
thug life 𝓉𝒽𝓊𝑔 𝓁𝒾𝒻𝑒
thug life 𝕥𝕙𝕦𝕘 𝕝𝕚𝕗𝕖
thug life thug life

资源

相关问题 更多 >