如何将任意字符串转换为有效的人类可读标识符？

1条回答

网友
                    
                    

                    

                    1楼 ·

                    
                        发布于 2024-04-27 12:00:32

google“python字符名”会显示unicodedata模块。一个开始的地方是
import string
import unicodedata

ALLOWED = set(string.ascii_letters + string.digits + '. _')
sentences = ['Count €', 'Contains äüöß', 'Y tu mamá también.', 'что']

def encode(s):
    return ''.join([unicodedata.name(c).replace(" ","_")+"_"
                   if c not in ALLOWED else c for c in s])

for s in sentences:
    print(s)
    print(encode(s))
这让我
Count €
Count EURO_SIGN_
Contains äüöß
Contains LATIN_SMALL_LETTER_A_WITH_DIAERESIS_LATIN_SMALL_LETTER_U_WITH_DIAERESIS_LATIN_SMALL_LETTER_O_WITH_DIAERESIS_LATIN_SMALL_LETTER_SHARP_S_
Y tu mamá también.
Y tu mamLATIN_SMALL_LETTER_A_WITH_ACUTE_ tambiLATIN_SMALL_LETTER_E_WITH_ACUTE_n.
что
CYRILLIC_SMALL_LETTER_CHE_CYRILLIC_SMALL_LETTER_TE_CYRILLIC_SMALL_LETTER_O_
只需再多做一点工作（为转义选择一个合适的分隔符），您就可以保证这可以完美地进行往返，但这只是留给读者的一个练习。你知道吗

`相关问题更多 >`

`编程相关推荐`

`热门问题`

`热门文章`

如何将任意字符串转换为有效的人类可读标识符？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

`相关问题更多 >`

`编程相关推荐`

`热门问题`

`热门文章`