2024-04-26 01:34:56 发布
网友
我有两条线,我想把它放在一起比较。在
"Hỗ trợ ngôn ngữ"
u'H\u1ed7 tr\u1ee3 ng\xf4n ng\u1eef'
两个字符串具有相同的内容。我想比较一下。 如何将第一个字符串转换为与第二个字符串相同的编码。?在
如果有HTML实体,只需使用HTMLParser模块来取消对它们的浏览:
HTMLParser
>>> import HTMLParser >>> h = HTMLParser.HTMLParser() >>> h.unescape("Hỗ trợ ngôn ngữ") u'H\u1ed7 tr\u1ee3 ng\xf4n ng\u1eef' >>> print h.unescape("Hỗ trợ ngôn ngữ") Hỗ trợ ngôn ngữ
这些HTML实体使用十进制数,而不是十六进制数。7895是十六进制的1ed7,它们编码unicode码位,不使用UTF-8或ISO-8859-1。ISO-8859-1,或者拉丁语-1,甚至不能编码这些特定的代码点(根据googletranslate,越南语表示“语言支持”)。在
7895
1ed7
如果有HTML实体,只需使用
HTMLParser
模块来取消对它们的浏览:这些HTML实体使用十进制数,而不是十六进制数。
7895
是十六进制的1ed7
,它们编码unicode码位,不使用UTF-8或ISO-8859-1。ISO-8859-1,或者拉丁语-1,甚至不能编码这些特定的代码点(根据googletranslate,越南语表示“语言支持”)。在相关问题 更多 >
编程相关推荐