我有一根绳子。
s = u"<script language=javascript>alert('\xc7\xeb\xca\xe4\xc8\xeb\xd5\xfd\xc8\xb7\xd1\xe9\xd6\xa4\xc2\xeb,\xd0\xbb\xd0\xbb!');location='index.asp';</script></script>"
如何将s
转换为utf-8字符串?我试过s.decode('gbk').encode('utf-8')
,但是python报告错误:UnicodeEncodeError: 'ascii' codec can't encode characters in position 35-50: ordinal not in range(128)
你在把苹果和桔子混合。GBK编码的字符串不是Unicode字符串,因此不应以
u'...'
字符串结尾。在Python 2中,这是正确的方法。
请注意,传递给
.decode('gbk')
的g
的初始值设定项如何不表示为Unicode字符串,而是表示为纯字节字符串。另见http://nedbatchelder.com/text/unipain.html
在python2中,尝试转换unicode字符串:
然后你可以按照你的意愿编码到utf-8。
如果您可以将警报保存在单独的字符串“a”中:
然后它将打印:
如果要一次性自动提取子字符串:
将打印:
相关问题 更多 >
编程相关推荐