Python转换非标准字符

2024-05-21 06:05:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个列表,我从一个网页,其中包含一些非标准字符。在

列表示例:

[<td class="td-number-nowidth"> 10 115 </td>, <td class="td-number-nowidth"> 4 635 (46%) </td>, <td class="td-number-nowidth"> 5 276 (52%) </td>, ...]

带帽子的A应该是逗号。有人能建议如何转换或替换它们,这样我就可以像列表中的第一个值一样得到10115值吗?在

源代码:

^{pr2}$

谢谢, 弗兰克


Tags: 网页示例number列表源代码字符建议帽子
3条回答

网站是否说明了其Content-Encoding头中的编码?您必须获得该值,然后使用.decode方法对列表中的字符串进行解码。它将类似于encoded_string.decode(“encoding”)。encoding可以是任何东西,utf-8就是其中之一。在

你有没有试过?在

这可能有用。在

a =  ['10Â 115', '4Â 635 (46%)', '5Â 276 (52%)']
for b in a:
    b.replace("\xc3\x82 ", '')

输出:

^{pr2}$

根据它的常数(如果它总是一个带点的a),可能有更好的方法(用空白字符替换从a到空格的任何内容)。在

您可以将.decode方法与errors='ignore'参数一起使用。在

>>> s = '[ 10Â 115 , 4Â 635 (46%) , 5Â 276 (52%) , ...]'
>>> s.decode('ascii', errors='ignore')
u'[ 10 115 , 4 635 (46%) , 5 276 (52%) , ...]'

这是help(''.decode)

^{pr2}$

相关问题 更多 >