我有一个列表,我从一个网页,其中包含一些非标准字符。在
列表示例:
[<td class="td-number-nowidth"> 10Â 115 </td>, <td class="td-number-nowidth"> 4Â 635 (46%) </td>, <td class="td-number-nowidth"> 5Â 276 (52%) </td>, ...]
带帽子的A应该是逗号。有人能建议如何转换或替换它们,这样我就可以像列表中的第一个值一样得到10115值吗?在
源代码:
^{pr2}$
谢谢,
弗兰克
Tags:
网站是否说明了其
Content-Encoding
头中的编码?您必须获得该值,然后使用.decode
方法对列表中的字符串进行解码。它将类似于encoded_string
.decode(“encoding”)。encoding
可以是任何东西,utf-8
就是其中之一。在你有没有试过?在
这可能有用。在
输出:
^{pr2}$根据它的常数(如果它总是一个带点的a),可能有更好的方法(用空白字符替换从a到空格的任何内容)。在
您可以将
.decode
方法与errors='ignore'
参数一起使用。在这是
^{pr2}$help(''.decode)
:相关问题 更多 >
编程相关推荐