我使用aiohttp从一个网站下载数据,得到一个字节对象作为响应,但我很难解码它。 这是我得到的回应的一个例子
b'\\r\\nLocalit\xc3\xa0' # Località
b'\\u003cdiv\\u003e12/09/2019\\u003c/div\\u003e\\r\\n' # <div>12/09/2019</div>
据我所知,文本使用普通unicode,html标记和换行符使用转义unicode。 如果我尝试使用“str(content,“utf-8”)”来解码它,我仍然有这种格式的html标记
\u003cdiv \u003e12/09/2019\u003c/div\u003e\r\n
我应该为每个标签做一个手动.replace("\u003", "<")
还是有更优雅的解决方案
您可以使用
'unicode-escape'
codec转换unicode部分,然后透明地重新编码为字节(拉丁语-1很方便,因为它提供了字节和字符之间的1对1对应),然后解码为“utf-8”:相关问题 更多 >
编程相关推荐