从U打印HTML

2024-03-29 06:42:56 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我想打印出一个网站的HTML

from urllib.request import urlopen

http = urlopen('http://www.google.de/').read()
print(http)

但是在输出中,所有新行都被打印成\n,字符串以一个b'开头,这与我的google研究告诉我的一个bite数组有关?抱歉,我是pythonxd新手

所以我的问题是如何将html代码打印成一个普通的字符串,并使用换行符,就像在文本编辑器中显示的那样?在


Tags: 字符串fromimporthttpread网站requesthtml
1条回答
网友
1楼 · 发布于 2024-03-29 06:42:56

请看一下urlopen文档。在HTML标题中,charset=UTF-8。因此,您需要将行更改为:

print(http.decode('utf-8'))

如果HTML输出中有特殊字符(由于区域设置),请使用:

^{pr2}$

相关问题 更多 >