用beautifulsoup获取页面源代码时遇到问题

2024-04-28 14:55:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用beauthoulsoup获取网页的HTML源代码。在

import bs4 as bs
import requests
import urllib.request
sourceUrl='https://www.pakwheels.com/forums/t/planing-a-trip-from-karachi-to-lahore-by-road-in-feb-2017/414115/2.html'
source=urllib.request.urlopen(sourceUrl).read()
soup=bs.BeautifulSoup(source,'html.parser')
print(soup)

我想要网页的HTML源代码。我现在得到的是:

^{pr2}$

Tags: import网页sourcebs源代码requesthtmlas
1条回答
网友
1楼 · 发布于 2024-04-28 14:55:32

看看这个代码:

from urllib import request
from bs4 import BeautifulSoup


url_1 = "http://www.google.com"
page = request.urlopen(url_1)
soup = BeautifulSoup(page)
print(soup.prettify())

正确导入您需要的所有内容。读this。在

相关问题 更多 >