试图创建一个web刮板，但下面的代码一直在打印所有html

2024-04-19 19:24:08 发布

男 | 程序猿一只，喜欢编程写python代码。

因此，我试图从media.com获取我的统计数据，并且已经构建了一个机器人来登录，当我进入统计页面并试图打印标题时，它会不断向我抛出所有的html。print函数用于确保在我继续之前打印正确的内容：

url = driver.page_source
headers = {"Accept-Language": "en-US, en;q=0.5"}
results = requests.get(url, headers=headers)

soup = BeautifulSoup(url, "lxml")

story_title = []
publication = []
views = []
reads = []
read_ratio = []
fans = []

stats_div = soup.find_all('tr', class_='sortableTable-row js-statsTableRow')
for container in stats_div:
    name = container.td.a.text.find('span', class_='sortableTable-title u-maxWidth450')
    story_title.append(name)

print(story_title)

Tags： name div url title container stats find media

1条回答

网友

1楼 · 发布于 2024-04-19 19:24:08

没关系，明白了！Selenium不喜欢url = driver.page_source，所以我只使用了链接

试图创建一个web刮板，但下面的代码一直在打印所有html

相关问题更多 >

编程相关推荐

热门问题

热门文章

试图创建一个web刮板，但下面的代码一直在打印所有html

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >