如何从需要使用python和BeautifulSoup登录的网页中提取文本？ - 问答 - Python中文网

如何从需要使用python和BeautifulSoup登录的网页中提取文本？

2024-05-21 04:48:04 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我要从一个叫晨星网. 要访问这些数据，我必须登录。一旦我登录并提供了网页的url，我就会得到一个普通用户（未登录）的HTML文本，因此无法访问这些信息。有什么解决办法吗？在

Tags：数据文本信息 url 网页 html 晨星普通用户

1条回答

网友

1楼 · 发布于 2024-05-21 04:48:04

beauthoulsoup用于解析html，一旦您已经获取了它。您可以使用任何标准的url获取库来获取html。我更喜欢curl，因为您标记了您的帖子，python的内置urllib2也可以很好地工作。在

如果你说在登录响应后html和那些没有登录的人是一样的，我猜你的登录由于某种原因失败了。如果您使用的是urllib2，您是否确保在第一次登录后正确存储cookie，然后在发送数据请求时将此cookie传递给urllib2？在

如果您发布用于发出这两个请求（初始登录和获取数据的尝试）的代码，这将有所帮助。在

相关问题更多 >

编程相关推荐

热门问题

热门文章