2024-04-27 02:45:39 发布
网友
我正试图从this站点中获取公司名称,但该站点不会自动显示公司的完整列表。当通过浏览器进行交互时,网站会加载~25家公司,当我滚动时,它会再加载~25家公司,直到到达列表的末尾。当我用靓汤刮公司名字的时候,我只得到25个名字。你知道吗
有没有办法用漂亮的汤(或者python中的其他库)刮去所有的名字?你知道吗
向下滚动时加载的数据是一个额外的请求URL,http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/20/30
20-当前页中的项目数,30-下一页中要获取的项目数。你知道吗
如果你想得到下一个页面,你需要像这样形成URL
http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/50/30http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/80/30http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/110/30 等等。你知道吗
这不能在BeautifulSoup中呈现,因为它是一个json响应。你知道吗
公司列表存储在json响应的值list-items中。你知道吗
list-items
向下滚动时加载的数据是一个额外的请求URL,http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/20/30
20-当前页中的项目数,30-下一页中要获取的项目数。你知道吗
如果你想得到下一个页面,你需要像这样形成URL
http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/50/30http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/80/30http://fortune.com/api/v2/list/1141696/expand/item/ranking/asc/110/30 等等。你知道吗
这不能在BeautifulSoup中呈现,因为它是一个json响应。你知道吗
公司列表存储在json响应的值
list-items
中。你知道吗相关问题 更多 >
编程相关推荐