美化组url抓取

2024-05-19 03:05:43 发布

您现在位置：Python中文网/ 问答频道 /正文

3947

网友

男 | 程序猿一只，喜欢编程写python代码。

第一次尝试BeautifulSoup。在

我有这个链接http://www.mediafire.com/download/alv8dq6k35n4m2k/For+You.zip

我想从下载按钮获取直接下载的url
http://download2110.mediafire.com/niz8p9iu6r9g/alv8dq6k35n4m2k/For+You.zip

到目前为止我所做的一切。在

r = requests.get(url)
soup = BeautifulSoup(r.content)
links = soup.findAll('a')

我想最后一个函数findAll('a')会找到该页面的所有链接，但我在links列表中找不到直接下载的url。在

我是不是做错了什么？如果是这样的话，我怎么才能和beauthulsoup取得联系呢。我检查了Chrome开发人员控制台中的元素，发现链接在那里。在

Tags： com you http url for 链接 download www

1条回答

网友

1楼 · 发布于 2024-05-19 03:05:43

您可以尝试从javascript中提取url：

from bs4 import BeautifulSoup

import requests

r = requests.get("http://www.mediafire.com/download/alv8dq6k35n4m2k/For+You.zip")

soup = BeautifulSoup(r.content)

link = soup.find("div",{"class":"download_link"})
import re

url = re.findall("http.*.zip?",link.text)[0]

美化组url抓取

相关问题更多 >

编程相关推荐

热门问题

热门文章

美化组url抓取

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >