美化组url抓取

2024-05-19 03:05:43 发布

您现在位置:Python中文网/ 问答频道 /正文

第一次尝试BeautifulSoup。在

我有这个链接http://www.mediafire.com/download/alv8dq6k35n4m2k/For+You.zip

我想从下载按钮获取直接下载的url
http://download2110.mediafire.com/niz8p9iu6r9g/alv8dq6k35n4m2k/For+You.zip

到目前为止我所做的一切。在

r = requests.get(url)
soup = BeautifulSoup(r.content)
links = soup.findAll('a')

我想最后一个函数findAll('a')会找到该页面的所有链接,但我在links列表中找不到直接下载的url。在

我是不是做错了什么?如果是这样的话,我怎么才能和beauthulsoup取得联系呢。我检查了Chrome开发人员控制台中的元素,发现链接在那里。在


Tags: comyouhttpurlfor链接downloadwww
1条回答
网友
1楼 · 发布于 2024-05-19 03:05:43

您可以尝试从javascript中提取url:

from bs4 import BeautifulSoup

import requests

r = requests.get("http://www.mediafire.com/download/alv8dq6k35n4m2k/For+You.zip")

soup = BeautifulSoup(r.content)

link = soup.find("div",{"class":"download_link"})
import re

url = re.findall("http.*.zip?",link.text)[0]

相关问题 更多 >

    热门问题