我写了我的代码,但它提取所有链接,无论种子数是多少, 下面是我写的代码:
from bs4 import BeautifulSoup
import urllib.request
import re
class AppURLopener(urllib.request.FancyURLopener):
version = "Mozilla/5.0"
url = input('What site you working on today, sir?\n-> ')
opener = AppURLopener()
html_page = opener.open(url)
soup = BeautifulSoup(html_page, "lxml")
pd = str(soup.findAll('td', attrs={'align':re.compile('right')}))
for link in soup.findAll('a', attrs={'href': re.compile("^magnet")}):
if not('0' is pd[18]):
print (link.get('href'),'\n')
这是我正在处理的html:https://imgur.com/a/32J9qF4 在这种情况下,它是0播种机,但它仍然给我磁铁链接。。救命
此代码片段将从页面中提取所有磁铁链接,其中包含seeders!=
0
:印刷品:
编辑:
soup.select('#searchResult td.vertTh ~ td')
将选择带有类vertTh
的标记<td>
的所有<td>
同级,该类位于带有id=searchResult
的标记内。每行有三个这样的兄弟姐妹。你知道吗然后
select_one('a[href^=magnet]')
将选择href
以magnet
开头的所有链接。你知道吗相关问题 更多 >
编程相关推荐