我正在尝试抓取这个论坛(http://www.xossip.com/showthread.php?t=1384077)的图片(或图片链接)。我试过美丽的汤4,下面是我尝试过的代码:
import requests
from bs4 import BeautifulSoup
def spider(max_pages):
page = 1
while page <= max_pages:
url = 'http://www.xossip.com/showthread.php?t=1384077&page=' + str(page)
sourcecode= requests.get(url)
plaintext = sourcecode.text
soup = BeautifulSoup(plaintext)
for link in soup.findAll('a',{'class': 'alt1'}):
src = link.get('src')
print(src)
page += 1
spider(1)
我应该如何更正它以获得像pzy.be/example
这样的图像链接?在
最简单的方法是请求每个页面并过滤img标记:
好的,我通过获取所有的
#post_message_*
div,然后从每个div中获取图像。在相关问题 更多 >
编程相关推荐