我试图从多个url中提取特定的类。标签和类保持不变,但我需要我的python程序在我输入链接时将它们全部删除。
以下是我的作品样本:
from bs4 import BeautifulSoup
import requests
import pprint
import re
import pyperclip
url = input('insert URL here: ')
#scrape elements
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
#print titles only
h1 = soup.find("h1", class_= "class-headline")
print(h1.get_text())
这适用于单个url,但不适用于批处理。谢谢你帮我。我从这个社区学到了很多。
如果你想批量刮链接。指定批大小并对其进行迭代。
有一个URL列表并遍历它。
如果要提示用户输入每个站点的信息,可以这样做
相关问题 更多 >
编程相关推荐