我正试图从一个网站:https://www.collegenp.com/2-science-colleges/上刮取学院名称和地址,但问题是我只获取列表中前11所学院的数据,而没有获取其他学院的数据。 我已经尝试了我所知道的一切,但没有一种方法奏效
我的代码是:
from selenium import webdriver
import bs4
from bs4 import BeautifulSoup
import requests
import pandas as pd
from time import sleep
driver=webdriver.Chrome('C:/Users/acer/Downloads/chromedriver.exe')
driver.get('https://www.collegenp.com/2-science-colleges/')
driver.refresh()
sleep(20)
page=requests.get("https://www.collegenp.com/2-science-colleges/")
college = []
location=[]
soup= BeautifulSoup(page.content,'html.parser')
for a in soup.find_all('div',attrs={'class':'media'}):
name=a.find('h3',attrs={'class':'college-name'})
college.append(name.text)
loc=a.find('span',attrs={'class':'college-address'})
location.append(loc.text)
df=pd.DataFrame({'College name':college,'Locations':location})
df.to_csv('hell.csv',index=False,encoding='utf-8')
有没有办法让我可以刮取所有的数据
您可以使用此代码从下一页获取信息:
印刷品:
并保存
data.csv
(LibreOffice的屏幕截图):相关问题 更多 >
编程相关推荐