我正试图从维基百科页面上获取数据。在
页面URL:https://en.wikipedia.org/wiki/2015_in_hip_hop_music
这是我目前想出的代码。在
代码:
from bs4 import BeautifulSoup
import urllib.request
def make_soup(url):
thepage=urllib.request.urlopen(url)
soupdata=BeautifulSoup(thepage, "html.parser")
return soupdata
soup= make_soup("https://en.wikipedia.org/wiki/2015_in_hip_hop_music")
albumdatasaved=""
for record in soup.findAll('tr'):
albumdata=""
for data in record.findAll('td'):
albumdata=albumdata+","+data.text
albumdatasaved=albumdatasaved+"\n"+albumdata[1:]
print(albumdatasaved)
但是,我的代码给出了页面上所有4个表的数据。 我有没有办法只得到第一个的数据?(已发行专辑)
任何帮助都将不胜感激。在
相关问题 更多 >
编程相关推荐