我正试图从this维基百科页面中搜集数据。你知道吗
下面是我目前正在使用的代码。你知道吗
代码:
from bs4 import BeautifulSoup
import urllib.request
def make_soup(url):
thepage = urllib.request.urlopen(url)
soupdata = BeautifulSoup(thepage, "html.parser")
return soupdata
soup = make_soup("https://en.wikipedia.org/wiki/2015_in_hip_hop_music")
albumdatasaved = ""
for record in soup.findAll('tr'):
albumdata = ""
for data in record.findAll('td'):
albumdata = albumdata + "," + data.text
albumdatasaved = albumdatasaved + "\n" + albumdata[1:]
print(albumdatasaved)
我只需要每个表的第一行数据,如下图所示。我怎么能做到?你知道吗
这里是完全为您的问题工作的代码,使用API是更好的方式,但我明白,您需要一个快速的解决方案。。。你知道吗
相关问题 更多 >
编程相关推荐