如何使用beauthulsoup只获取Wikipedia页面上第一个表的数据？

from bs4 import BeautifulSoup import urllib.request def make_soup(url): thepage=urllib.request.urlopen(url) soupdata=BeautifulSoup(thepage, "html.parser") return soupdata soup= make_soup("https://en.wikipedia.org/wiki/2015_in_hip_hop_music") albumdatasaved="" for record in soup.findAll('tr'): albumdata="" for data in record.findAll('td'): albumdata=albumdata+","+data.text albumdatasaved=albumdatasaved+"\n"+albumdata[1:] print(albumdatasaved)

1条回答

网友

1楼 · 发布于 2024-06-07 17:11:05

from bs4 import BeautifulSoup
import urllib.request
def make_soup(url):
    thepage=urllib.request.urlopen(url)
    soupdata=BeautifulSoup(thepage, "html.parser")
    return soupdata

soup= make_soup("https://en.wikipedia.org/wiki/2015_in_hip_hop_music")
albumdatasaved=""
# find all table ,get the first
table = soup.find_all('table', class_="wikitable")[0]  # Only use the first table
# iter over it
for record in table.findAll('tr'):
    albumdata=""
    for data in record.findAll('td'):
        albumdata=albumdata+","+data.text
    albumdatasaved=albumdatasaved+"\n"+albumdata[1:]

print(albumdatasaved)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用beauthulsoup只获取Wikipedia页面上第一个表的数据？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >