Python：为特定内容抓取表

1条回答

网友

1楼 · 发布于 2024-05-15 21:10:36

将table.find_all('tr')替换为table.find_all('tr', {'releasetype': 'Current_Releases')将发现具有属性releasetype的{}为Current_Releases。在

有关详细信息，请签出docs。在

更新：添加完整代码

import csv
import requests
from bs4 import BeautifulSoup

url = "https://h10145.www1.hpe.com/downloads/SoftwareReleases.aspx?ProductNumber=J9775A"
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
table = soup.find('table', attrs={"class": "hpui-standardHrGrid-table"})
headers = [header.text for header in table.find_all('th')]
rows = []

for row in table.find_all('tr', {'releasetype': 'Current_Releases'}):
    item = []
    for val in row.find_all('td'):
        item.append(val.text.encode('utf8').strip())
    rows.append(item)

with open('output_file.csv', 'w') as f:
  writer = csv.writer(f)
  writer.writerow(headers)
  writer.writerows(rows)

给了我一个CSV文件和输出

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：为特定内容抓取表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >