如何使用beutilsoup提取表信息？

1条回答

网友

1楼 · 发布于 2024-04-26 04:57:05

看起来标题和数据的id都有唯一的值和标准后缀。您可以使用它来搜索适当的值。以下是我的解决方案：

from BeautifulSoup import BeautifulSoup

# Insert whatever networking stuff you're doing here. I'm going to assume
# that you've already downloaded the page and assigned it to a variable 
# named 'html'

soup = BeautifulSoup(html)
headings = ['Internship', 'Residency', 'Fellowship']
values = []
for heading in headings:
    x = soup.find('span', text=heading)
    if x:
        span_id = x.parent['id']
        table_id = span_id.replace('dnnTITLE_lblTitle', 'Display_HtmlHolder')        
        values.append(soup.find('td', attrs={'id': table_id}).text)
    else:
        values.append('')

print zip(headings, values)

编程相关推荐

java ImageIO。写入（）低质量图像
使用安卓的设备屏幕大小的java拖放图像
java Adler32重复速度非常快
java在使用Burp Suite Community Edition时遇到此错误
java是否可以在交换机中使用已存在的字符串？
java：把反斜杠看作正常字符的方法
java如何创建Criteria Builder查询来连接三个具有一对一和多对一实体关系的表？
Java Spark：如何在数据集上进行flatMap，并为后续的groupBy提供新的模式？
JavaTestNG运行每个方法，并忽略TestNG中包含的方法。xml
无法使用Java运行linux命令

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用beutilsoup提取表信息？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >