使用漂亮的Soup并将我的web源数据隔离在一个“p”标记中,我成功地检索到了我需要的数据。现在,我想迭代变量'table'中的剩余数据(每行和每个单元格),将数据刮到一个列表中。有人能帮我怎么做到这一点吗?我读过其他几篇文章,但没能把它应用到我的具体问题上。。。谢谢。你知道吗
from bs4 import BeautifulSoup
import urllib2
url = "http://www.gks.ru/bgd/free/B00_25/IssWWW.exe/Stg/d000/000715.HTM"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read(), 'html.parser')
table=soup.findAll('p',text=True)
print(table)
假设您想要获得每月的价格数据,您需要在
table
中找到所有tr
元素,并跳过前3行(标题行)。请注意,html.parser
对我不起作用,但lxml
起作用(请参见Differences between parsers):印刷品:
相关问题 更多 >
编程相关推荐