如何在python2中有选择地从表中删除数据

import urllib2 from bs4 import BeautifulSoup import string import re myurl = 'http://www.bankofcanada.ca/rates/exchange/daily-closing-past-five-day/' soup = BeautifulSoup(urllib2.urlopen(myurl).read(), "lxml") dataTables = soup.find_all('td') brandNewList = [] for x in dataTables: text = x.get_text().strip() brandNewList.append(text) #print text for index, item in enumerate(brandNewList): if item == "U.S. dollar (close)": for item in brandNewList[index:6]: print item

1条回答

网友

1楼 · 发布于 2024-04-26 22:36:24

how can I make the script mode adaptable to different websites?

不同的站点有不同的标记，在您的情况下，几乎不可能建立一个通用的、可靠的定位机制。根据你想要抓取多少个站点，你可以用一个EAFP approach循环不同的定位函数，直到你成功获得货币汇率。你知道吗

请注意，有些资源提供公共或私有api，您实际上不需要刮取它们。你知道吗

顺便说一下，您可以通过定位U.S. dollar (close)标签并获得following ^{} siblings来改进代码：

us_dollar_label = soup.find("td", text="U.S. dollar (close)")
rates = [td.get_text() for td in us_dollar_label.find_next_siblings("td")]

相关问题更多 >

编程相关推荐

热门问题

热门文章