我正试着用漂亮的汤从this website刮走现场离店桌。在
我试过以下方法:
caremar_live_departures_table = list(soup.select('.table-booking-history tr'))
caremar_live_departures_data = []
for tr in caremar_live_departures_table:
td = tr.select('td')
caremar_live_departures_data.append({
'DEPARTURE PORT': td[1].select('span span').text,
'ARRIVAL PORT': td[2].select('span span').text,
'DEPARTURE TIME': td[4].select('span').text,
'ARRIVAL TIME': td[6].select('span').text,
'FEERY TYPE': td[3].select('span span').text,
'STATUS': td[3].select('span span').text
})
我得到了以下错误:
^{pr2}$td应该是一个数组,为什么不是这样?在
我并没有在表中查看所有的数据源。如果你只观察r1类,r2类就得到了你需要的数据。有些只有一个td。因此,只有td[0]可用。这就是为什么你得到
IndexError
另外,我认为你可能把你的列表索引错误了。我已经尽可能地把它修好了。在
输出
^{pr2}$用一个指定感兴趣和顺序的列来表示panda和阅读_html不是更容易吗?在
在列标题更改包括在内的情况下,您可以使其更加明确:
^{pr2}$相关问题 更多 >
编程相关推荐