我想从this site中删去时间表。你知道吗
特别是,我希望文本包含在
div #tabs-4 > h3 > a > span
我试过这个,但它只返回第一个项目,而不是项目下的完整树。这个网站使用#tabs-4
四次已经够疯狂了。你知道吗
departures_table = soup.select('#tabs-4')
for div in alilauro_departures_table:
span = div.select('span')
alilauro_timetable.append({
"COMPANY": span[2].text,
"DEPARTURE DATE TIME" : span[0].text,
"ARRIVAL DATE TIME": span[4].text,
"ITINERARIO": span[1].text,
"FERRY NAME": span[3].text
})
试试下面这个密码。你呢不需要选择
#tab
,因为您已经在使用url
链接。你知道吗主要的问题是第一个项目在html部分的表中。其他项目是javascript。因此,您需要使用^{{cd1>}如Kajal应答,或者使用^{{cd2>}。你知道吗
硒代码:
输出:
相关问题 更多 >
编程相关推荐