我正在努力把我作为学习实验写的一个文件刮下来。看起来是这样的:
<div class="container">
<div class="date">1st</div>
<div class="events">
<div class="meeting">
<span class="name">Bob</span>
</div>
</div>
<div class="date">2nd</div>
<div class="event">
<div class="meeting">
<span class="name">Emma</span>
<span class="name">Frank</span>
<span class="name">Charlie</span>
</div>
</div>
<div class="date">3rd</div>
<div class="event">
<div class="meeting">
<span class="name">Lisa</span>
<span class="name">Tony</span>
</div>
</div>
</div>
我想报废的数据,所以它返回的跨度与关联日期。例如:
data = [['1st', 'bob'], ['2nd', 'Emma', 'Frank' 'Charlie'], ['3rd', 'Lisa', 'Tony']]
我遇到的问题是,当我使用以下命令勉强完成时,Div的date
和event
在同一级别上:
for data in schedule_soup.find_all('div', 'container'):
for date in data.find_all('div', 'date'):
print(date)
for name in data.find_all('span', 'name'):
print(name)
我明白了:
<div class="date">1st</div>
<div class="date">2nd</div>
<div class="date">3rd</div>
<span class="name">Bob</span>
<span class="name">Emma</span>
<span class="name">Frank</span>
<span class="name">Charlie</span>
<span class="name">Lisa</span>
<span class="name">Tony</span>
您可以使用zip函数:
试着使用下面的代码,它为我工作
输出
相关问题 更多 >
编程相关推荐