下面是html页面的示例。尝试创建一个数据集,其中标记<b>
下的值将作为头,标记{
<div class ="profile">
<P class="info">
<b>Full name</b>
<span>Raju Kumar</span>
</p>
<P class="info">
<b>DOB</b>
<span>05/06/1992</span>
</p>
<P class="info">
<b>DOB</b>
<span>05/06/1992</span>
</p>
</div>
下面是我尝试将<b>
标记值作为头。但它只返回第一个<b>
标记值。在
您只找到第一个带有
soup.find
的p
-使用soup.find_all
,就像使用b
标记一样如果我理解正确,您需要循环两次:
您可以通过以下行获取列表:
如果您喜欢字典格式:
^{pr2}$编辑:
如果你需要构建一个数据帧
您有方法DataFrame.from_items,给定一个对序列:
^{3}$或者您可以使用DataFrame.from_dict:
相关问题 更多 >
编程相关推荐