我使用的是BeautifulSoup(bs4)和Python,我现在有这个结构
<div class="class1">
<a class="name" href="/doctor/dr-xxxxxxxxx"><h2>Dr. XX XXXX</h2></a>
<p class="specialties"><a href="/location/abcd">ab cd</a></p>
<p class="doc-clinic-name">
<a class="light_grey link" href="/clinic/fff">f ff</a>
</p>
</div>
<div class="class2">
<p class="locality">
<a class="link grey" href="/location/doctors/ccc">c cc</a>
</p>
<p class="fees">INR 999</p>
<div class="timings">
<p><span class="strong">MON-SAT</span><br/><span>11:00AM-1:00PM</span> <span>6:00PM-8:00PM</span></p>
<div class="clear"></div>
</div>
到目前为止我得到的密码是
^{pr2}$所以基本上post和x包含div class1和class2。现在我想提取的信息是
在XXXXXX博士 abcd 法国法郎 ccc公司 999卢比 周一至周六上午11:00至下午1:00
如何在post和x变量内分支以获取所需的信息。谢谢
编辑
我在html中添加了空格。有没有可能在不损害空格的情况下生成一个csv格式? XX XXXX医生,ab cd,f ff,c cc,INR 999,周一至周六上午11:00-下午1:00
首先,你的压痕看起来不对。其次,我不认为在使用
find
时不需要for
循环,因为它应该只返回第一个匹配项。在如果您只需要链接,可以尝试:
或者,如果您想要链接本身:
^{pr2}$您还应该注意到用于搜索类的方法,方法是将dict传递给
find
方法(Edit:我怀疑还有其他方法可以做到这一点)。这就是我学会的方法!)在因此,你可以像你需要的那样具体
相关问题 更多 >
编程相关推荐