我试图解析出网页中某个类的所有td标记的内容,但是我希望有某种占位符内容,即使标记本身没有。例如,html包含如下td标记:
<td class="odds bdevtt moneylineodds " cfg="">+134</td>
<td class="odds bdevtt moneylineodds " cfg=""></td>
<td class="odds bdevtt moneylineodds " cfg="">-140</td>
我正在尝试获取一个类似['+134','-','-140']的列表作为输出,因此列表中的条目数等于匹配的标记数,其中'-'作为占位符表示标记为空。但是,下面的只返回['+134','-140']。你知道吗
soup.find_all('td', attrs={'class': 'odds bdevtt moneylineodds '})
一种可能的解决方案是使用
or
运算符:印刷品:
一些快速基准:
这张照片:
看起来,解决方案在性能方面是相同的。你知道吗
从
class
属性的值中删除尾随空格,您将得到预期的结果。你知道吗代码:
输出:
原因是当您执行代码时
输出:
相关问题 更多 >
编程相关推荐