假设如下:
<td title="I want this title" role="gridcell"><a onclick="open" href="#">TEXT</a></td>
现在,我使用以下方法成功地找到了表和单独的行:
^{pr2}$
通过打印cells
我可以看到我找到了正确的行,但是我真的不知道如何获取title属性并将其保存为字符串?我试图使用temp = soup.find('td')['title']
,但是我在做这个时遇到了错误,所以很明显我做错了什么。在
如有任何建议,将不胜感激!在
Tags:
lxml库通常也很有用,因为它可以使用xpath表达式识别HTML结构,这样可以生成更紧凑的代码。在
在本例中,xpath表达式
//td[@title]
请求所有td
元素,但坚持title
属性存在。在for循环中,您可以看到不需要检查属性是否存在,因为这已经完成了。在要获取元素的属性,可以将元素视为字典(dictionary(reference):
在你的情况下:
^{pr2}$注意,我使用了
.get()
方法来避免在没有title
属性的td
元素上失败。在相关问题 更多 >
编程相关推荐