使用BeautifulSoup从表格单元格获取图片源的帮助
我有一个包含表单的HTML页面,表单里有一个产品的表格。
现在我已经到了一个阶段,正在循环遍历表格的每一行,在每次循环中我会获取所有的单元格。
for tr in t.findAll('tr'):
td = tr.findAll('td')
现在我想从第一列(td)中获取图片的链接。
HTML的结构是这样的:
<tr>
<td ...>
<a href ... >
<img ... src="asdf/asdf.jpg" .. >
</a>
</td>
...
</tr>
我该怎么做呢?我总是想着用正则表达式。
我试过:
td[0].a.image.src
,但这不管用,因为它提示没有'src'这个属性。
1 个回答
6
使用
td[0].a.img['src']
我想你在问题中把img
写成image
可能是个笔误,但重点是,在BeautifulSoup这个库里,要访问一个标签的HTML属性,你需要用索引的方式(就像我上面代码片段中的['src']
),而不是用点语法。点语法其实是沿着树结构往下走的(就像上面提到的那两个点,分别在a
和img
前面)。