使用BeautifulSoup从表格单元格获取图片源的帮助

1 投票
1 回答
2907 浏览
提问于 2025-04-16 02:06

我有一个包含表单的HTML页面,表单里有一个产品的表格。

现在我已经到了一个阶段,正在循环遍历表格的每一行,在每次循环中我会获取所有的单元格。

for tr in t.findAll('tr'):
    td = tr.findAll('td')

现在我想从第一列(td)中获取图片的链接。

HTML的结构是这样的:

<tr>
  <td ...>
    <a href ... >
       <img ... src="asdf/asdf.jpg" .. >
    </a>
  </td>

  ...
</tr>

我该怎么做呢?我总是想着用正则表达式。

我试过:

td[0].a.image.src,但这不管用,因为它提示没有'src'这个属性。

1 个回答

6

使用

td[0].a.img['src']

我想你在问题中把img写成image可能是个笔误,但重点是,在BeautifulSoup这个库里,要访问一个标签的HTML属性,你需要用索引的方式(就像我上面代码片段中的['src']),而不是用点语法。点语法其实是沿着树结构往下走的(就像上面提到的那两个点,分别在aimg前面)。

撰写回答