在BeautifulSoup中從表格中讀取行

2024-05-04 10:46:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我第一次尝试用BeautifulSoup来阅读表格。你知道吗

print table_body 

工作但是

rows = table_body.find_all('tr')

给予

TypeError: 'NoneType' object is not callable. 

print table_body的结果是:

<tbody>
<tr>
<td>1</td>
<td><input type="checkbox" checked="checked" value="1098371296_GG14" class="tick_select" name="tick_select" id="tick_1098371296_GG14" /></td>
<td><a href="application.jsp?number=1322801&amp;cycle=16/17&amp;route=routecode&amp;seq=0">1098371296</a></td>
<td>GG14</td>
<td>Joe</td>
<td>Doe</td>
<td>US</td>
<td>15/16</td>
<td>15/01/15</td>
<td></td>
<td>05/05/15</td>
<td></td>
<td>R</td>
<td> <abbr title="Withdrawn">Cw</abbr> <abbr title="MS">Mt</abbr> <abbr title="UF elsewhere">Ue</abbr></td>
<td></td>
</tr>
[...]

我做错什么了?你知道吗

我使用的是BeautifulSoup 3.2.1版。你知道吗


Tags: titletablebodyselecttr表格rowstd
2条回答

添加和更改@larsr答案的焦点:

您不应该使用BeautifulSoup 3,它不再被维护。而是升级:

pip install  upgrade beautifulsoup4

并确保将其导入为:

from bs4 import BeautifulSoup

这是因为findAll在BeautifulSoup的最新版本中被重命名为find_all,所以改为写table_body.findAll('tr')。你知道吗

相关问题 更多 >