所以我有张桌子:
<table border="1" style="width: 100%">
<caption></caption>
<col>
<col>
<tbody>
<tr>
<td>Pig</td>
<td>House Type</td>
</tr>
<tr>
<td>Pig A</td>
<td>Straw</td>
</tr>
<tr>
<td>Pig B</td>
<td>Stick</td>
</tr>
<tr>
<td>Pig C</td>
<td>Brick</td>
</tr>
在 在
我只是想返回表对的JSON字符串,如下所示:
^{pr2}$但是,在我的代码中,我似乎无法摆脱HTML标记:
stable = soup.find('table')
cells = [ ]
rows = stable.findAll('tr')
for tr in rows[1:4]:
# Process the body of the table
row = []
td = tr.findAll('td')
#td = [el.text for el in soup.tr.finall('td')]
row.append( td[0])
row.append( td[1])
cells.append( row )
return cells
最终,我想这样做: #h=json.dumps文件(单元格) #返回h
我的输出是:
[[<td>Pig A</td>, <td>Straw</td>], [<td>Pig B</td>, <td>Stick</td>], [<td>Pig C</td>, <td>Brick</td>]]
使用
text
属性仅获取元素的内部文本:您可以尝试使用lxml库。在
输出: [[“猪”,“房子类型”],[“猪A”,“稻草”],[“猪B”,“棍子”],[“猪C”,“砖”]]
相关问题 更多 >
编程相关推荐