我试图抓住桌上的每一个数据。我已经缩小到一个团队的每一列,只需要抓住实际的数字!我的代码是:
import requests
from bs4 import BeautifulSoup
url = 'http://espn.go.com/nfl/statistics/team/_/stat/defense/position/defense'
response = requests.get(url)
html = response.content
soup = BeautifulSoup(html)
HoustonDefense = soup.find('tr', class_="oddrow team-28-34")
print (HoustonDefense.prettify())
这将有休斯顿防御专栏印刷如下:
<tr align="right" class="oddrow team-28-34">
<td align="left">
1
</td>
<td align="left">
<a href="http://espn.go.com/nfl/team/_/name/hou/houston-texans">
Houston
</a>
</td>
<td>
539
</td>
<td>
272
</td>
<td class="sortcell">
811
</td>
<td>
22.0
</td>
<td>
136
</td>
<td>
65
</td>
<td>
9
</td>
<td>
102
</td>
<td>
38
</td>
<td>
1
</td>
<td>
17
</td>
<td>
5
</td>
<td>
2
</td>
</tr>
我想获取每个<td></td>
之间的数字,并将它们赋给一个变量。任何帮助都是惊人的!谢谢!你知道吗
使用
find_all()
查找tr
中的所有td
元素,并获取除前两个单元格(排名和团队名称本身)以外的所有td
元素的文本:印刷品:
相关问题 更多 >
编程相关推荐