Beautifulsoup不获取标签中的所有tr

2024-03-29 12:41:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我在抓取这个链接时遇到问题http://www.kooora.com/?c=12640&cm=m, 我想获取table#contentTable中的所有内容,但它不会返回所有这些内容。 当我在浏览器中查看html时,我发现在第二个标记之后有一个标记,代码读取到该标记之后才开始。在

#get teams
url='http://www.kooora.com/?c=12640&cm=m'
urlopen=urllib2.urlopen(url)

bso=BeautifulSoup(urlopen.read(),'html5lib')

tcontenttable=bso.find('table',attrs={'id':'contentTable'}).find('tbody')
print len(tcontenttable.find_all('tr')) # only 5 

它只返回5,但是它远远大于5。在


Tags: 标记comhttpurl内容链接wwwtable