我是一个新的网上刮,现在我试图了解它,以便自动化的博彩比赛与朋友关于德国德甲。(我们使用的平台是kicktipp.de)。我已经成功地登录到了网站,并用python发布了足球比赛的结果。不幸的是,到目前为止这些只是泊松分布随机数。为了改进这个,我的想法是从bwin下载赔率。更确切地说,我试图下载准确结果的几率。问题从这里开始。到目前为止,我还没能提取出那些漂亮的。使用google chrome,我试图理解我需要的html代码的哪一部分。但由于某些原因,我找不到那些美丽的部分。 我现在的代码确实是这样的:
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
my_url = "https://sports.bwin.com/de/sports/4/wetten/fußball#categoryIds=192&eventId=&leagueIds=43&marketGroupId=&page=0&sportId=4&templateIds=0.8649061927316986"
# opening up connection, grabbing the page
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
# html parsing
page_soup = soup(page_html, "html.parser")
containers1 = page_soup.findAll("div", {"class": "marketboard-event-
group__item--sub-group"})
print(len(containers1))
containers2 = page_soup.findAll("table", {"class": "marketboard-event-with-
header__markets-list"})
print(len(containers2))
从集装箱的长度我已经看到,要么他们包含更多的项目,然后我预期,或他们是空的不明原因。。。希望你能指导我。提前谢谢!
您可以将^{} 与^{} 一起使用来刮除生成JavaScript内容的页面,因为这里就是这种情况。
现在
containers
真正有了我们想要的,tables元素,检查更多,很容易看到我们想要的文本在交替的<div>
标记中,因此我们可以使用zip
和iter
创建一个结果和赔率元组列表,交替的divs
列表元素:演示:
根据您希望数据是什么样的,您还可以使用以下内容获取每个表的标题:
相关问题 更多 >
编程相关推荐