我目前正在研究一个模型,需要收集的信息不仅仅是关于游戏结果 (此链接https://www.hltv.org/stats/teams/matches/4991/fnatic?startDate=2019-01-01&endDate=2019-12-31) 但是我也希望脚本在HTML源代码中打开另一个链接。。该链接在源代码中可用,它将带我进入一个页面,解释每个匹配的详细结果, (就像who want what round,https://www.hltv.org/stats/matches/mapstatsid/89458/cr4zy-vs-fnatic?startDate=2019-01-01&endDate=2019-12-31&contextIds=4991&contextTypes=team)一样,主要目标是我想知道谁赢得了比赛(从第一个链接开始)以及谁赢得了每场比赛的第一轮(在第二个链接)。这可能吗?这是我现在的剧本
import requests
r = requests.get('https://www.hltv.org/stats/teams/maps/6665/Astralis')
from bs4 import BeautifulSoup
soup = BeautifulSoup(r.text, 'html.parser')
results = soup.find_all('tr')
AstralisResults = []
for result in results[1:]:
date = result.contents[1].text
event = result.contents[3].text
opponent = result.contents[7].text
Map = result.contents[9].text
Score = "'" + result.contents[11].text
WinorLoss = result.contents[13].text
AstralisResults.append((date,event,opponent,Map,Score,WinorLoss))
import pandas as pd
df5 = pd.DataFrame(AstralisResults,columns=['date','event','opponent','Map','Score','WinorLoss'])
df5.to_csv('AstralisResults.csv',index=False,encoding='utf-8')
所以我想了解以下信息:
Date | Opponent | Map | Score | Result | Round1Result |
看起来如果你刮得太快网站就会阻塞,所以不得不在一个时间延迟。有很多方法可以提高代码的效率,但总的来说,我认为它满足了您的要求:
输出:
相关问题 更多 >
编程相关推荐