如何刮取aspx文件

import requests from bs4 import BeautifulSoup html_data=requests.get('https://www.statsf1.com/fr/2021/emilie-romagne/tour-par-tour.aspx') soup=BeautifulSoup(html_data.content) laps_=soup.find_all('td',title_='Safety Car')

1条回答

网友

1楼 · 发布于 2024-05-15 10:38:36

您需要将user-agent添加到请求头中，然后您将得到HTML。此外，还可以使用pandas来解析表

例如：

import pandas as pd
import requests

url = "https://www.statsf1.com/fr/2021/emilie-romagne/tour-par-tour.aspx"

headers = {
    "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36"
}

tables = pd.read_html(requests.get(url, headers=headers).text, flavor="bs4")
print(tables[0].head(10))

输出：

  Unnamed: 0 HAM1 PER2 VER3 LEC4 GAS5  ... ALO15 RAI16 GIO17 MSC18 MAZ19 TSU20
0          1  VER  HAM  LEC  PER  RIC  ...   TSU   MSC   ALO   VET   MAZ   NaN
1          2  VER  HAM  LEC  PER  RIC  ...   MSC   ALO   VET   MAZ   OCO   NaN
2          3  VER  HAM  LEC  PER  RIC  ...   MSC   ALO   MAZ   OCO   VET   NaN
3          4  VER  HAM  LEC  PER  RIC  ...   ALO   MAZ   OCO   VET   MSC   NaN
4          5  VER  HAM  LEC  PER  RIC  ...   ALO   MAZ   OCO   VET   MSC   NaN
5          6  VER  HAM  LEC  PER  RIC  ...   ALO   MAZ   OCO   VET   MSC   NaN
6          7  VER  HAM  LEC  PER  RIC  ...   ALO   OCO   VET   MAZ   MSC   NaN
7          8  VER  HAM  LEC  PER  RIC  ...   ALO   OCO   VET   MAZ   MSC   NaN
8          9  VER  HAM  LEC  PER  RIC  ...   ALO   OCO   VET   MAZ   MSC   NaN
9         10  VER  HAM  LEC  PER  RIC  ...   OCO   VET   ALO   MAZ   MSC   NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何刮取aspx文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >