我正在尝试从espn抓取一个表,并将数据发送到熊猫数据框,以便将其导出到excel。我已经完成了大部分的抓取工作,但是在如何将每个'td'标记发送到for循环中唯一的数据帧单元时,我陷入了困境。(代码如下)有什么想法吗?谢谢!在
import requests
import urllib.request
from bs4 import BeautifulSoup
import re
import os
import csv
import pandas as pd
def make_soup(url):
thepage = urllib.request.urlopen(url)
soupdata = BeautifulSoup(thepage, "html.parser")
return soupdata
soup = make_soup("http://www.espn.com/nba/statistics/player/_/stat/scoring-
per-game/sort/avgPoints/qualified/false")
regex = re.compile("^[e-o]")
for record in soup.findAll('tr', {"class":regex}):
for data in record.findAll('td'):
print(data)
事实上,我最近正在为一个班级制作一个每日幻想体育算法的体育网站。这是我写的剧本。也许这种方法对你有用。编一本字典。将其转换为数据帧。在
相关问题 更多 >
编程相关推荐