用beautifulsoup提取div标签的内容并创建pandas datafram

2024-06-06 21:46:26 发布

男 | 程序猿一只，喜欢编程写python代码。

date = '2017-08-04'
writer = pd.ExcelWriter('MLB Daily Data.xlsx')

url_4 = 'http://www.baseballpress.com/lineups/'+date
resp_4 = requests.get(url_4)
soup_4 = BeautifulSoup(resp_4.text, "lxml")
lineups = soup_4.findAll('div', attrs = {'class': 'players'},limit=None)

row_lineup = 0
for lineup in lineups:
    lineup1 = lineup.prettify()
    lineup2 = lineup1.replace('>'&&'<',',')
    df4 = pd.DataFrame(eval(lineup2))
    df4.to_excel(writer, sheet_name='Starting Lineups', startrow=row_lineups, startcol=0)   
    row_lineups = row_lineups + len(df.index) + 3
writer.save()

我正在尝试从网页中获取启动列表，将其转换为熊猫数据框，然后将其保存到excel文件中。我在把它变成数据帧时遇到了问题。我用逗号代替了括号，因为我认为这样可以将其转换为csv格式。在

Tags：数据 url date excel resp writer row pd

1条回答

网友

1楼 · 发布于 2024-06-06 21:46:26

这可能会让你朝着正确的方向前进，每一行都是一行

data = [[x.text for x in y.findAll('a')] for y in lineups]

df = pd.DataFrame(data)

用beautifulsoup提取div标签的内容并创建pandas datafram

相关问题更多 >

编程相关推荐

热门问题

热门文章

用beautifulsoup提取div标签的内容并创建pandas datafram

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >