在pandas中组合和格式化数据类型

2024-06-12 07:22:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个项目,最终我想尝试预测NBA主场出勤率。我已经收集了我的初步数据,但仍然希望添加其他字段,如竞技场容量、连胜和其他我可能认为有价值的字段

在我最初的数据框架中,我只是不确定如何将日期字段组合在一起,以便于以后绘图和使用。此外,任何其他输入将被视为其他提示。谢谢

DF preview]


Tags: 数据项目框架绘图竞技场容量价值nba
1条回答
网友
1楼 · 发布于 2024-06-12 07:22:59

这里有三个原始字段:日期、年份和时间(工作日可以从中派生。)

一种方法是连接它们的字符串形式并形成一系列日期时间:

>>> concat = df['Date'] + ' ' + df['Year'].astype(str) + ' ' + df['Time']
>>> df['Fulldate'] = pd.to_datetime(concat)

>>> df
  Weekday    Date  Year     Time            Fulldate
0     Tue  Oct 30  2012  7:00 pm 2012-10-30 19:00:00
1     Tue  Oct 30  2012  7:30 pm 2012-10-30 19:30:00
2     Tue  Oct 30  2012  7:00 pm 2012-10-30 19:00:00
3     Wed  Oct 31  2012  7:30 pm 2012-10-31 19:30:00
4     Wed  Oct 31  2012  8:00 pm 2012-10-31 20:00:00

从这里,您可以自由地使用.dt访问器派生其他字段。例如:

>>> df.Fulldate.dt.month
0    10
1    10
2    10
3    10
4    10
Name: Fulldate, dtype: int64

>>> df.Fulldate.dt.weekday.isin((5, 6))  # weekend games

以下是类似datetime的属性的完整列表:

https://pandas.pydata.org/pandas-docs/stable/api.html#datetimelike-properties


将来,试着让你的问题更具体一点,贴一些人们可以轻松复制的东西,而不是图片

相关问题 更多 >