为工作日和周末创建一个包含按小时和用户类型划分的乘车次数的数据框。使用starttime确定每次骑乘的时间。这是starttime的CSV文件 https://drive.google.com/file/d/0B4KXs5bh3CmPWXJkQWhkbzI0WEE/view?usp=sharing 数据必须采用此格式 pic
df = pd.DataFrame({'Customer':rides['starttime']})
rides['Customer'] = pd.to_datetime(df['Customer'])
df['User Type Hour'] = rides['Customer'].dt.hour
df2=df[rides['usertype']=="Customer"].groupby('User Type Hour').count()
df2
df5 = pd.DataFrame({'Subscriber':rides['starttime']})
rides['Subscriber'] = pd.to_datetime(df5['Subscriber'])
df5['User Type Hour'] = rides['Subscriber'].dt.hour
dfe=df5[rides['usertype']=="Subscriber"].groupby('User Type Hour').count()
dfe
#c= df2.style.set_table_styles([dict(selector="th",props=[('max-width', '100px')])])
frames=[df2,dfe]
#concatinate the dataframes
result=pd.concat(frames, axis=1, join='inner')
result
这是我用来计算一周(周一到周日)小时数的代码。 我搜索了各种各样的帖子,发现
df.index.dayofweek >= 5
但没有得到结果。 小型CSV[文件链接][2]
您可以使用:
为convert columns to datetime添加参数
parse_dates
通过^{} 为
type
创建新系列通过^{} 创建新系列
^{} 按} 并按^{} 重塑
types
、hours
和usertype
聚合^{一些数据清理:
如果需要省略
type
列中的值:相关问题 更多 >
编程相关推荐