我不知道如何做到这一点,但我相信这是可行的。我有三个dataframes
具有相同的列定义,但数据集来自不同的年份。然后,我想成对地绘制数字列,一列一列地绘制这些df
中的数据,并适当地标记数据来源的集合。目的是了解按年份比较的每一列的数据模式
我用这2dataframes
来说明我的意思,其中df1
中的数据集分别来自2018
年和df2
年2019
:
df1
id speed accelaration jerk mode
0 1 1.94 -1.01 1.05 foot
1 1 0.93 0.04 -0.17 foot
2 3 0.50 -0.16 0.05 bike
3 3 0.57 0.05 0.19 bike
4 5 3.25 -0.13 -0.09 bus
5 5 0.50 -0.25 0.25 bus
6 5 0.25 0.10 0.25 bus
df2
id speed accelaration jerk mode
0 17 1.5 0.00 0.00 foot
1 17 1.5 0.00 -0.30 foot
2 17 1.5 -0.30 0.06 foot
3 15 4.55 0.01 -0.36 bike
4 15 4.57 -0.35 0.02 bike
5 87 9.82 -0.29 -0.12 bus
6 87 8.65 -0.78 0.07 bus
忽略id
列,我希望得到一个类似于此图的结果(这只是我绘制的预期结果的一个示例):
简单地为每个df
调用sns.pairplot()
两次不会得到预期的结果,正如我所做的那样:
sns.pairplot(df1, vars=df1.columns[1:4], hue='mode')
sns.pairplot(df2, vars=df2.columns[1:4], hue='mode')
plt.show()
有人能描述一下如何从中得到预期的答案吗
'year'
列pandas.concat
组合数据帧'speed'
、'acceleration'
和'jerk'
堆叠成一列'event'
,以创建一个长而整齐的格式数据帧李>'index'
列而不是dfl.index
用作x-axis
李>相关问题 更多 >
编程相关推荐