d = ['countries','user','visit']
e = ['usa','aaa',50]
f= ['uk','bbb',20]
g = ['germany','ccc',9]
h = ['india','ddd',30]
i = ['russia','eee',58]
df1 = pd.DataFrame({0:d,1:e,2:f,3:g,4:h,5:i})
0 1 2 3 4 5
0 countries usa uk germany india russia
1 user aaa bbb ccc ddd eee
2 visit 50 20 9 30 58
这是一个有趣的格式数据即将到来,所以我需要先做一些转换。在
以上类似于您的起始格式。在接下来的步骤中,我用国家名称替换列,删除第一行(原来是国家名称),并将索引设置为第一列。在
^{pr2}$Unstack
是它开始与我们习惯的数据帧相似的地方。两次拆封给我们记录格式。Reset_index
提供了一些可以透视的内容,而{简而言之,你不应该这样做。最好避免数据帧的行名。您应该将“country”、“user”和“visit count”设置为列,并为每个tuple添加一个观察值:
那么,如果您想知道用户u在数据帧df中访问过c国多次: 航向位置[(df['user']==u)&;(df['country']==c),'访问'].iloc[0]
相关问题 更多 >
编程相关推荐