Pandas:使用多索引d旋转

rating BMW Fiat Toyota 0 7 2 3 1 8 1 8 2 9 10 7 3 8 3 9 own BMW Fiat Toyota 0 1 1 0 1 0 1 1 2 0 0 1 3 0 1 1

Measure Rating Own Brand BMW Fiat Toyota BMW Fiat Toyota 0 7 2 3 1 1 0 1 8 1 8 0 1 1 2 9 10 7 0 0 1 3 8 3 9 0 1 1

2条回答

网友

1楼 · 编辑于 2024-06-17 13:37:45

我对自己的问题有了一个新的答案（基于罗曼最初的答案）。关键是要得到所需维度的索引。例如

rating.columns.names = ["Brand"]
rating.index.names = ["n"]
print rating

Brand  BMW  Fiat  Toyota
n                       
0        7     2       3
1        8     1       8
2        9    10       7
3        8     3       9

own.columns.names = ["Brand"]
own.index.names = ["n"]
print own

Brand  BMW  Fiat  Toyota
n                       
0        1     1       0
1        0     1       1
2        0     0       1
3        0     1       1

merged = pd.merge(own.unstack().reset_index(name="Own"), 
                  rating.unstack().reset_index(name="Rating"))
print merged

     Brand  n  Own  Rating
0      BMW  0    1       7
1      BMW  1    0       8
2      BMW  2    0       9
3      BMW  3    0       8
4     Fiat  0    1       2
5     Fiat  1    1       1
6     Fiat  2    0      10
7     Fiat  3    1       3
8   Toyota  0    0       3
9   Toyota  1    1       8
10  Toyota  2    1       7
11  Toyota  3    1       9

然后很容易使用pivot_table命令将其转换为所需的结果：

print merged.pivot_table(rows="Brand", cols="Own", values="Rating")

Own             0  1
Brand               
BMW      8.333333  7
Fiat    10.000000  2
Toyota   3.000000  8

这就是我要找的。再次感谢罗曼指路。

网友

2楼 · 编辑于 2024-06-17 13:37:45

我不是熊猫专家，所以解决方法可能比你想要的更笨拙，但是：

rating = pd.DataFrame({"BMW":[7, 8, 9, 8], "Fiat":[2, 1, 10, 3], "Toyota":[3, 8, 7,9]})
own = pd.DataFrame({"BMW":[1, 0, 0, 0], "Fiat":[1, 1, 0, 1], "Toyota":[0, 1, 1, 1]})

r = rating.unstack().reset_index(name='value')
o = own.unstack().reset_index(name='value')
res = DataFrame({"Brand":r["level_0"], "Rating": r["value"], "Own": o["value"]})
res = res.groupby(["Own", "Brand"]).mean().reset_index()
res.pivot(index="Own", columns="Brand", values="Rating")

# result
# Brand       BMW  Fiat  Toyota
# Own                          
# 0      8.333333    10       3
# 1      7.000000     2       8

另一种解决方案，虽然不太通用（您可以使用for循环，但必须知道在own数据帧中有哪些值）：

d = []
for o in (0, 1):
    t = rating[own == o]
    t["own"] = o
    d.append(t)

res = pd.concat(d).groupby("own").mean()

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas:使用多索引d旋转

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >