如何将一个数据帧中一个类别的多个值与另一个数据帧中同一类别对应的单个值分开

2条回答

网友

1楼 · 编辑于 2024-04-27 00:40:27

可以将^{}与DataFrames的^{}一起使用：

data1 = [["A", 5, 6], ["B", 7, 3], ["C", 9, 6], 
         ["B", 2, 8], ["A", 4, 8], ["C", 8, 1], ["B", 1, 0]]
data1 = pd.DataFrame(data1)
print (data1)
   0  1  2
0  A  5  6
1  B  7  3
2  C  9  6
3  B  2  8
4  A  4  8
5  C  8  1
6  B  1  0

data2= [["A", 5, 8], ["B", 7, 8], ["C", 9, 6]]
data2 = pd.DataFrame(data2)
print (data2)
   0  1  2
0  A  5  8
1  B  7  8
2  C  9  6
print (data1.set_index(0).div(data2.set_index(0)).reset_index())
   0         1         2
0  A  1.000000  0.750000
1  A  0.800000  1.000000
2  B  1.000000  0.375000
3  B  0.285714  1.000000
4  B  0.142857  0.000000
5  C  1.000000  1.000000
6  C  0.888889  0.166667

如果第二个DataFrame中缺少第一列的某些值，则获取NaN，因此需要参数fill_value=1：

data1 = [["A", 5, 6], ["B", 7, 3], ["C", 9, 6],
         ["B", 2, 8], ["A", 4, 8], ["C", 8, 1], ["B", 1, 0]]
data1 = pd.DataFrame(data1)
print (data1)
   0  1  2
0  A  5  6
1  B  7  3
2  C  9  6
3  B  2  8
4  A  4  8
5  C  8  1
6  B  1  0

data2= [["A", 5, 8], ["B", 7, 8]]
data2 = pd.DataFrame(data2)
print (data2)
   0  1  2
0  A  5  8
1  B  7  8

print (data1.set_index(0).div(data2.set_index(0)).reset_index())
   0         1      2
0  A  1.000000  0.750
1  A  0.800000  1.000
2  B  1.000000  0.375
3  B  0.285714  1.000
4  B  0.142857  0.000
5  C       NaN    NaN
6  C       NaN    NaN

print (data1.set_index(0).div(data2.set_index(0), fill_value=1).reset_index())
   0         1      2
0  A  1.000000  0.750
1  A  0.800000  1.000
2  B  1.000000  0.375
3  B  0.285714  1.000
4  B  0.142857  0.000
5  C  9.000000  6.000
6  C  8.000000  1.000

网友

2楼 · 编辑于 2024-04-27 00:40:27

假设data2形成data1中存在的值的子集，可以使用^{}和left join来保持顺序，同时对它们进行分组和分割。你知道吗

res_df = df1.merge(df2, on=[0], how='left')
a = np.column_stack((res_df.iloc[:,0], res_df.iloc[:,1:3].values/res_df.iloc[:,3:].values))
pd.DataFrame(a)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将一个数据帧中一个类别的多个值与另一个数据帧中同一类别对应的单个值分开

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >