我如何在第一个数据帧上运行一个循环,在第二个数据帧上运行一个内循环,以计算他们的科目成绩的差异?

2024-04-20 05:50:39 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的第一个和第二个数据集

First Data set

Here is my second data set

我的目标是找出第一组数据与第二组数据之间的差异。我是在python dask上做的。并停留在这个阶段。任何人都可以帮助我。谢谢


1条回答
网友
1楼 · 发布于 2024-04-20 05:50:39

您可以迭代DFs:

import pandas as pd

data_A = {"student": ["st01", "st02"], "Math": [100, 75], "English": [100, 60]}
data_B = {"student": ["st01", "st02", "st03"], "Math": [100, 85, 90], "English": [100, 60, 70]}
df_A = pd.DataFrame(data=data_A, columns=['student', 'Math', 'English'])
df_B = pd.DataFrame(data=data_B, columns=['student', 'Math', 'English'])

for column in df_A.columns[1:]:
    print(f'Difference between group A and group B for subject {column}:'
          f' {abs(df_A[column].sum() - df_B[column].sum())}')

相关问题 更多 >