Python从datafram构建摘要数据帧

Employee ID A_ Status C_Code TestCol Result_A Result_B 20000 Yes USA asdasdq True False 20001 No BRA asdasdw True True 200002 USA asdasda True True 200003 asda MEX asdasar False False

Name of the Column No. of Records No. of Employees True_Records False_Records A_Status_Yes A_Status_No Mex_True Mex_False USA_True USA_False Result_A 4 4 3 1 1 1 0 1 2 2

1条回答

网友

1楼 · 发布于 2024-04-25 21:18:14

我想我得到了你想要的：

1-重新创建df:

df = pd.DataFrame({"Employee ID": [20000, 20001, 200002, 200003],
                  "A_ Status": ["Yes", "No", np.nan, "asda"],
                  "C_Code": ["USA", "BRA", "USA", "MEX"],
                  "TestCol": ["asdasdq", "asdasdw", "asdasda", "asdasar"],
                  "Result_A": [True, True, True, False],
                  "Result_B": [False, True, True, False]}, 
                  columns=["Employee ID", "A_ Status", "C_Code", "TestCol", "Result_A", "Result_B"])

2-创建第二个数据帧df2：

df2 = pd.DataFrame(columns=["Name of the Column","No. of Records","No. of Employees","True_Records","False_Records","A_Status_Yes","A_Status_No","Mex_True","Mex_False","USA_True","USA_False"])

3-计算结果：

for column in df.columns[4:]: # For each columns of name pattern `Result_xx`
    print(column)
    a = [column,
        len(df["Employee ID"]), # Not sure about this one
        len(df["Employee ID"]),
        len(df[df[column] == True]),
        len(df[df[column] == False]),
        len(df[df["A_ Status"] == "Yes"]),
        len(df[df["A_ Status"] == "No"]),
        len(df[(df["C_Code"] == "MEX") & (df[column] == True)]),
        len(df[(df["C_Code"] == "MEX") & (df[column] == False)]),
        len(df[(df["C_Code"] == "USA") & (df[column] == True)]),
        len(df[(df["C_Code"] == "USA") & (df[column] == False)])
       ] # Create line as list

    df2.loc[len(df2), :] = a # Append line

4-结果：

+  +           +         +          +        +        -+        +       -+      +      -+      +      -+
|    | Name of the Column   |   No. of Records |   No. of Employees |   True_Records |   False_Records |   A_Status_Yes |   A_Status_No |   Mex_True |   Mex_False |   USA_True |   USA_False |
|  +           +         +          +        +        -+        +       -+      +      -+      +      -|
|  0 | Result_A             |                4 |                  4 |              3 |               1 |              1 |             1 |          0 |           1 |          2 |           0 |
|  1 | Result_B             |                4 |                  4 |              2 |               2 |              1 |             1 |          0 |           1 |          1 |           1 |
+  +           +         +          +        +        -+        +       -+      +      -+      +      -+

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python从datafram构建摘要数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >