用Pandas组合几列

2条回答

网友

1楼 · 编辑于 2024-05-15 10:39:30

有几种方法可以做到这一点。最简单的可能是定义一个新列，它是其他列的总和或串联

df["B"] = df["A1"] + df["A2"] + df["A3"]

然后，只保留B不为null的行

df = df[df.B.notnull()]

问候

网友

2楼 · 编辑于 2024-05-15 10:39:30

此方法应达到预期的结果：

import pandas as pd
import numpy as np

d = {"Name": ["Andy", "Brian", "Carlos", "David", "Frank"],
     "A1": [1,np.nan,np.nan,np.nan,2],
     "A2": [np.nan,np.nan,2,np.nan,np.nan],
     "A3": [np.nan,np.nan,np.nan,3,np.nan]}

df = pd.DataFrame(data=d)

#Drops rows where all A* values are NaN
df = df.dropna(subset = ['A1', 'A2', 'A3'], how="all")

#Sums values to produce result
df["A"] = df.sum(axis=1)

#Alternative method for getting 'A'
#df["A"] = df[["A1", "A2", "A3"]].bfill(axis=1).iloc[:, 0]

#Returns final char of column name of first non-NaN column
df["A-ID"] = df[["A1", "A2", "A3"]].apply(lambda row: row.first_valid_index()[-1], axis=1)

#Dropping old A* columns
df = df.drop(["A1", "A2", "A3"], axis=1)

print(df)

     Name    A A-ID
0    Andy  1.0    1
2  Carlos  2.0    2
3   David  3.0    3
4   Frank  2.0    1

相关问题更多 >

编程相关推荐

热门问题

热门文章

用Pandas组合几列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >