如何将Dataframe中某些列中的非空值填充到新列中？如何将np.where（）用于多个条件？

A B C Desired col C user1 Null Null user1 user1 Null Null user1 user1 Null Null user1 user1 Null Null user1 Null user2 Null user2 Null user2 Null user2 Null user2 Null user2 Null user2 Null user2 Null user2 Null user2 Null user2 Null user2 Null Null Null user3 Null Null Null user3 Null Null Null user3 Null Null Null user3

1条回答

网友

1楼 · 发布于 2024-05-29 04:30:32

假设初始df仅为cols A、B和C：

# convert value you don't want to NaNs
df = df.where(df != 'Null')

# temporary list
lst = []

# iterate row-wise
for r in df.iterrows():
    # test if all values in row are the same (1 = no)
    if r[1].nunique() == 1:
        # if different, find the one that is the string and append to list
        a,b,c = r[1] # *this is specific to your example with three cols*
        for i in [a,b,c]:
            if isinstance(i,str):
                lst.append(i)
    else:
        # if same append specified value to list
        lst.append('user3')

df['D'] = lst

这是冗长的，对于非常大的dfs来说会有点慢，但它会产生您期望的结果。而且它是可读的

如果没有包含所有空值的行，它会更干净。那么，一个更干净、一行的df.where（）、.apply（lambda）或掩蔽数组方法更容易实现

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将Dataframe中某些列中的非空值填充到新列中？如何将np.where（）用于多个条件？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >