与Pandas群体合作

df2 = pd.DataFrame(np.random.randint(0,3,size=(10, 4)),columns=['ONE', 'TWO', 'CARS', 'FOUR']) df2['NAMES'] = ['Peter','Jon','Mary','Mary','Peter','Peter','BONIFACE','Michael','Lucy','Gilari'] df2['CARS'] = ['Mercedes','BMW','Ford','BMW','BMW','Dacia','Ford','Pontiac','Chevrolet','Tesla']

1条回答

网友

1楼 · 发布于 2024-06-09 14:30:44

似乎您需要带有自定义函数f的^{}：

np.random.seed(100)
df2 = pd.DataFrame(np.random.randint(0,3,size=(10, 4)),columns=['ONE', 'TWO', 'CARS', 'FOUR'])
df2['NAMES'] = ['Peter','Jon','Mary','Mary','Peter','Peter','BONIFACE','Michael','Lucy','Gilari']
df2['CARS'] = ['Mercedes','BMW','Ford','BMW','BMW','Dacia','Ford','Pontiac','Chevrolet','Tesla']
print (df2)
   ONE  TWO       CARS  FOUR     NAMES
0    0    0   Mercedes     2     Peter
1    2    0        BMW     1       Jon
2    2    2       Ford     2      Mary
3    1    0        BMW     0      Mary
4    0    2        BMW     1     Peter
5    1    2      Dacia     0     Peter
6    0    1       Ford     1  BONIFACE
7    0    0    Pontiac     1   Michael
8    1    2  Chevrolet     2      Lucy
9    1    1      Tesla     2    Gilari

def f(x):
    if (x.name == 'BMW'):
        x.loc[x.ONE == 2, 'FOUR'] = x.TWO
    return x

agrupe = df2.groupby('CARS').apply(f)
print (agrupe)
   ONE  TWO       CARS  FOUR     NAMES
0    0    0   Mercedes     2     Peter
1    2    0        BMW     0       Jon
2    2    2       Ford     2      Mary
3    1    0        BMW     0      Mary
4    0    2        BMW     1     Peter
5    1    2      Dacia     0     Peter
6    0    1       Ford     1  BONIFACE
7    0    0    Pontiac     1   Michael
8    1    2  Chevrolet     2      Lucy
9    1    1      Tesla     2    Gilari

更好的解决方案是首先选择列CARS为BMW且列ONE为2的所有行，然后按列TWO更改FOUR：

df2.loc[(df2.CARS == 'BMW') & (df2.ONE == 2), 'FOUR'] = df2.TWO
print (df2)
   ONE  TWO       CARS  FOUR     NAMES
0    0    0   Mercedes     2     Peter
1    2    0        BMW     0       Jon
2    2    2       Ford     2      Mary
3    1    0        BMW     0      Mary
4    0    2        BMW     1     Peter
5    1    2      Dacia     0     Peter
6    0    1       Ford     1  BONIFACE
7    0    0    Pontiac     1   Michael
8    1    2  Chevrolet     2      Lucy
9    1    1      Tesla     2    Gilari

或者如果需要更改列ONE中的2，则按列TWO更改列FOUR：

np.random.seed(13)
df2 = pd.DataFrame(np.random.randint(0,3,size=(10, 4)),columns=['ONE', 'TWO', 'CARS', 'FOUR'])
df2['NAMES'] = ['Peter','Jon','Mary','Mary','Peter','Peter','BONIFACE','Michael','Lucy','Gilari']
df2['CARS'] = ['Mercedes','BMW','Ford','BMW','BMW','Dacia','Ford','Pontiac','Chevrolet','Tesla']
print (df2)
   ONE  TWO       CARS  FOUR     NAMES
0    2    0   Mercedes     0     Peter
1    2    2        BMW     1       Jon
2    0    2       Ford     0      Mary
3    2    2        BMW     2      Mary
4    1    1        BMW     1     Peter
5    0    2      Dacia     1     Peter
6    2    1       Ford     2  BONIFACE
7    0    0    Pontiac     0   Michael
8    2    2  Chevrolet     0      Lucy
9    1    1      Tesla     2    Gilari


df2.loc[df2.ONE == 2, 'FOUR'] = df2.TWO
print (df2)
   ONE  TWO       CARS  FOUR     NAMES
0    2    0   Mercedes     0     Peter
1    2    2        BMW     2       Jon
2    0    2       Ford     0      Mary
3    2    2        BMW     2      Mary
4    1    1        BMW     1     Peter
5    0    2      Dacia     1     Peter
6    2    1       Ford     1  BONIFACE
7    0    0    Pontiac     0   Michael
8    2    2  Chevrolet     2      Lucy
9    1    1      Tesla     2    Gilari

相关问题更多 >

编程相关推荐

热门问题

热门文章

与Pandas群体合作

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >