不使用索引替换pandas数据框中选定单元格的值

>>> d = pd.DataFrame({'year':[2008,2008,2008,2008,2009,2009,2009,2009], ... 'flavour':['strawberry','strawberry','banana','banana', ... 'strawberry','strawberry','banana','banana'], ... 'day':['sat','sun','sat','sun','sat','sun','sat','sun'], ... 'sales':[10,12,22,23,11,13,23,24]}) >>> d day flavour sales year 0 sat strawberry 10 2008 1 sun strawberry 12 2008 2 sat banana 22 2008 3 sun banana 23 2008 4 sat strawberry 11 2009 5 sun strawberry 13 2009 6 sat banana 23 2009 7 sun banana 24 2009 >>> d[d.sales==24] day flavour sales year 7 sun banana 24 2009 >>> d[d.sales==24].sales = 100 >>> d day flavour sales year 0 sat strawberry 10 2008 1 sun strawberry 12 2008 2 sat banana 22 2008 3 sun banana 23 2008 4 sat strawberry 11 2009 5 sun strawberry 13 2009 6 sat banana 23 2009 7 sun banana 24 2009

3条回答

网友

1楼 · 编辑于 2024-05-15 12:35:29

有很多方法可以做到

1

In [7]: d.sales[d.sales==24] = 100

In [8]: d
Out[8]: 
   day     flavour  sales  year
0  sat  strawberry     10  2008
1  sun  strawberry     12  2008
2  sat      banana     22  2008
3  sun      banana     23  2008
4  sat  strawberry     11  2009
5  sun  strawberry     13  2009
6  sat      banana     23  2009
7  sun      banana    100  2009

2

In [26]: d.loc[d.sales == 12, 'sales'] = 99

In [27]: d
Out[27]: 
   day     flavour  sales  year
0  sat  strawberry     10  2008
1  sun  strawberry     99  2008
2  sat      banana     22  2008
3  sun      banana     23  2008
4  sat  strawberry     11  2009
5  sun  strawberry     13  2009
6  sat      banana     23  2009
7  sun      banana    100  2009

3

In [28]: d.sales = d.sales.replace(23, 24)

In [29]: d
Out[29]: 
   day     flavour  sales  year
0  sat  strawberry     10  2008
1  sun  strawberry     99  2008
2  sat      banana     22  2008
3  sun      banana     24  2008
4  sat  strawberry     11  2009
5  sun  strawberry     13  2009
6  sat      banana     24  2009
7  sun      banana    100  2009

网友

2楼 · 编辑于 2024-05-15 12:35:29

不确定旧版本的pandas，但在0.16中，可以基于多个列值设置特定单元格的值。

扩展@waitingkuo提供的答案，也可以基于多个列的值执行相同的操作。

d.loc[(d.day== 'sun') & (d.flavour== 'banana') & (d.year== 2009),'sales'] = 100

网友

3楼 · 编辑于 2024-05-15 12:35:29

老问题了，但是我很惊讶没有人提到numpy的.where()功能（可以直接从pandas模块调用）。

在这种情况下，代码是：

d.sales = pd.np.where(d.sales == 24, 100, d.sales)

据我所知，这是在一个系列中有条件地更改数据的最快方法之一。

1

2

3

相关问题更多 >

编程相关推荐

热门问题

热门文章