这里没有。在下面的数据框中,我想添加一个新列,该列的值依赖于col2中的值
df = pd.DataFrame({'col1': [1, 2, 10, 9], 'col2': [3, 4, 5, 6]})
col1 col2
0 1 3
1 2 4
2 10 5
3 9 6
添加新列“col3”,以便-If:col2中的值为<;5,用“In”填充,>;5用'Out'填充,=5用5填充。所需输出如下
col1 col2 col3
0 1 3 In
1 2 4 In
2 10 5 5
3 9 6 Out
我已经能够使用for循环来实现这一点,但在大型数据集上这似乎并不有效。有什么简单的方法吗
我找到了3种方法:使用
np.where
、pd.loc
和pd.apply
(以及@OO7here的建议)我对它们进行了分析,根据{}的{}不同,它们的表现似乎也不同:
使用
size = 10**4
输出:使用
size = 10**5
输出:总之,我想说,您应该亲自尝试这个评测,并为您的应用程序选择最快的方法。 希望这有帮助
试试这个
相关问题 更多 >
编程相关推荐