试图删除“new”列上基于唯一值的重复项,我甚至尝试了两种方法,但是输出数据框形状建议前后具有相同的df形状,意味着删除重复失败。在
import pandas
import numpy as np
import random
df = pandas.DataFrame(np.random.randn(10, 4), columns=list('ABCD'))
df['new'] = [1, 1, 3, 4, 5, 1, 7, 8, 1, 10]
df['new2'] = [1, 1, 2, 4, 5, 3, 7, 8, 9, 5]
print df.shape
df.drop_duplicates('new', take_last=False)
df.groupby('new').max()
print df.shape
# output
(10, 6)
(10, 6)
[Finished in 1.0s]
您需要指定^{} 的结果,默认情况下是
inplace=False
,这样它就会返回修改后的df的一个副本,因为您不传递paraminplace=True
原始df是未修改的:如果您通过了
^{pr2}$inplace=True
,则可以:相关问题 更多 >
编程相关推荐