不确定这个标题是否正确。但我需要从数据帧中取出一列,并显示前五个结果。该列是整数和n/a结果的混合。例如,我创建了一个基本数据帧:
regiona col1
a n/a
a 1
a 200
b 208
b 400
b 560
b 600
c 800
c 1120
c 1200
c 1680
d n/a
d n/a
所以,快跑:
import pandas as pd
df = pd.read_csv('test_data.csv')
然后我创建了一个基本函数,这样我就可以在不同的列上使用它,这样构造:
def max_search(indicator):
displaced_count = df[df[indicator] != 'n/a']
table = displaced_count.sort_values([indicator], ascending=[False])
return table.head(5)
但当我跑的时候
max_search('col1')
它返回:
regiona col1
7 c 800
6 b 600
5 b 560
4 b 400
3 b 208
所以它忽略了大于800的任何东西。我认为函数应该执行的步骤是:
但是,它没有返回任何超过800?我是不是漏掉了什么很明显的东西?你知道吗
你也可以这样做:
检查数据帧的} 使用
dtypes
,现在是object
。所以首先确保col1
的数据类型是数字。 在^{na_values
,函数将按预期工作:相关问题 更多 >
编程相关推荐