如何删除表中具有错误(未知)值的行

2024-05-14 06:49:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图删除一行,该行的值错误,但其中一列的值未知

我的数据框看起来像这样

'size'  : ['small', 'small', 'medium','small','small'],
'length': [38, 62, 55,33,22],
'kinds' : ["A","#$" ,"B","C","A"]}

我想删除具有错误值的行。如果该值不包含,则该值是错误的 有什么价值吗

kinds=["A","B","C"]

我试过这样的东西

df[df["kinds"].contains(kinds)]

但是我不能使用contains

我该怎么办


Tags: 数据dfsize错误lengthsmallmedium价值
2条回答

remove low counts from pandas data frame column on condition

您应该删除低计数异常值分类值:

for name in df.columns:
    if df[name].dtypes == 'O':
        s = df[name].value_counts()
        df = df[df.isin(s.index[s >= 3]).values] # 3 value that proper for action.

如果是数值,则应应用异常值分析。如果需要,还可以将分类值更改为数字删除异常值,并将数字转换为分类值

newdf = df[df['kinds'].isin(kinds)]

您只需要检查列中的值是否在列表中

相关问题 更多 >

    热门问题