查询包含空格的列名为Pandas的数据帧或使用包含sp的列名为drop的方法

2024-04-29 08:52:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望使用pandas根据列名(包含空格)和单元格值删除行。我尝试了各种方法来实现这一点(drop和query方法),但由于名称中的空格,我似乎失败了。是否有方法使用包含空格的名称查询数据,或者我需要先清除所有空格?

csv文件形式的数据

Date,"price","Sale Item"
2012-06-11,1600.20,item1
2012-06-12,1610.02,item2
2012-06-13,1618.07,item3
2012-06-14,1624.40,item4
2012-06-15,1626.15,item5
2012-06-16,1626.15,item6
2012-06-17,1626.15,item7

尝试示例

df.drop(['Sale Item'] != 'Item1')
df.drop('Sale Item' != 'Item1')
df.drop("'Sale Item'] != 'Item1'")

df.query('Sale Item' != 'Item1')
df.query(['Sale Item'] != 'Item1')
df.query("'Sale Item'] != 'Item1'")

在大多数情况下接收到错误

ImportError: 'numexpr' not found. Cannot use engine='numexpr' for query/eval if 'numexpr' is not installed

Tags: 文件csv数据方法名称pandasdfnot
2条回答

如果我正确理解了你的问题,也许你可以使用如下过滤器:

df = df[df['Sale Item'] != 'item1']

返回:

         Date    price Sale Item
1  2012-06-12  1610.02     item2
2  2012-06-13  1618.07     item3
3  2012-06-14  1624.40     item4
4  2012-06-15  1626.15     item5
5  2012-06-16  1626.15     item6
6  2012-06-17  1626.15     item7

the documentation-

DataFrame.drop(labels, axis=0, level=None, inplace=False, errors='raise')

Return new object with labels in requested axis removed

^{}接受要删除的行的index,而不是条件。因此你很可能需要像-

df.drop(df.ix[df['Sale Item'] != 'item1'].index)

请注意,这将删除符合条件的行,因此结果将是不符合条件的行,如果您希望相反,可以在条件之前使用~运算符来否定它。

但这似乎有点过头了,只使用布尔索引来获取所需的行会更容易(如另一个答案所示)。


演示-

In [20]: df
Out[20]:
         Date    price Sale Item
0  2012-06-11  1600.20     item1
1  2012-06-12  1610.02     item2
2  2012-06-13  1618.07     item3
3  2012-06-14  1624.40     item4
4  2012-06-15  1626.15     item5
5  2012-06-16  1626.15     item6
6  2012-06-17  1626.15     item7

In [21]: df.drop(df.ix[df['Sale Item'] != 'item1'].index)
Out[21]:
         Date   price Sale Item
0  2012-06-11  1600.2     item1

相关问题 更多 >