我有一个Pandas数据集,我想在应用ML算法之前清理它。我想知道如果一行的列的某个元素与一组值不匹配,是否可以删除该行。例如,如果我有数据帧:
a b
0 1 6
1 4 7
2 2 4
3 3 7
...
我希望a
的值是[1,3]
中的一个,b
的值是{
目前,我的实现不起作用,因为我的一些数据行的值附加了错误的字符串。例如,我将使用类似于1abc
的值代替1
。因此,我为什么要删除任何不是该值的整数。在
我的解决方法也有点过时,因为我要删除列a
中没有1或3的条目:
dataset = dataset[(dataset.commute != 1)]
dataset = dataset[(dataset.commute != 3)]
你可以使用pandas isin()
您可以将^{} 与双^{} 和
&
一起使用:或使用^{} :
^{pr2}$但如果need删除所有非数字行,则need ^{} 与{}一起返回} 过滤:
NaN
,然后可以按^{如果需要,请检查某个值是
NaN
还是None
:相关问题 更多 >
编程相关推荐