给定一个pandas.DataFrame
:
| Col_A | Col_B | Other_Columns
0 | A0 | B0 | …
1 | A1 | B1 | …
2 | A2 | B2 | …
3 | A3 | B3 | …
… | … | … | …
我一直在尝试保留这个DataFrame
的子集:去掉A
和{A6
和{
我不想删除副本。另外,我不想得到唯一值(如果我理解得很好,这类似于将列表转换为集合,对吗?)而是只出现一次的值。在
在这一点上,我得到的是:
^{pr2}$这不是很有效(数据帧相当大,超过10万行),必须有一个更像Python的策略,包括熊猫的固有特征,对吗? 另外,我也不太确定第一行是否正确:通过堆叠两列,我是否确保对两列的条目执行计数?在
如果您需要更多信息,或者我的文字不清楚,请不要犹豫。在
非常感谢您抽出时间:-)
这样的事情怎么样:
更新:
当你做
if (df.at[i,'Col_A'] and df.at[i, 'Col_B']) in myList:
检查时,你检查的不是很正确。。。在以下是正在发生的事情:
^{pr2}$所以你不能这样检查
相关问题 更多 >
编程相关推荐