我有两个蛋白质序列列表,我要检查两个列表中每个条目的存在,比如
list A = [1,2,3,4]
list B= [3,4,5]
## just an example. The result would be convert into csv
result = [
[1, true, false],
[2, true, false], ## 2 only exist in the first list
[3, true, true], ## 3 exist in both lists
[4, true, true],
[5, false, true]
]
我将这两个序列加载到两个不同的数据帧中,但是我不知道如何在数据帧中操作它们。最后我将它们加载到一个集合中,形成一个列表,然后转换回dataframe。我认为正确的方法应该是在数据帧中进行本机操作
^{pr2}$我确实试过这么做
new_dataframe.loc[new_dataframe.shape[0]] = [val, False, False]
而不是附加到本机列表
但是太慢了,我不得不取消死刑。对于list实现,它甚至不需要一秒钟的时间。在
您可以在
indicator
打开的情况下使用merge
,这将创建一个\u merge列,该列提供有关join列中的值是否存在于左侧或右侧或两个数据帧中的信息,然后可以从中创建两个指示列:相关问题 更多 >
编程相关推荐