我有一个包含9列的DataFrame,我正试图添加一列基于前3列的唯一值计数(例如,列a、B和C必须匹配才能作为唯一值计数,但其余列可能会有所不同。我试着用groupby来做这个:
df = pd.DataFrame(resultsFile500.groupby(['chr','start','end']).size().reset_index().rename(columns={0:'count'}))
这将返回一个包含5列的DataFrame,计数是我想要的。但是,我还需要原始数据帧中的值,所以我一直在尝试以某种方式将这些计数值作为原始df中的一列。因此,这意味着,如果列chr
、start
和{counts
列在这两行中都是2,但不会折叠成一行。这里有没有一个简单的解决方案,或者我需要一起破解一些东西?在
可以使用
.transform
获得非折叠行为:注意,我必须从
^{pr2}$.transform
结果中选择一个任意列,但是只需执行以下操作:相关问题 更多 >
编程相关推荐