尝试在数据帧中创建一个新的卷。DF已经由market等其他专栏组成。我想做的是按价格和公司分组,然后计算出它们的数量并将其添加到一个名为volume的新列中。以下是我所拥有的:
df['volume'] = df.groupby(['price', 'company']).transform('count')
这确实创建了一个新列,但是它给了我所有的行。我不需要所有的行。例如,在转换之前,我将得到4行,而在转换之后,我仍然得到4行,但是有一个新的列。在
^{pr2}$我想删除重复的行。对于groupby,是否有一个查询只显示如下行:
market company price volume
LA EK 206.0 2
LA SQ 206.0 1
LA SQ 36.0 1
LA EK 36.0 3
您的数据包含重复项,可能是因为您只包含列的一个子集。除了价格,你还需要其他数据(例如,两个不同的交易日可以以相同的价格成交,但你不能从这两个交易日中合计成交量)。在
假设价格对于给定的时间戳、市场和公司是唯一的,并且您首先对时间戳列进行排序(如果有)(如果每个公司和市场只有一个价格,则不需要):
只需使用
drop_duplicates
列['market', 'company', 'price']
:相关问题 更多 >
编程相关推荐