我正在尝试添加一列基于帐号的值,并在新列中显示结果。另外,我将合同帐户的第一个实例标识为唯一值,其他实例标识为副本。 例如:
Index CA# Duplicate? $ $$
1 1101 True 440.4 880.80
2 1101 False 440.4 -
3 1102 True 440.8 440.80
4 1103 True 441.2 441.20
5 1106 True 442.4 1,327.20
6 1106 False 442.4 -
7 1106 False 442.4 -
我的第一列'CA#'
是标识符,如果它们是第一列也是唯一的CA#
,我想将它们标记为True(or 1)
,否则,我想将它们标记为False(or 0)
。
例如,CA# 1101 on Index 1
将接收True
,CA# 1101 on Index 2
将接收False
。你知道吗
然后我尝试使用这个True标志来求每个CA#
链接到$
列的总数。在CA#1101
的情况下,总的$$
是880.80
。
到目前为止,我只尝试生成一个新列,该列具有CA列上唯一值的布尔标识符,但我只得到代码创建的新序列的真值,我知道这是错误的。你知道吗
import pandas as pd
from pandas import DataFrame, Series
import numpy as np
file_name= ('A:\LEO\Documents\Mock data.xlsx')
sheet_name= ('Sheet1')
data = pd.read_excel(io= file_name, sheet= sheet_name)
data.sort_values('CA#', inplace= True)
data_ltd = DataFrame(data, columns=['CA#','$'])
bool_series = data_ltd['CA'].duplicated()
data_ltd ['bool_series'] = bool_series
print(data_ltd[bool_series].head(10))
这应该可以实现
Duplicated
列的技巧:使用^{} 的倒数:
要获取} 和^{} :
$$
列,我们可以使用^{更新:命令序列会改变结果!这个序列对我有用:
相关问题 更多 >
编程相关推荐