基于另一列中的值减法选择一列中的值

2024-04-28 06:43:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含4列的数据帧。我想把col2的最后一个条目从col2的第二个条目减去最后一个条目,看看从第二个条目减去最后一个条目是否大于10。如果是这样,我想得到第一列中last和second to last的对应值,并用NaN替换第一列中second to last的值,然后创建另一个dataframe作为输出。有什么办法我可以在熊猫身上做吗?你知道吗

col1  col2   col3   col4
 e      21      1    2
 m      20      1    2
 k      9       1    2
 j      20      1    2

输出:

col1         col3   col4
[j, 'NaN']    1      2

我正在寻找基于查询的方法,以便通过应用groupbyfiltering使数据帧格式的输出变得更容易。你知道吗

到目前为止我已经尝试过的代码 好像没用。你知道吗

last = df.iloc[-1]['col2']
second_to_last = df.iloc[-2]['col2']

difference = df.query("{ref} - {ref_1} > 10".format(ref=last, ref_1= second_to_last))

我在第3行遇到的错误:

ValueError: multi-line expressions are only valid in the context of data

Tags: to数据refdataframedf条目nancol2
1条回答
网友
1楼 · 发布于 2024-04-28 06:43:07

您可以使用:

#get last and previous index values
last = df.index[-1]
second_to_last = df.index[-2]

#boolena mask - scalar
m1 = df.loc[last, 'col2'] - df.loc[second_to_last, 'col2'] > 10
#boolean mask - array
m2 = (df.index.isin([last, second_to_last]))
#chain together
m = m1 & m2
print (m)
[False False  True  True]

#filter
df1 = df[m]
print (df1)
  col1  col2  col3  col4
2    k     9     1     2
3    j    20     1     2

#get last row, remove unnecessary column
df2 = df1.iloc[[-1]].drop('col2', axis=1)
#convert value to lsit and add missing value
df2['col1'] = df2['col1'].apply(lambda x: list(x) + [np.nan])
print (df2)
       col1  col3  col4
3  [j, nan]     1     2

相关问题 更多 >