如何根据第一列和第二列之间的差异获取数据帧中第三列的值?

2024-04-25 15:03:30 发布

您现在位置:Python中文网/ 问答频道 /正文

所以,我有一个表格如下:

开始-结束 5 5 4 8 10 19 4 4个

现在我要做的是,如果某一行中两列的值相等,那么只在第3列中打印其中一列。如果它们不同,则打印-开始+“-”+结束。数据在数据帧中。例如:

起止范围 5 5 5 4 8 4-8 10 19 10-19 4 4 4 4

这是我正在尝试的代码:

if df['start'] - df['end'] != 0:
   df['range'] = df['start'] + "-" + df['end']
else:
   df['range'] = df['start']

但这是行不通的。我该怎么做?你知道吗


Tags: 数据代码dfifrangestartelse表格
1条回答
网友
1楼 · 发布于 2024-04-25 15:03:30

使用^{}

df['range'] = np.where(df['start'] != df['end'], df['start'] + "-" + df['end'], df['start'])

类似的另一种解决方案:

df['range'] = df['start'] + np.where(df['start'] != df['end'], "-" + df['end'], '')

print (df)
  start end  range
0     5   5      5
1     4   8    4-8
2    10  19  10-19
3     4   4      4

值不是字符串时的解决方案:

s = df['start'].astype(str) 
e = df['end'].astype(str)

df['range'] = np.where(df['start'] != df['end'], s + "-" + e, s)

类似的另一种解决方案:

df['range'] = s + np.where(df['start'] != df['end'], "-" + e, '')

相关问题 更多 >