比较三列并选择最高的

empty = 0 cancel = 0 release = 0 undetermined = 0 if (df["emptyCount"] > df["cancelcount"]) & (df["emptyCount"] > df["releaseCount"]): empty += 1 elif (df["cancelcount"] > df["emptyCount"]) & (df["cancelcount"] > df["releaseCount"]): cancel += 1 elif (df["releasecount"] > df["emptyCount"]) & (df["releasecount"] > df["emptyCount"]): release += 1 else: undetermined += 1 ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

3条回答

网友

1楼 · 编辑于 2024-06-16 14:48:58

一般来说，应该避免循环。下面是一个矢量化代码的示例，可以满足您的需要：

# data of intereset
s = df[['emptyCount', 'cancelCount', 'releaseCount']]

# maximum by rows
max_vals = s.max(1)

# those are equal to max values:
equal_max = df.eq(max_vals, axis='rows').astype(int)

# If there are single maximum along the rows:
single_max = equal_max.sum(1)==1

# The values:
equal_max.mul(single_max, axis='rows').sum()

输出将是一个如下所示的系列：

emmptyCount    count1
cancelCount    count2
releaseCount   count3
dtype: int64

网友

2楼 · 编辑于 2024-06-16 14:48:58

首先我们找到未确定的行

equal = (df['emptyCount'] == df['cancelcount']) | (df['cancelount'] == df['releaseCount'])

然后我们找到所确定行的最大列

max_arg = df.loc[~equal, ['emptyCount', 'cancelcount', 'releaseCount']].idxmax(axis=1)

数一数

undetermined = equal.sum()
empty = (max_arg == 'emptyCount').sum()
cancel = (max_arg == 'cancelcount').sum()
release = (max_arg == 'releaseCount').sum()

网友

3楼 · 编辑于 2024-06-16 14:48:58

import pandas as pd
import numpy as np


class thing(object):
    def __init__(self):
        self.value = 0

empty , cancel ,  release , undetermined = [thing() for i in range(4)]

dictt = {   0 : empty, 1 : cancel , 2 : release , 3 : undetermined   }

df = pd.DataFrame({
    'emptyCount': [2,4,5,7,3],
    'cancelCount': [3,7,8,11,2],
    'releaseCount': [2,0,0,5,3],   
})

for i in range(1,4):
    series = df.iloc[-4+i]
    for j in range(len(series)):
        if series[j] == series.max():
            dictt[j].value +=1

cancel.value

相关问题更多 >

编程相关推荐

热门问题

热门文章