基于pandas中的3个不同列查找count列

user_id referral_code referred_by 1 A None 2 B A 3 C B 5 None None 6 E B 7 None none ....

user_id referral_code referred_by weights 1 A None 1 2 B A 3 3 C B 1 5 None None None 6 E B 1 7 None none none

2条回答

网友

1楼 · 编辑于 2024-05-29 06:29:57

您可以使用weights = df.referred_by.value_counts()['myword']+1，然后将它添加到列权重中的df中

网友

2楼 · 编辑于 2024-05-29 06:29:57

您想构建一个新的条件列。如果条件足够简单，可以使用np.where来实现。我建议你看看这个

这里很复杂，应该有一个np.where的解决方案，但不是很明显。在这种情况下，可以使用apply方法。它为您提供了一个机会，让您可以根据需要编写复杂的条件。使用apply比np.where效率低，因为您需要一个python抽象。取决于数据集和条件的复杂性

这里有一个apply的例子：

df = pd.DataFrame(
    [[1, "A" ,   None],
    [2 , "B" ,   "A"],
    [3 , "C" ,   "B"],
    [5 , None,   None],
    [6 , "E"  ,  "B"],
    [7 , None ,  None]],
    columns = 'user_id referral_code referred_by'.split(' ')
)
print(df)
#    user_id referral_code referred_by
# 0        1             A        None
# 1        2             B           A
# 2        3             C           B
# 3        5          None        None
# 4        6             E           B
# 5        7          None        None

weight_refered_by = df.referred_by.value_counts()
print(weight_refered_by)
# B    2
# A    1

def countWeight(row):
    count = 0

    if row['referral_code'] in weight_refered_by.index:
        count = weight_refered_by[row.referral_code]

    if row["referred_by"] != None:
        count += 1

    # If referral_code is none, result is none 
    # because referred_by is included in referral_code
    if row["referral_code"] == None:
        count = None
    return count

df["weights"] = df.apply(countWeight, axis=1)
print(df)
#    user_id referral_code referred_by  weights
# 0        1             A        None      1.0
# 1        2             B           A      3.0
# 2        3             C           B      1.0
# 3        5          None        None      NaN
# 4        6             E           B      1.0
# 5        7          None        None      NaN

希望对你有帮助

相关问题更多 >

编程相关推荐

热门问题

热门文章