在数据帧的一行中添加多个值，同时通过列表进行迭代

df: meat vegetables cheese ketchup egg... hamburger 3 5 2 2 1 pasta 0 0 4 0 1 soup 0 2 0 0 0 ...

meat vegetables cheese ketchup egg... hamburger 3 5 2 2 1 pasta 0 0 4 0 1 soup 0 2 0 0 0 new_user 0 0 10 0 10 ...

3条回答

网友

1楼 · 编辑于 2024-04-27 09:45:49

我不确定这种方法有多有效，但这应该行得通

dislikes = ["cheese","egg"]
new_user = "Tom"
df.loc[new_user] = 0
for dislike in dislikes:
    if dislike not in df.columns:
        df[dislike] = 0
    df.loc[new_user, dislike] = 10

网友

2楼 · 编辑于 2024-04-27 09:45:49

我不确定在单个数据框中将用户与菜肴混合在一起有多“健康”，但这样的功能应该可以做到：

def insert_user_dislikes(user_name='new_user', df=df, ingredients=['meat', 'egg']):
    df.loc[user_name] = [10 if col in ingredients else 0 for col in df.columns]

insert_user_dislikes('new_user', df, ['meat', 'egg'])

编辑1：我也喜欢@Fred的解决方案：

def insert_user_dislikes2(user_name='new_user', df=df, ingredients=['meat', 'egg']):
    df.loc[user_name] = 0
    df.loc[user_name, ingredients] = 10
insert_user_dislikes('user_name', df, ['meat', 'egg'])

编辑2：以下是Shubham的绩效评估解决方案：

def insert_user_dislikes3(user_name='new_user', df=df, ingredients=['meat', 'egg']):
    s = pd.Series(
        np.where(df.columns.isin(ingredients), 10, 0), 
        name=user_name, index=df.columns, dtype='int')
    return df.append(s)

就性能而言（在非常小的数据集上），列表理解速度似乎更快，但：

df = pd.DataFrame([[3, 5, 2, 2, 1],
   [0, 0, 4, 0, 1]],
   columns=['meat', 'vegetables', 'cheese','ketchup', 'egg'],
   index=['hamburger', 'pasta'])

print(timeit.timeit(insert_user_dislikes, number=1000))
0.125

print(timeit.timeit(insert_user_dislikes2, number=1000))
0.547

print(timeit.timeit(insert_user_dislikes3, number=1000))
2.153

网友

3楼 · 编辑于 2024-04-27 09:45:49

将new_user row=设置为零，然后过滤并等于10

print(df)
          meat  vegetables  cheese  ketchup  egg
hamburger     3           5       2        2    1
pasta         0           0       4        0    1
soup          0           2       0        0    0

将新用户创建为零

df.loc["new_user", :] = 0
print(df)
          meat  vegetables  cheese  ketchup  egg
hamburger   3.0         5.0     2.0      2.0  1.0
pasta       0.0         0.0     4.0      0.0  1.0
soup        0.0         2.0     0.0      0.0  0.0
new_user    0.0         0.0     0.0      0.0  0.0

然后再次过滤并设置为10

dislike = ["cheese", "egg"]

df.loc["new_user", dislike] = 10
print(df)
           meat  vegetables  cheese  ketchup   egg
hamburger   3.0         5.0     2.0      2.0   1.0
pasta       0.0         0.0     4.0      0.0   1.0
soup        0.0         2.0     0.0      0.0   0.0
new_user    0.0         0.0    10.0      0.0  10.0

相关问题更多 >

编程相关推荐

热门问题

热门文章

在数据帧的一行中添加多个值，同时通过列表进行迭代

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >