如何从数据帧恢复用户id(不重复)并将其存储在另一个数据帧中以供以后使用

2024-04-24 14:10:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我在数据框中有下表:

date                   user_id     val1     val2       
01/01/2014 00:00:00        1       1790      12         
01/02/2014 00:00:00        3        364      15         
01/03/2014 00:00:00        2        280      10         
02/04/2000 00:00:00        5        259      24         
05/05/2003 00:00:00        4        201      39    
02/05/2001 00:00:00        5        559      54         
05/03/2003 00:00:00        4        231      69         
..

该表是使用以下查询从.csv文件中提取的:

import pandas as pd

newnames = ['date','user_id', 'val1', 'val2']
df = pd.read_csv('expenses.csv', names = newnames, index_col = 'date')

我必须分析每个用户和/或整个用户的个人资料。 为此,我想知道如何在这个阶段将所有的user_id(没有重复)存储到另一个数据帧df_user_id(我可以在循环的最后使用它来显示每个用户id的结果)


Tags: 文件csv数据用户importidpandasdf
1条回答
网友
1楼 · 发布于 2024-04-24 14:10:54

我对您的总体目标感到困惑,但是如果您想存储所有唯一的用户id,那么可能不应该是数据帧(指数意味着什么?一个简单的numpy数组就足够了,或者一个Series如果你有理由需要pandas的方法

要获取唯一用户ID的numpy数组,请执行以下操作:

user_ids = df['user_id'].unique()

相关问题 更多 >