我在pandas数据框中有下表:
date user_id val1 val2
01/01/2014 00:00:00 1 1790 12
01/02/2014 00:00:00 3 364 15
01/03/2014 00:00:00 2 280 10
02/04/2000 00:00:00 5 259 24
05/05/2003 00:00:00 4 201 39
02/05/2001 00:00:00 5 559 54
05/03/2003 00:00:00 4 231 69
..
该表是使用以下查询从.csv
文件中提取的:
import pandas as pd
newnames = ['date','user_id', 'val1', 'val2']
df = pd.read_csv('expenses.csv', names = newnames, index_col = 'date')
我必须分析每个用户和/或整个用户的个人资料。
为此,我想知道如何在这个阶段将所有的user_id
(没有重复)存储到另一个数据帧df_user_id
(我可以在循环的最后使用它来显示每个用户id的结果)
我对您的总体目标感到困惑,但是如果您想存储所有唯一的用户id,那么可能不应该是数据帧(指数意味着什么?一个简单的numpy数组就足够了,或者一个
Series
如果你有理由需要pandas的方法要获取唯一用户ID的numpy数组,请执行以下操作:
相关问题 更多 >
编程相关推荐