Pandas数据帧到字典值

2024-05-15 01:27:41 发布

您现在位置:Python中文网/ 问答频道 /正文

在给定的数据报列I中转换三个数据报格式:

数据报:

user_id item_id ratings
3         2       3
3         3       4
1         3       1
2         1       4

用户数量=3

项目编号=3

评分=0到5

字典=

^{pr2}$

例如

{1:[0,0,1], 2:[4,0,0], 3:[0,3,4]}

所以,目前我能做的就是输出如下:

{1:{3:1}, 2:{1:4}, 3:{2:3, 3:4}} #{user_id:{item_id:rating}.....}

以上输出的代码如下:

import pandas as pd
data = {}
cols = ['user_id', 'item_id', 'ratings']
pf = pd.read_csv('filename', sep='\t', names= cols)
for user, item, rate in pf.values: data.setdefault(user,{})[item] = rate
print data

我的代码中缺少什么,或者我完全走错了路。请帮忙。在


Tags: 数据代码iddatarate格式item评分
2条回答

我会pivot然后构建dict。例如:

pdf = df.pivot("user_id", "item_id").fillna(0)
d = {k: v.tolist() for k,v in pdf.iterrows()}

生产

^{pr2}$

首先,框架:

>>> df
   user_id  item_id  ratings
0        3        2        3
1        3        3        4
2        1        3        1
3        2        1        4

数据透视:

>>> pdf = df.pivot("user_id", "item_id")
>>> pdf
         ratings        
item_id        1   2   3
user_id                 
1            NaN NaN   1
2              4 NaN NaN
3            NaN   3   4

NaNs替换为0:

>>> pdf = df.pivot("user_id", "item_id").fillna(0)
>>> pdf
         ratings      
item_id        1  2  3
user_id               
1              0  0  1
2              4  0  0
3              0  3  4

使用字典理解构建一个行字典:

>>> d = {k: v.tolist() for k,v in pdf.iterrows()}
>>> d
{1: [0.0, 0.0, 1.0], 2: [4.0, 0.0, 0.0], 3: [0.0, 3.0, 4.0]}

有很多方法可以完成最后一步,包括dict(zip(pdf.index, pdf.values.tolist())),但是当你想稍微调整一下时,其中许多方法并不能很容易地概括。在

把你拥有的东西加工成你想要的怎么样:

from collections import defaultdict

processed_data = defaultdict(list)
for k,v in data.items():
    for idx in range(1, 4): # Make sure we check each item
                            # from (1 to 3 inclusive) for each iteration
                            # of the dictionary
        val = v.get(idx, 0)
        processed_data[k].append(val)

processed_data产量:

^{pr2}$

如果您想将它转换回常规字典(从defaultdict),那么 执行以下操作:

dict(processed_data)

它产生了

{1: [0, 0, 1], 2: [4, 0, 0], 3: [0, 3, 4]}

相关问题 更多 >

    热门问题