将Pandas数据帧转换为字典

2024-05-01 21:57:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个四列的数据框。我想把这个数据框转换成一个python字典。我希望第一列的元素是keys,而同一行中其他列的元素是values

数据帧:

    ID   A   B   C
0   p    1   3   2
1   q    4   3   2
2   r    4   0   9  

输出应如下:

字典:

{'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}

Tags: 数据id元素字典keysvalues
3条回答

尝试使用Zip

df = pd.read_csv("file")
d= dict([(i,[a,b,c ]) for i, a,b,c in zip(df.ID, df.A,df.B,df.C)])
print d

输出:

{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

^{}方法将列名设置为字典键,因此需要稍微重新调整数据帧的形状。将“ID”列设置为索引,然后转置数据帧是实现此目的的一种方法。

to_dict()还接受一个“orient”参数,您需要这个参数才能为每个列输出值的列表。否则,将为每一列返回{index: value}格式的字典。

这些步骤可以通过以下行完成:

>>> df.set_index('ID').T.to_dict('list')
{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

如果需要不同的字典格式,下面是可能的方向参数的示例。考虑以下简单的数据帧:

>>> df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]})
>>> df
        a      b
0     red  0.500
1  yellow  0.250
2    blue  0.125

然后选项如下。

dict默认值:列名是键,值是index:data对的字典

>>> df.to_dict('dict')
{'a': {0: 'red', 1: 'yellow', 2: 'blue'}, 
 'b': {0: 0.5, 1: 0.25, 2: 0.125}}

列表-键是列名,值是列数据列表

>>> df.to_dict('list')
{'a': ['red', 'yellow', 'blue'], 
 'b': [0.5, 0.25, 0.125]}

序列类似于“列表”,但值是序列

>>> df.to_dict('series')
{'a': 0       red
      1    yellow
      2      blue
      Name: a, dtype: object, 

 'b': 0    0.500
      1    0.250
      2    0.125
      Name: b, dtype: float64}

拆分-将列/数据/索引拆分为键,值分别为列名、行数据值和索引标签

>>> df.to_dict('split')
{'columns': ['a', 'b'],
 'data': [['red', 0.5], ['yellow', 0.25], ['blue', 0.125]],
 'index': [0, 1, 2]}

记录-每一行变成一个字典,其中键是列名,值是单元格中的数据

>>> df.to_dict('records')
[{'a': 'red', 'b': 0.5}, 
 {'a': 'yellow', 'b': 0.25}, 
 {'a': 'blue', 'b': 0.125}]

索引与“记录”类似,但它是一个字典,其中键是索引标签(而不是列表)

>>> df.to_dict('index')
{0: {'a': 'red', 'b': 0.5},
 1: {'a': 'yellow', 'b': 0.25},
 2: {'a': 'blue', 'b': 0.125}}

遵循以下步骤:

假设您的数据帧如下:

>>> df
   A  B  C ID
0  1  3  2  p
1  4  3  2  q
2  4  0  9  r

一。使用set_indexID列设置为数据帧索引。

    df.set_index("ID", drop=True, inplace=True)

2。使用orient=index参数将索引作为字典键。

    dictionary = df.to_dict(orient="index")

结果如下:

    >>> dictionary
    {'q': {'A': 4, 'B': 3, 'D': 2}, 'p': {'A': 1, 'B': 3, 'D': 2}, 'r': {'A': 4, 'B': 0, 'D': 9}}

三。如果需要将每个示例作为列表运行以下代码。确定列顺序

column_order= ["A", "B", "C"] #  Determine your preferred order of columns
d = {} #  Initialize the new dictionary as an empty dictionary
for k in dictionary:
    d[k] = [dictionary[k][column_name] for column_name in column_order]

相关问题 更多 >