Pandas字典的矢量化查找

import pandas as pd example_dict = { "category1":{ "field1": 0.0, "filed2": 5.0}, "category2":{ "field1": 5.0, "field2": 8.0}} d = {"ids": range(10), "category": ["category1" if x % 2 == 0 else "category2" for x in range(10)]} df = pd.DataFrame(d) # The operation I am trying to vectorize df['category_data'] = df.apply(lambda row: example_dict[row['category']], axis=1)

2条回答

网友

1楼 · 编辑于 2024-04-19 03:39:46

您可以从example_dict创建第二个数据帧，然后^{}这两个数据帧

d2 = pd.DataFrame(example_dict.keys(),columns=
             ['category']).assign(category_data=example_dict.values())

df.merge(d2,on='category',how='left')

    category  ids                     category_data
0  category1    0  {u'filed2': 5.0, u'field1': 0.0}
1  category2    1  {u'field2': 8.0, u'field1': 5.0}
2  category1    2  {u'filed2': 5.0, u'field1': 0.0}
3  category2    3  {u'field2': 8.0, u'field1': 5.0}
4  category1    4  {u'filed2': 5.0, u'field1': 0.0}
5  category2    5  {u'field2': 8.0, u'field1': 5.0}
6  category1    6  {u'filed2': 5.0, u'field1': 0.0}
7  category2    7  {u'field2': 8.0, u'field1': 5.0}
8  category1    8  {u'filed2': 5.0, u'field1': 0.0}
9  category2    9  {u'field2': 8.0, u'field1': 5.0}

将字典值分隔到列

^{pr2}$

网友

2楼 · 编辑于 2024-04-19 03:39:46

通过使用map

df['map']=df.category.map(example_dict)
df
Out[839]: 
    category  ids                   category_data  \
0  category1    0  {'field1': 0.0, 'filed2': 5.0}   
1  category2    1  {'field1': 5.0, 'field2': 8.0}   
2  category1    2  {'field1': 0.0, 'filed2': 5.0}   
3  category2    3  {'field1': 5.0, 'field2': 8.0}   
4  category1    4  {'field1': 0.0, 'filed2': 5.0}   
5  category2    5  {'field1': 5.0, 'field2': 8.0}   
6  category1    6  {'field1': 0.0, 'filed2': 5.0}   
7  category2    7  {'field1': 5.0, 'field2': 8.0}   
8  category1    8  {'field1': 0.0, 'filed2': 5.0}   
9  category2    9  {'field1': 5.0, 'field2': 8.0}   
                              map  
0  {'field1': 0.0, 'filed2': 5.0}  
1  {'field1': 5.0, 'field2': 8.0}  
2  {'field1': 0.0, 'filed2': 5.0}  
3  {'field1': 5.0, 'field2': 8.0}  
4  {'field1': 0.0, 'filed2': 5.0}  
5  {'field1': 5.0, 'field2': 8.0}  
6  {'field1': 0.0, 'filed2': 5.0}  
7  {'field1': 5.0, 'field2': 8.0}  
8  {'field1': 0.0, 'filed2': 5.0}  
9  {'field1': 5.0, 'field2': 8.0}

如果你需要把它们分成不同的列

^{pr2}$

或者

df['map'].apply(pd.Series)
Out[844]: 
   field1  field2  filed2
0     0.0     NaN     5.0
1     5.0     8.0     NaN
2     0.0     NaN     5.0
3     5.0     8.0     NaN
4     0.0     NaN     5.0
5     5.0     8.0     NaN
6     0.0     NaN     5.0
7     5.0     8.0     NaN
8     0.0     NaN     5.0
9     5.0     8.0     NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章