以字典值为条件的假人

mydict={'Zamboni, Clemente' : [100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110], 'Strada, Gino' : [103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114], 'Zeldina, Laura' : [111, 112, 113], 'Silvestri, Simone' : [113]}

2条回答

网友

1楼 · 编辑于 2024-06-16 10:31:48

您可以使用df.pivot：

import pandas as pd
mydict={
    'Zamboni, Clemente' : [100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110], 
    'Strada, Gino' : [103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114], 
    'Zeldina, Laura' : [111, 112, 113], 
    'Silvestri, Simone' : [113]}

df = pd.DataFrame(((val,key) for key, values in mydict.items() for val in values),
                  columns=['index','name'])
df['val'] = 1
print(df.pivot(index='index', columns='name', values='val').fillna(0))

收益率

name   Silvestri, Simone  Strada, Gino  Zamboni, Clemente  Zeldina, Laura
index                                                                    
100                    0             0                  1               0
101                    0             0                  1               0
102                    0             0                  1               0
103                    0             1                  1               0
104                    0             1                  1               0
105                    0             1                  1               0
106                    0             1                  1               0
107                    0             1                  1               0
108                    0             1                  1               0
109                    0             1                  1               0
110                    0             1                  1               0
111                    0             1                  0               1
112                    0             1                  0               1
113                    1             1                  0               1
114                    0             1                  0               0

网友

2楼 · 编辑于 2024-06-16 10:31:48

我认为unutbu的回答相当优雅，但似乎没有认识到“斯特拉达，吉诺”，“泽尔迪娜，劳拉”，“西尔维斯特里，西蒙娜”都认同这一点。你可以这样修。你知道吗

对于你的问题，关键是你的dict暗示'Zeldina, Laura' 'Zamboni, Clemente' 'Silvestri, Simone' 'Strada, Gino'是观察值，而[100 - 114]是观察值。你想做的其实是反过来。您希望将[100 - 114]设置为观察标签，而'Zeldina, Laura' 'Zamboni, Clemente' 'Silvestri, Simone' 'Strada, Gino'是它们的4个可能值。所以一些手工处理的格式转换是不可避免的。你知道吗

import pandas as pd
import numpy as np

mydict={'Zamboni, Clemente' : [100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110], 
'Strada, Gino' : [103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114], 
'Zeldina, Laura' : [111, 112, 113], 
'Silvestri, Simone' : [113]}

mylist = [100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114]

temp = []
for _, value in mydict.items():
    temp.append(pd.Series(value, index=value).reindex(mylist))

df = pd.concat(temp, axis=1)
df.columns = list(mydict.keys())

df.apply(lambda col: np.where(col.isnull(), 0, 1))


Out[40]: 
     Zeldina, Laura  Zamboni, Clemente  Silvestri, Simone  Strada, Gino
100               0                  1                  0             0
101               0                  1                  0             0
102               0                  1                  0             0
103               0                  1                  0             1
104               0                  1                  0             1
105               0                  1                  0             1
106               0                  1                  0             1
107               0                  1                  0             1
108               0                  1                  0             1
109               0                  1                  0             1
110               0                  1                  0             1
111               1                  0                  0             1
112               1                  0                  0             1
113               1                  0                  1             1
114               0                  0                  0             1

相关问题更多 >

编程相关推荐

热门问题

热门文章