从简单字典创建数据帧

2条回答

网友
1楼 · 编辑于 2024-05-16 22:11:04

这里有一个简单的解决方案，但不一定是最快的。更快的解决方案可以使用更快的one_at_index函数numpy可能提供更快的方法
d = {'A': 0, 'C': 0, 'B': 1, 'E': 3, 'D': 1, 'G': 0, 'F': 0, 'I': 3, 'H': 3, 'J': 1} height = max(value for value in d.values()) def one_at_index(index, height): return [0]*index + [1] + [0]*(height - index) result = pd.DataFrame({key: one_at_index(value, height) for key, value in d.items()}) print(result) Out: A C B E D G F I H J 0 1 1 0 0 0 1 1 0 0 0 1 0 0 1 0 1 0 0 0 0 1 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 1 0 0 0 1 1 0
如果列顺序对您很重要，只需添加columns=list("ABCDEFGHIJ")或等效于pd.DataFrame调用

网友
2楼 · 编辑于 2024-05-16 22:11:04

sklearn库提供了一个没有显式循环的解决方案
from sklearn.preprocessing import MultiLabelBinarizer d = {'A': 0, 'C': 0, 'B': 1, 'E': 3, 'D': 1, 'G': 0, 'F': 0, 'I': 3, 'H': 3, 'J': 1} mlb = MultiLabelBinarizer() s = pd.DataFrame(list(d.items())).groupby(1)[0].apply(list).rename_axis(None) res = pd.DataFrame(mlb.fit_transform(s), columns=mlb.classes_, index=s.index)\ .reindex(range(s.index.max()+1)).fillna(0).astype(int) print(res) A B C D E F G H I J 0 1 0 1 0 0 1 1 0 0 0 1 0 1 0 1 0 0 0 0 0 1 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 1 0 0 1 1 0

相关问题更多 >

编程相关推荐

热门问题

热门文章