加速熊猫应用或使用映射

import pandas as pd import numpy as np d = pd.DataFrame({'I': np.random.randint(3, size=5), 'B0': np.random.choice([True, False], 5), 'B1': np.random.choice([True, False], 5)})

l = pd.DataFrame({(True, True): [1.1, 2.2, 3.3], (True, False): [1.3, 2.1, 3.1], (False, True): [1.2, 2.1, 3.1], (False, False): [1.1, 2.0, 5.1]} ) l.index.name = 'I' l.columns.names = 'B0', 'B1' l = l.stack(['B0', 'B1'])

I B0 B1 0 False False 1.1 True 1.2 True False 1.3 True 1.1 1 False False 2.0 True 2.1 True False 2.1 True 2.2 2 False False 5.1 True 3.1 True False 3.1 True 3.3

2条回答

网友

1楼 · 编辑于 2024-04-26 14:17:08

这应该更快

find_these = list(zip(d.I, d.B0, d.B1))
d.assign(w=l.loc[find_these].values)

      B0     B1  I    w
0   True  False  0  1.3
1  False  False  0  1.1
2  False  False  1  2.0
3   True  False  1  2.1
4  False   True  2  3.1

使用join

^{pr2}$

时间
小数据

%%timeit
find_these = list(zip(d.I, d.B0, d.B1))
d.assign(w=l.loc[find_these].values)
100 loops, best of 3: 1.98 ms per loop

%timeit d.assign(w=d.apply(lambda x: l[x['I'], x['B0'], x['B1']], axis=1))
100 loops, best of 3: 11.8 ms per loop

%timeit d.join(l.rename('w'), on=['I', 'B0', 'B1'])
100 loops, best of 3: 1.99 ms per loop

%timeit d.merge(l.reset_index())
100 loops, best of 3: 2.89 ms per loop

网友

2楼 · 编辑于 2024-04-26 14:17:08

我们可以将d与平面合并（应用reset_index()）l：

In [5]: d.merge(l.reset_index())
Out[5]:
      B0     B1  I    0
0   True  False  0  1.3
1   True  False  0  1.3
2  False   True  0  1.2
3  False  False  0  1.1
4  False   True  2  3.1

相关问题更多 >

编程相关推荐

热门问题

热门文章