将函数应用于datafram的元素

2条回答

网友

1楼 · 编辑于 2024-05-29 10:59:34

对于性能（因为我们在这里寻找效率），我建议使用NumPy的方法，它使用^{}-

a = df.values
N = df.columns.values.astype(int)
df_out = pd.DataFrame((1-(1+a)**-N)/a, columns=df.columns, index=df.index)

样本输入，输出-

^{pr2}$

使用numexpr模块进一步增强

看看所涉及的计算，我们似乎在处理基于power和{}的操作。这些可以与^{}模块一起使用，以进一步提高性能。在

因此，我们有两种方法，比如-

import numexpr as ne

def numpy_app(df):
    a = df.values
    N = df.columns.values.astype(int)
    return pd.DataFrame((1-(1+a)**-N)/a, columns=df.columns, index=df.index)

def numpy_numexpr_app(df):
    a = df.values
    N = df.columns.values.astype(int)
    return pd.DataFrame(ne.evaluate('(1-(1+a)**-N)/a'), \
                            columns=df.columns, index=df.index)

对更大的数据集进行运行时测试-

In [75]: names = np.random.choice(10000,5000, replace=0)

In [76]: df = pd.DataFrame(np.random.rand(5000,5000), columns=list(names))

# @jezrael's solution using df.apply
In [77]: %timeit df.apply(lambda x: computeAnnuity(x, int(x.name)))
1 loops, best of 3: 3.54 s per loop

In [78]: %timeit numpy_app(df)
1 loops, best of 3: 1.99 s per loop

In [79]: %timeit numpy_numexpr_app(df)
1 loops, best of 3: 393 ms per loop

网友

2楼 · 编辑于 2024-05-29 10:59:34

我想你需要apply：

def computeAnnuity(r,n):
    return (1-(1+r)**-n)/r

df1 = df.apply(lambda x: computeAnnuity(x, x.name))
print (df1)
                  1         3
Scenario1  0.999001  2.723248
Scenario2  0.997009  2.940985
Scenario3  0.999001  2.764591
Scenario4  0.917431  2.964357
Scenario5  0.980392  2.775091

print ((1-(1+0.001)**-1)/0.001)
0.9990009990008542

相关问题更多 >

编程相关推荐

热门问题

热门文章

将函数应用于datafram的元素

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >