我在用python计算函数时遇到了一个问题。我想计算一些投资的内部收益率,所有这些都在它们自己的数据框架中描述。我有一个到某一日期为止的每项投资的数据框,因此我有一个多数据框,描述每项投资在不同日期之前的支付流,每个数据框的最后一行包含到该日期为止每项投资的资本存量信息。我这样做是为了得到每项投资的内部收益率的时间序列。我想要计算IRR的每个数据帧都在一个列表中
为了计算每个数据帧的IRR,我使用了以下函数:
def npv(irr, cfs, yrs):
return np.sum(cfs / ((1. + irr) ** yrs))
def irr(cfs, yrs, x0)
return np.asscalar(fsolve(npv, x0=x0, args=(cfs, yrs)))
因此,为了计算列表中每个数据帧的IRR,我做了:
for i, new_df in enumerate(dfs):
cash_flow = new_df.FLOWS.values
years = new_df.timediff.values
output.loc[i, ['DATE']] = new_df['DATE'].iloc[-1]
output.loc[i, ['Investment']] = new_df['Investment'].iloc[-1]
output.loc[i, ['irr']] = irr(cash_flow, years, x0=0.)
输出是我想要创建的数据框架,该数据框架包含我想要的信息,即每个投资直到某个日期的IRR。问题是,它正确地计算了某些数据帧的内部收益率,但对其他数据帧却没有。例如,它正确计算此数据帧的IRR:
DATE INVESTMENT FLOWS timediff
0 2014-02-24 1 -36278400.0 0.0
1 2014-03-25 1 -11490744.0 0.07945205479452055
2 2015-01-22 1 -13244300.0 0.9095890410958904
3 2015-09-24 1 -10811412.0 1.5808219178082192
4 2015-11-12 1 -6208238.0 1.715068493150685
5 2016-01-22 1 -6210161.0 1.9095890410958904
6 2016-03-31 1 -4535569.0 2.0986301369863014
7 2016-05-25 1 8420470.0 2.249315068493151
8 2016-06-30 1 12357138.0 2.347945205479452
9 2016-07-14 1 3498535.0 2.3863013698630136
10 2016-12-26 1 4085285.0 2.8383561643835615
11 2017-06-07 1 3056835.0 3.2849315068493152
12 2017-09-11 1 11254424.0 3.547945205479452
13 2017-11-16 1 9274834.0 3.728767123287671
14 2018-02-22 1 1622857.0 3.9972602739726026
15 2018-05-23 1 2642985.0 4.243835616438356
18 2018-08-23 1 9265099.0 4.495890410958904
16 2018-11-29 1 1011915.0 4.764383561643836
19 2018-12-28 1 1760734.0 4.843835616438356
17 2019-01-14 1 1940112.0 4.890410958904109
20 2019-06-30 1 116957227.3 5.347945205479452
内部收益率为0.215。但是这个数据帧,对于完全相同的投资,它没有。它返回的内部收益率为0.0001,但实际内部收益率应在0.216左右
DATE INVESTMENT FLOWS timediff
0 2014-02-24 1 -36278400.0 0.0
1 2014-03-25 1 -11490744.0 0.07945205479452055
2 2015-01-22 1 -13244300.0 0.9095890410958904
3 2015-09-24 1 -10811412.0 1.5808219178082192
4 2015-11-12 1 -6208238.0 1.715068493150685
5 2016-01-22 1 -6210161.0 1.9095890410958904
6 2016-03-31 1 -4535569.0 2.0986301369863014
7 2016-05-25 1 8420470.0 2.249315068493151
8 2016-06-30 1 12357138.0 2.347945205479452
9 2016-07-14 1 3498535.0 2.3863013698630136
10 2016-12-26 1 4085285.0 2.8383561643835615
11 2017-06-07 1 3056835.0 3.2849315068493152
12 2017-09-11 1 11254424.0 3.547945205479452
13 2017-11-16 1 9274834.0 3.728767123287671
14 2018-02-22 1 1622857.0 3.9972602739726026
15 2018-05-23 1 2642985.0 4.243835616438356
18 2018-08-23 1 9265099.0 4.495890410958904
16 2018-11-29 1 1011915.0 4.764383561643836
19 2018-12-28 1 1760734.0 4.843835616438356
17 2019-01-14 1 1940112.0 4.890410958904109
20 2019-09-30 1 123753575.7 5.6
这两个数据帧具有完全相同的流,但最后一行除外,它包含了该投资在该日期之前的资本存量。因此,这两个数据帧之间的唯一区别是最后一行。这意味着这项投资在此期间没有任何流入或流出。我不明白为什么内部收益率变化这么大。或者为什么一些内部收益率计算不正确
大多数计算正确,但少数计算不正确
谢谢你帮助我
正如我所想,这是一个优化方法的问题。 当我用第二个df尝试您的irr功能时,我甚至收到一个警告:
但是用其他方法尝试一下scipy.optimize.root似乎对我有用。将func更改为:
我刚刚检查了lm和broyden1,它们都与第二个示例收敛到0.216左右。有多种方法,我不知道哪种方法是最好的选择,但大多数方法似乎比fsolve中使用的hybr方法更好
相关问题 更多 >
编程相关推荐