提高优化问题的速度
我有一个应用程序,它用来优化一个问题。代码是可以运行的,但我觉得速度有点慢。有没有什么方法可以提高性能(不需要写C语言代码),让Python、Numpy和Scipy用得更好?我觉得插值函数是最耗时的部分。
from scipy.optimize import leastsq
from scipy.interpolate import interp1d
import timeit
class Bond(object):
def __init__(self, years, cpn):
self.years = years
self.coupon = cpn
self.cashflows = [(0.0, -1.0)]
self.cashflows.extend([(float(i),self.coupon) for i in range(1,self.years)])
self.cashflows.append((float(self.years), 1.0 + self.coupon))
def pv(self, market):
return sum([cf[1] * market.df(cf[0]) for cf in self.cashflows])
class Market(object):
def __init__(self, instruments):
self.instruments = sorted(
instruments, key=lambda instrument : instrument.cashflows[-1][0])
self.knots = [0.0]
self.knots.extend([inst.cashflows[-1][0] for inst in self.instruments])
self.dfs = [1.0]
self.dfs.extend([1.0] * len(self.instruments))
self.interp = interp1d(self.knots, self.dfs)
def df(self, day):
return self.interp(day)
def calibrate(self):
leastsq(self.__target, self.dfs[1:])
def __target(self, x):
self.dfs[1:] = x
self.interp = interp1d(self.knots, self.dfs)
return [bond.pv(self) for bond in self.instruments]
def main():
instruments = [Bond(i, 0.02) for i in xrange(1, numberOfInstruments + 1)]
market = Market(instruments)
market.calibrate()
print('CALIBRATED')
numberOfTimes = 10
numberOfInstruments = 50
print('%.2f' % float(timeit.timeit(main, number=numberOfTimes)/numberOfTimes))
2 个回答
0
@pv的回答很可能是对的,不过这个回答提供了一种简单的方法,可以确保你的判断是正确的,并且还能告诉你是否还有其他可以改进的地方。
2
你应该尝试将求和和插值的调用进行向量化处理。比如,可以这样做:
import numpy as np
class Bond(object):
def __init__(self, years, cpn):
self.years = years
self.coupon = cpn
self.cashflows = np.zeros((self.years + 1, 2))
self.cashflows[:,0] = np.arange(self.years + 1)
self.cashflows[:,1] = self.coupon
self.cashflows[0,:] = 0, -1
self.cashflows[-1,:] = self.years, 1.0 + self.coupon
def pv(self, market):
return (self.cashflows[:,1] * market.df(self.cashflows[:,0])).sum()
这样做似乎能让速度提升大约10倍。你还可以用类似的方法,把Market
中的knots
和dfs
列表替换成数组。
重新校准之所以需要时间,是因为leastsq
需要再次确认它确实处于一个局部最小值。这需要对目标函数进行数值微分,而这会花费时间,因为你有很多自由变量。这个优化问题相对简单,所以它在几步内就能收敛,这意味着确认最小值所花的时间几乎和解决问题的时间一样多。