提高优化问题的速度

1 投票
2 回答
2044 浏览
提问于 2025-04-16 19:09

我有一个应用程序,它用来优化一个问题。代码是可以运行的,但我觉得速度有点慢。有没有什么方法可以提高性能(不需要写C语言代码),让Python、Numpy和Scipy用得更好?我觉得插值函数是最耗时的部分。

from scipy.optimize import leastsq
from scipy.interpolate import interp1d
import timeit


class Bond(object):
  def __init__(self, years, cpn):
    self.years = years 
    self.coupon = cpn
    self.cashflows = [(0.0, -1.0)]
    self.cashflows.extend([(float(i),self.coupon) for i in range(1,self.years)])
    self.cashflows.append((float(self.years), 1.0 + self.coupon))

  def pv(self, market):
    return sum([cf[1] * market.df(cf[0]) for cf in self.cashflows])

class Market(object):
  def __init__(self, instruments):
    self.instruments = sorted(
        instruments, key=lambda instrument : instrument.cashflows[-1][0])
    self.knots = [0.0]
    self.knots.extend([inst.cashflows[-1][0] for inst in self.instruments])
    self.dfs = [1.0]
    self.dfs.extend([1.0] * len(self.instruments))
    self.interp = interp1d(self.knots, self.dfs)

  def df(self, day):
    return self.interp(day)

  def calibrate(self):
    leastsq(self.__target, self.dfs[1:])

  def __target(self, x):
    self.dfs[1:] = x
    self.interp = interp1d(self.knots, self.dfs)
    return [bond.pv(self) for bond in self.instruments]


def main():
  instruments = [Bond(i, 0.02) for i in xrange(1, numberOfInstruments + 1)]
  market = Market(instruments)
  market.calibrate()
  print('CALIBRATED')

numberOfTimes = 10
numberOfInstruments = 50
print('%.2f' % float(timeit.timeit(main, number=numberOfTimes)/numberOfTimes))

2 个回答

0

@pv的回答很可能是对的,不过这个回答提供了一种简单的方法,可以确保你的判断是正确的,并且还能告诉你是否还有其他可以改进的地方。

2

你应该尝试将求和和插值的调用进行向量化处理。比如,可以这样做:

import numpy as np

class Bond(object):
  def __init__(self, years, cpn):
    self.years = years
    self.coupon = cpn

    self.cashflows = np.zeros((self.years + 1, 2))
    self.cashflows[:,0] = np.arange(self.years + 1)
    self.cashflows[:,1] = self.coupon
    self.cashflows[0,:] = 0, -1
    self.cashflows[-1,:] = self.years, 1.0 + self.coupon

  def pv(self, market):
    return (self.cashflows[:,1] * market.df(self.cashflows[:,0])).sum()

这样做似乎能让速度提升大约10倍。你还可以用类似的方法,把Market中的knotsdfs列表替换成数组。

重新校准之所以需要时间,是因为leastsq需要再次确认它确实处于一个局部最小值。这需要对目标函数进行数值微分,而这会花费时间,因为你有很多自由变量。这个优化问题相对简单,所以它在几步内就能收敛,这意味着确认最小值所花的时间几乎和解决问题的时间一样多。

撰写回答