scipy.optimize.curve_fit无法拟合偏移的偏斜高斯曲线

3 投票

2 回答

5208 浏览

提问于 2025-04-17 19:02

我正在尝试用scipy的curve_fit函数来拟合一个偏斜且移动的高斯曲线，但发现有些情况下拟合效果很差，常常得到的结果接近于一条直线，甚至就是一条直线。

下面的代码是从curve_fit的文档中提取的。这个代码提供了一组任意的数据用于测试，但很好地展示了这个问题。

import numpy as np
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt
import math as math
import scipy.special as sp

#def func(x, a, b, c):
#    return a*np.exp(-b*x) + c

def func(x, sigmag, mu, alpha, c,a):
    #normal distribution
    normpdf = (1/(sigmag*np.sqrt(2*math.pi)))*np.exp(-(np.power((x-mu),2)/(2*np.power(sigmag,2))))
    normcdf = (0.5*(1+sp.erf((alpha*((x-mu)/sigmag))/(np.sqrt(2)))))
    return 2*a*normpdf*normcdf + c

x = np.linspace(0,100,100)
y = func(x, 10,30, 0,0,1)
yn = y + 0.001*np.random.normal(size=len(x))

popt, pcov = curve_fit(func, x, yn,) #p0=(9,35,0,9,1))

y_fit= func(x,popt[0],popt[1],popt[2],popt[3],popt[4])

plt.plot(x,yn)
plt.plot(x,y_fit)

问题似乎出现在我把高斯曲线移得太远（使用mu参数）。我尝试过给出初始值，甚至是和我原始函数相同的值，但问题依然存在。当mu=10时，curve_fit的效果很好，但如果我使用mu>=30，它就无法很好地拟合数据了。

scipy 优化算法参数估计数据拟合统计建模曲线拟合初始值偏斜高斯

2 个回答

你可以多次调用 curve_fit 函数，每次用随机的初始猜测，然后选择那些误差最小的参数。

import numpy as np
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt
import math as math
import scipy.special as sp

def func(x, sigmag, mu, alpha, c,a):
    #normal distribution
    normpdf = (1/(sigmag*np.sqrt(2*math.pi)))*np.exp(-(np.power((x-mu),2)/(2*np.power(sigmag,2))))
    normcdf = (0.5*(1+sp.erf((alpha*((x-mu)/sigmag))/(np.sqrt(2)))))
    return 2*a*normpdf*normcdf + c

x = np.linspace(0,100,100)
y = func(x, 10,30, 0,0,1)
yn = y + 0.001*np.random.normal(size=len(x))

results = []
for i in xrange(50):
    p = np.random.randn(5)*10
    try:
        popt, pcov = curve_fit(func, x, yn, p)
    except:
        pass
    err = np.sum(np.abs(func(x, *popt) - yn))
    results.append((err, popt))
    if err < 0.1:
        break

err, popt = min(results, key=lambda x:x[0])
y_fit= func(x, *popt)

plt.plot(x,yn)
plt.plot(x,y_fit)
print len(results)

回答于 2025-04-17 由 Python大师

分享举报

给最小化的起始点通常会有很好的效果。试着给最小化器一些关于最大值位置和曲线宽度的信息：

popt, pcov = curve_fit(func, x, yn, p0=(1./np.std(yn), np.argmax(yn) ,0,0,1))

只需在你的代码中把这一行改成 sigma=10 和 mu=50，就能得到如下效果：

回答于 2025-04-17 由 Python大师

分享举报

scipy.optimize.curve_fit无法拟合偏移的偏斜高斯曲线

2 个回答

撰写回答