numpy.polyfit#

numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)[源代码]#

最小二乘多项式拟合。

注意

这是旧的 polynomial API 的一部分。自 1.4 版本起,推荐使用 numpy.polynomial 中定义的新的 polynomial API。差异总结可在 迁移指南 中找到。

对点 (x, y) 进行 deg 次多项式拟合 p[0] * x**deg + ... + p[deg]。返回一个系数向量 p,该向量在 degdeg-1、…、0 的顺序上最小化平方误差。

推荐使用 Polynomial.fit 类方法进行新代码编写,因为它在数值上更稳定。更多信息请参阅该方法的文档。

参数:
xarray_like, shape (M,)

M 个样本点 (x[i], y[i]) 的 x 坐标。

yarray_like, shape (M,) or (M, K)

样本点的 y 坐标。可以通过传递一个包含多个共享相同 x 坐标的数据集(每列一个数据集)的二维数组,一次性拟合多个数据集。

degint

拟合多项式的次数

rcondfloat, optional

相对条件数。小于此值(相对于最大奇异值)的奇异值将被忽略。默认值为 len(x)*eps,其中 eps 是浮点类型的相对精度,在大多数情况下约为 2e-16。

fullbool, optional

决定返回值性质的开关。当它为 False(默认值)时,仅返回系数;当它为 True 时,还返回奇异值分解的诊断信息。

warray_like, shape (M,), optional

权重。如果不是 None,权重 w[i] 适用于 x[i] 处的未平方残差 y[i] - y_hat[i]。理想情况下,选择的权重应使 w[i]*y[i] 的乘积的误差具有相同的方差。使用逆方差加权时,使用 w[i] = 1/sigma(y[i])。默认值为 None。

covbool 或 str, 可选

如果给定且不为 False,则不仅返回估计值,还返回其协方差矩阵。默认情况下,协方差乘以 chi2/dof,其中 dof = M - (deg + 1),即权重被假定为不可靠(仅在相对意义上),并且所有内容都进行了缩放,使得约简 chi2 为 1。如果 cov='unscaled',则省略此缩放,这与权重为 w = 1/sigma 的情况相关,其中 sigma 被认为是可靠的不确定性估计。

返回:
pndarray, 形状为 (deg + 1,) 或 (deg + 1, K)

多项式系数,最高次幂在前。如果 y 是 2D 的,则第 k 个数据集的系数在 p[:,k] 中。

残差、秩、奇异值、rcond

这些值仅在 full == True 时返回。

  • residuals – 最小二乘拟合的残差平方和。

  • rank – 缩放后的范德蒙德(Vandermonde)系数矩阵的有效秩

  • singular_values – 缩放后的范德蒙德(Vandermonde)系数矩阵的奇异值

  • rcond – rcond 的值。

有关更多详细信息,请参阅 numpy.linalg.lstsq

Vndarray, 形状为 (deg + 1, deg + 1) 或 (deg + 1, deg + 1, K)

仅当 full == Falsecov == True 时出现。多项式系数估计的协方差矩阵。该矩阵的对角线是每个系数的方差估计。如果 y 是 2D 数组,则第 k 个数据集的协方差矩阵在 V[:,:,k] 中。

警告:
RankWarning

最小二乘拟合的系数矩阵秩亏。仅当 full == False 时才发出警告。

可以通过以下方式关闭警告

>>> import warnings
>>> warnings.simplefilter('ignore', np.exceptions.RankWarning)

另请参阅

polyval

计算多项式值。

linalg.lstsq

计算最小二乘拟合。

scipy.interpolate.UnivariateSpline

计算样条拟合。

备注

该解最小化平方误差

\[E = \sum_{j=0}^k |p(x_j) - y_j|^2\]

在方程中

x[0]**n * p[0] + ... + x[0] * p[n-1] + p[n] = y[0]
x[1]**n * p[0] + ... + x[1] * p[n-1] + p[n] = y[1]
...
x[k]**n * p[0] + ... + x[k] * p[n-1] + p[n] = y[k]

系数 p 的系数矩阵是范德蒙德(Vandermonde)矩阵。

polyfit 在最小二乘拟合病态时会发出 RankWarning。这表示由于数值误差,最佳拟合定义不明确。可以通过降低多项式次数或将 x 替换为 x - x.mean() 来改进结果。rcond 参数也可以设置为小于其默认值的值,但由此产生的拟合可能虚假:包含来自小奇异值的贡献可能会给结果带来数值噪声。

请注意,拟合多项式系数在多项式次数较高或样本点区间中心不良时,本质上是病态的。在这种情况下,应始终检查拟合的质量。当多项式拟合不令人满意时,样条函数可能是一个不错的选择。

参考

[1]

维基百科,“曲线拟合”,https://en.wikipedia.org/wiki/Curve_fitting

[2]

维基百科,“多项式插值”,https://en.wikipedia.org/wiki/Polynomial_interpolation

示例

>>> import numpy as np
>>> import warnings
>>> x = np.array([0.0, 1.0, 2.0, 3.0,  4.0,  5.0])
>>> y = np.array([0.0, 0.8, 0.9, 0.1, -0.8, -1.0])
>>> z = np.polyfit(x, y, 3)
>>> z
array([ 0.08703704, -0.81349206,  1.69312169, -0.03968254]) # may vary

为了方便处理多项式,使用 poly1d 对象很方便。

>>> p = np.poly1d(z)
>>> p(0.5)
0.6143849206349179 # may vary
>>> p(3.5)
-0.34732142857143039 # may vary
>>> p(10)
22.579365079365115 # may vary

高次多项式可能出现剧烈振荡

>>> with warnings.catch_warnings():
...     warnings.simplefilter('ignore', np.exceptions.RankWarning)
...     p30 = np.poly1d(np.polyfit(x, y, 30))
...
>>> p30(4)
-0.80000000000000204 # may vary
>>> p30(5)
-0.99999999999999445 # may vary
>>> p30(4.5)
-0.10547061179440398 # may vary

示例

>>> import matplotlib.pyplot as plt
>>> xp = np.linspace(-2, 6, 100)
>>> _ = plt.plot(x, y, '.', xp, p(xp), '-', xp, p30(xp), '--')
>>> plt.ylim(-2,2)
(-2, 2)
>>> plt.show()
../../_images/numpy-polyfit-1.png