numpy.polynomial.polynomial.polyfit#

polynomial.polynomial.polyfit(x, y, deg, rcond=None, full=False, w=None)[源代码]#

多项式与数据的最小二乘拟合。

返回一个次数为 deg 的多项式的系数,该多项式是给定点 x 处数据值 y 的最小二乘拟合。如果 y 是 1-D 的,则返回的系数也将是 1-D 的。如果 y 是 2-D 的,则执行多次拟合,每次拟合 y 的一列,并将得到的系数存储在 2-D 返回值的相应列中。拟合的多项式形式如下:

\[p(x) = c_0 + c_1 * x + ... + c_n * x^n,\]

其中 ndeg

参数:
xarray_like, shape (M,)

M 个样本(数据)点 (x[i], y[i]) 的 x 坐标。

yarray_like, shape (M,) or (M, K)

样本点的 y 坐标。可以通过为 y 传递一个包含每列一个数据集的 2-D 数组,来一次性调用 polyfit 来独立地拟合具有相同 x 坐标的多个样本点集。

degint 或 1-D array_like

拟合多项式的次数。如果 deg 是一个整数,则拟合中包含直到 deg 次的所有项。对于 NumPy 版本 >= 1.11.0,可以使用一个整数列表来指定要包含的项的次数。

rcondfloat, optional

相对条件数。小于 rcond 的奇异值(相对于最大奇异值)将被忽略。默认值为 len(x)*eps,其中 eps 是平台浮点类型的相对精度,在大多数情况下约为 2e-16。

fullbool, optional

开关,决定返回值性质。当为 False(默认)时,仅返回系数;当为 True 时,还会返回用于求解拟合矩阵方程的奇异值分解的诊断信息。

warray_like, shape (M,), optional

权重。如果不是 None,权重 w[i] 适用于 x[i] 处的未平方残差 y[i] - y_hat[i]。理想情况下,选择的权重应使 w[i]*y[i] 的乘积的误差具有相同的方差。使用逆方差加权时,使用 w[i] = 1/sigma(y[i])。默认值为 None。

返回:
coefndarray, shape (deg + 1,) or (deg + 1, K)

按低到高的顺序排列的多项式系数。如果 y 是 2-D 的,则 coef 的第 k 列中的系数表示对 y 的第 k 列数据的多项式拟合。

[residuals, rank, singular_values, rcond]list

这些值仅在 full == True 时返回。

  • residuals – 最小二乘拟合的残差平方和。

  • rank – 缩放的 Vandermonde 矩阵的数值秩

  • singular_values – 缩放后的 Vandermonde 矩阵的奇异值

  • rcond – rcond 的值。

有关更多详细信息,请参阅 numpy.linalg.lstsq

引发:
RankWarning

当最小二乘拟合中的矩阵秩亏时引发。警告仅在 full == False 时引发。警告可以通过

>>> import warnings
>>> warnings.simplefilter('ignore', np.exceptions.RankWarning)

备注

解是多项式 p 的系数,它最小化加权平方误差之和

\[E = \sum_j w_j^2 * |y_j - p(x_j)|^2,\]

其中 \(w_j\) 是权重。通过建立(通常是超定的)矩阵方程来解决此问题

\[V(x) * c = w * y,\]

其中 Vx 的加权伪 Vandermonde 矩阵,c 是要求解的系数,w 是权重,y 是观测值。然后通过 V 的奇异值分解来求解此方程。

如果 V 的某些奇异值非常小而被忽略(并且 full == False),则会引发 RankWarning。这意味着系数的值可能确定性不高。拟合一个较低次的多项式通常可以消除警告(但这可能不是你想要的;如果你有独立的原因选择度数但不起作用,你可能需要:a) 重新考虑这些原因,和/或 b) 重新考虑你数据的质量)。rcond 参数也可以设置为小于其默认值的值,但由此产生的拟合可能虚假,并包含大量舍入误差。

使用双精度进行多项式拟合通常在多项式次数约为 20 时“失效”。使用切比雪夫或勒让德级数进行拟合通常具有更好的条件,但很大程度上仍取决于样本点的分布和数据的平滑度。如果拟合质量不足,样条可能是个不错的选择。

示例

>>> import numpy as np
>>> from numpy.polynomial import polynomial as P
>>> x = np.linspace(-1,1,51)  # x "data": [-1, -0.96, ..., 0.96, 1]
>>> rng = np.random.default_rng()
>>> err = rng.normal(size=len(x))
>>> y = x**3 - x + err  # x^3 - x + Gaussian noise
>>> c, stats = P.polyfit(x,y,3,full=True)
>>> c # c[0], c[1] approx. -1, c[2] should be approx. 0, c[3] approx. 1
array([ 0.23111996, -1.02785049, -0.2241444 ,  1.08405657]) # may vary
>>> stats # note the large SSR, explaining the rather poor results
[array([48.312088]),                                        # may vary
 4,
 array([1.38446749, 1.32119158, 0.50443316, 0.28853036]),
 1.1324274851176597e-14]

相同,但没有添加噪声

>>> y = x**3 - x
>>> c, stats = P.polyfit(x,y,3,full=True)
>>> c # c[0], c[1] ~= -1, c[2] should be "very close to 0", c[3] ~= 1
array([-6.73496154e-17, -1.00000000e+00,  0.00000000e+00,  1.00000000e+00])
>>> stats # note the minuscule SSR
[array([8.79579319e-31]),
 np.int32(4),
 array([1.38446749, 1.32119158, 0.50443316, 0.28853036]),
 1.1324274851176597e-14]