numpy.polynomial.polynomial.polyfit#
- polynomial.polynomial.polyfit(x, y, deg, rcond=None, full=False, w=None)[source]#
将多项式拟合到数据的最小二乘法。
返回一个度数为 deg 的多项式的系数,该多项式对给定点 x 处的数值 y 进行最小二乘拟合。如果 y 为 1 维,则返回的系数也将为 1 维。如果 y 为 2 维,则对每列 y 进行多次拟合,结果系数存储在 2 维返回结果的对应列中。拟合的多项式(s) 形式为
\[p(x) = c_0 + c_1 * x + ... + c_n * x^n,\]其中 n 为 deg。
- 参数:
- xarray_like,形状 (M,)
M 个样本 (数据) 点
(x[i], y[i])
的 x 坐标。- yarray_like,形状 (M,) 或 (M, K)
样本点的 y 坐标。通过将 y 传递为包含每列一个数据集的 2 维数组,可以 (独立地) 使用一次对
polyfit
的调用来拟合共享相同 x 坐标的多个样本点集。- degint 或 1 维 array_like
拟合多项式的次数(s)。如果 deg 是一个整数,则拟合中将包含所有直到并包括 deg 次项。对于 NumPy 版本 >= 1.11.0,可以使用指定要包含的项次数的整数列表。
- rcondfloat,可选
拟合的相对条件数。相对于最大奇异值的,小于 rcond 的奇异值将被忽略。默认值为
len(x)*eps
,其中 eps 是平台浮点类型的相对精度,在大多数情况下约为 2e-16。- fullbool,可选
决定返回值性质的开关。当为
False
(默认值) 时,仅返回系数;当为True
时,还将返回来自奇异值分解 (用于求解拟合的矩阵方程) 的诊断信息。- warray_like,形状 (M,),可选
权重。如果非 None,则权重
w[i]
应用于x[i]
处的未平方残差y[i] - y_hat[i]
。理想情况下,应选择权重,使乘积w[i]*y[i]
的误差具有相同的方差。当使用逆方差加权时,使用w[i] = 1/sigma(y[i])
。默认值为 None。版本 1.5.0 中的新增功能。
- 返回值:
- coefndarray,形状 (deg + 1,) 或 (deg + 1, K)
从低到高排序的多项式系数。如果 y 为 2 维,则 coef 的第 k 列中的系数表示对 y 的第 k 列中的数据进行多项式拟合。
- [residuals, rank, singular_values, rcond]list
仅当
full == True
时返回这些值residuals – 最小二乘拟合的平方残差之和
rank – 缩放的范德蒙德矩阵的数值秩
singular_values – 缩放的范德蒙德矩阵的奇异值
rcond – rcond 的值。
有关更多详细信息,请参阅
numpy.linalg.lstsq
。
- 引发:
- RankWarning
如果最小二乘拟合中的矩阵秩亏损,则引发。只有当
full == False
时才会引发警告。可以通过以下方式关闭警告>>> import warnings >>> warnings.simplefilter('ignore', np.exceptions.RankWarning)
另请参阅
备注
解是使加权平方误差之和最小化的多项式 p 的系数
\[E = \sum_j w_j^2 * |y_j - p(x_j)|^2,\]其中 \(w_j\) 为权重。这个问题通过建立 (通常) 超定矩阵方程来解决
\[V(x) * c = w * y,\]其中 V 是 x 的加权伪范德蒙德矩阵,c 是要解出的系数,w 是权重,y 是观测值。然后使用 V 的奇异值分解来求解此方程。
如果 V 的一些奇异值非常小,以至于被忽略 (并且
full
==False
),则将引发RankWarning
。这意味着系数值可能无法很好地确定。拟合到较低阶多项式通常会消除警告 (但这可能不是你想要的;如果你有选择不成功的次数的独立理由,你可能需要:a) 重新考虑这些理由,以及/或 b) 重新考虑你的数据的质量)。rcond 参数也可以设置为小于其默认值的值,但结果拟合可能是虚假的,并且可能受到舍入误差的很大影响。使用双精度进行的多项式拟合在 (多项式) 次数约为 20 时往往会“失败”。使用切比雪夫或勒壤得级数进行拟合通常条件更好,但很多情况仍然取决于样本点的分布和数据的平滑性。如果拟合的质量不足,样条曲线可能是一个不错的选择。
示例
>>> import numpy as np >>> from numpy.polynomial import polynomial as P >>> x = np.linspace(-1,1,51) # x "data": [-1, -0.96, ..., 0.96, 1] >>> rng = np.random.default_rng() >>> err = rng.normal(size=len(x)) >>> y = x**3 - x + err # x^3 - x + Gaussian noise >>> c, stats = P.polyfit(x,y,3,full=True) >>> c # c[0], c[1] approx. -1, c[2] should be approx. 0, c[3] approx. 1 array([ 0.23111996, -1.02785049, -0.2241444 , 1.08405657]) # may vary >>> stats # note the large SSR, explaining the rather poor results [array([48.312088]), # may vary 4, array([1.38446749, 1.32119158, 0.50443316, 0.28853036]), 1.1324274851176597e-14]
相同的事情,没有添加噪声
>>> y = x**3 - x >>> c, stats = P.polyfit(x,y,3,full=True) >>> c # c[0], c[1] ~= -1, c[2] should be "very close to 0", c[3] ~= 1 array([-6.73496154e-17, -1.00000000e+00, 0.00000000e+00, 1.00000000e+00]) >>> stats # note the minuscule SSR [array([8.79579319e-31]), 4, array([1.38446749, 1.32119158, 0.50443316, 0.28853036]), 1.1324274851176597e-14]