知识点一:误差传播计算
算法 \(y=f(x_1, x_2)\) 的绝对误差限一阶近似估算原则。
绝对误差限近似公式:
\[\varepsilon(y) \approx \sum_{i=1}^{n} \left| \dfrac{\partial f}{\partial x_i} \right|_{(x_1,\dots,x_n)} \cdot \varepsilon(x_i)\]
其中 \(\varepsilon(y)\) 代表输出量 \(y\) 的绝对误差限,\(\varepsilon(x_i)\) 代表自变量 \(x_i\) 的绝对误差限。
计算流程:求各变量偏导数 \(\rightarrow\) 代入近似节点取绝对值 \(\rightarrow\) 乘以对应误差限求和。
处理无具体点取值情况:保留符号,或取三角函数的最大理论界限(如 \(|\cos x| \le 1\))。
已知算法 \(y=f(x_{1}, x_{2})=x_{1}^{2}+\sin x_{2}\),已知 \(x_{1}\) 和 \(x_{2}\) 的绝对误差限分别为 \(|\varepsilon(x_{1})|<0.001\) 和 \(|\varepsilon(x_{2})|<0.002\),求 \(\varepsilon(y)\) 的界限。
解析
偏导数计算:
\[\frac{\partial f}{\partial x_1} = 2x_1\]
\[\frac{\partial f}{\partial x_2} = \cos x_2\]
代入误差传播公式:\(|\varepsilon(y)| \le |2x_1| \cdot 0.001 + |\cos x_2| \cdot 0.002\)
考虑最坏情况,取三角函数极大值:\(|\cos x_2| = 1\)
设定自变量基准量级:\(|x_1| \approx 1 \implies |2x_1| \approx 2\)
极值代入计算:\(|\varepsilon(y)| \le 2 \times 0.001 + 1 \times 0.002 = 0.004\)
答案:0.004
已知算法 \(y=f(x_1,x_2)=x_1^2+x_2\sin x_1\),已知 \(x_1^*=\frac{\pi}{3}, x_2^*=1\)。绝对误差限 \(|\varepsilon(x_1)|<0.001, |\varepsilon(x_2)|<0.002\),求 \(|\varepsilon(y)|\)。
解析
偏导数计算:
\[\frac{\partial f}{\partial x_1}=2x_1+x_2\cos x_1\]
\[\frac{\partial f}{\partial x_2}=\sin x_1\]
代入精确近似节点 \(x_1=\frac{\pi}{3} \approx 1.0472\), \(x_2=1\):
\[\frac{\partial f}{\partial x_1} = 2 \times 1.0472 + 1 \times \cos\left(\frac{\pi}{3}\right) = 2.0944 + 0.5 = 2.5944\]
\[\frac{\partial f}{\partial x_2} = \sin\left(\frac{\pi}{3}\right) \approx 0.8660\]
误差项累加计算:
\[|\varepsilon(y)| \le 2.5944 \times 0.001 + 0.8660 \times 0.002\]
\[|\varepsilon(y)| = 0.0025944 + 0.0017320 = 0.0043264\]
答案:0.00433
已知 \(V = \pi r^2 h\),\(r=10\,\text{m}, h=20\,\text{m}\),\(\varepsilon(r)=0.1\,\text{m}, \varepsilon(h)=0.2\,\text{m}\)。求体积的误差限。
解析
- 求偏导:
\(\frac{\partial V}{\partial r} = 2\pi r h\),\(\frac{\partial V}{\partial h} = \pi r^2\) - 代入节点:
\(|2\pi(10)(20)| = 400\pi\),\(|\pi(10^2)| = 100\pi\) - 加权求和:
\(\varepsilon(V) \approx 400\pi \times 0.1 + 100\pi \times 0.2 = 40\pi + 20\pi = 60\pi \approx 188.5\,\text{m}^3\) - 相对误差限:
\(V_0 = \pi(10)^2(20) = 2000\pi\),\(\delta(V) = \frac{60\pi}{2000\pi}=3\%\)
- 求偏导:
知识点二:多项式插值(Lagrange、Newton与样条)
1 Lagrange插值和Newton 插值
1.1 Lagrange 插值(写多项式)
基函数: \[ \ell_k(x)=\prod_{\substack{j=0 \\ j \ne k}}^{n} \frac{x-x_j}{x_k-x_j} \]
插值多项式: \[ L_n(x)=\sum_{k=0}^{n} y_k \ell_k(x) \]
1.2 Newton 插值(建差商表)
差商递推(按表逐列计算): - 零阶:\(f[x_i]=f(x_i)\) - 一阶:\(f[x_i,x_{i+1}]=\dfrac{f_{i+1}-f_i}{x_{i+1}-x_i}\) - 二阶:\(f[x_i,x_{i+1},x_{i+2}]=\dfrac{f[x_{i+1},x_{i+2}]-f[x_i,x_{i+1}]}{x_{i+2}-x_i}\)
插值多项式: \[ N_n(x)=f[x_0]+\sum_{k=1}^{n} f[x_0,\cdots,x_k]\prod_{i=0}^{k-1}(x-x_i) \]
1.3 截断误差(写余项)
通用公式(\(n\)次插值): \[ R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}\prod_{i=0}^{n}(x-x_i) \]
考场特例:
线性插值:\(R_1(x)=\dfrac{f''(\xi)}{2}(x-x_0)(x-x_1)\)
二次插值:\(R_2(x)=\dfrac{f'''(\xi)}{6}(x-x_0)(x-x_1)(x-x_2)\)
2 三次样条 · M法(三弯矩)
2.1 适用场景与准备
适用场景:
题目给二阶导数(自然边界 \(S''=0\) 或固定 \(S''=A\))→ 直接赋值;
题目给一阶导数(\(S'=A\))但强制要求用M法 → 用端点耦合方程。
准备工作:求步长 \(h_j = x_{j+1} - x_j \quad (j=0,\dots,n-1)\)
2.2 内部节点方程(\(j=1,\dots,n-1\))
系数计算: \[ \mu_j=\frac{h_{j-1}}{h_{j-1}+h_j},\qquad \lambda_j=\frac{h_j}{h_{j-1}+h_j} \] \[ d_j=\frac{6}{h_{j-1}+h_j}\left(\frac{f_{j+1}-f_j}{h_j}-\frac{f_j-f_{j-1}}{h_{j-1}}\right) \]
内部方程: \[ \mu_j M_{j-1}+2M_j+\lambda_j M_{j+1}=d_j \]
2.3 边界条件补全(查表直接代入)
| 题目给出的边界 | M法首尾方程(直接抄) |
|---|---|
| 自然边界(\(S''=0\)) | \(M_0=0,\quad M_n=0\) |
| 固定二阶导数(\(S''(x_0)=A,\ S''(x_n)=B\)) | \(M_0=A,\quad M_n=B\) |
| 固定一阶导数(\(S'(x_0)=A,\ S'(x_n)=B\)) | \(2M_0+M_1=\dfrac{6}{h_0}\big(f[x_0,x_1]-A\big)\) \(M_{n-1}+2M_n=\dfrac{6}{h_{n-1}}\big(B-f[x_{n-1},x_n]\big)\) |
2.4 解方程与写分段表达式
第4步:解三对角方程组 \(\to\) 求出 \(M_0,M_1,\dots,M_n\)。
第5步:在第 \(j\) 个区间 \([x_j,x_{j+1}]\) 上写表达式(\(j=0,\dots,n-1\)): \[ \boxed{ \begin{aligned} S_j(x)=&\frac{M_j}{6h_j}(x_{j+1}-x)^3+\frac{M_{j+1}}{6h_j}(x-x_j)^3 \\ &+\left(f_j-\frac{M_j h_j^2}{6}\right)\frac{x_{j+1}-x}{h_j} +\left(f_{j+1}-\frac{M_{j+1} h_j^2}{6}\right)\frac{x-x_j}{h_j} \end{aligned} } \]
3 三次样条 · m法(三转角)
3.1 适用场景与准备
适用场景:题目明确给定端点一阶导数(\(m_0=S'(x_0)=A,\ m_n=S'(x_n)=B\))→ 无脑选用m法。若给二阶导数,直接改用上面的 M法。
准备工作:求步长 \(h_j = x_{j+1} - x_j \quad (j=0,\dots,n-1)\)
3.2 内部节点方程(\(j=1,\dots,n-1\))
系数计算(注意 \(\lambda\) 和 \(\mu\) 与M法定义相反): \[ \lambda_j=\frac{h_j}{h_{j-1}+h_j},\qquad \mu_j=\frac{h_{j-1}}{h_{j-1}+h_j} \] \[ c_j=3\left(\lambda_j f[x_{j-1},x_j]+\mu_j f[x_j,x_{j+1}]\right) \]
内部方程: \[ \lambda_j m_{j-1}+2m_j+\mu_j m_{j+1}=c_j \]
3.3 边界条件与写分段表达式
边界直接赋值: \[ m_0 = f'(x_0),\qquad m_n = f'(x_n) \]
解方程组 \(\to\) 求出 \(m_0,\dots,m_n\)。
在第 \(j\) 个区间 \([x_j,x_{j+1}]\) 上写Hermite插值表达式(令 \(t=\dfrac{x-x_j}{h_j}\)): \[ \boxed{ \begin{aligned} S_j(x)=&f_j(1+2t)(1-t)^2 + f_{j+1}(3-2t)t^2 \\ &+ m_j\cdot h_j \cdot t(1-t)^2 + m_{j+1}\cdot h_j \cdot (t-1)t^2 \end{aligned} } \]
4 考场决策速查表
| 题给边界条件 | 选用方法 | 操作口诀 |
|---|---|---|
| \(S''(x_0)=A,\ S''(x_n)=B\)(含自然边界 \(A=B=0\)) | M法 | 直接令 \(M_0=A,\ M_n=B\) |
| \(S'(x_0)=A,\ S'(x_n)=B\) | m法 | 直接令 \(m_0=A,\ m_n=B\)(推荐) |
| \(S'(x_0)=A,\ S'(x_n)=B\) 但题目强制用M法 | M法 | 套用 \(\S 2.3\) 的"固定一阶导数"耦合方程 |
周期边界处理:若题目出现 \(f_0=f_n\),只需在方程组中补充 \(M_0=M_n\)(或 \(m_0=m_n\)),方程个数降为 \(n\) 个,其余内部形式不变。若未特别说明,默认按非周期边界处理。
已知函数 \(y=f(x)\) 通过节点 \((-1,1),(1,2),(2,5),(3,1)\),求相应三次 Lagrange 插值多项式的插值基函数 \(l_2(x)\)。
解析
明确节点序号及数值:\(x_0 = -1, \quad x_1 = 1, \quad x_2 = 2, \quad x_3 = 3\)
目标基函数对应序号 \(k=2\),公式展开分子分母:
\[l_2(x) = \frac{(x - x_0)(x - x_1)(x - x_3)}{(x_2 - x_0)(x_2 - x_1)(x_2 - x_3)}\]
代入节点数值:
\[l_2(x) = \frac{(x - (-1))(x - 1)(x - 3)}{(2 - (-1))(2 - 1)(2 - 3)}\]
计算分母常数项:\(\text{分母} = (2 + 1) \times (2 - 1) \times (2 - 3) = 3 \times 1 \times (-1) = -3\)
化简最终表达式:\(l_2(x) = -\frac{1}{3}(x+1)(x-1)(x-3)\)
已知函数 \(y=f(x)\) 通过节点 \((1,1), (3,-2), (4,7), (5,1)\),求三次 Lagrange 插值基函数 \(l_1(x)\)(对应 \(x_1=3\))。
解析
明确节点序号及数值:\(x_0=1, \quad x_1=3, \quad x_2=4, \quad x_3=5\)
目标基函数对应序号 \(k=1\),公式展开分子分母:
\[l_1(x)=\frac{(x-x_0)(x-x_2)(x-x_3)}{(x_1-x_0)(x_1-x_2)(x_1-x_3)}\]
代入节点数值:
\[l_1(x)=\frac{(x-1)(x-4)(x-5)}{(3-1)(3-4)(3-5)}\]
计算分母常数项:\(\text{分母} = 2 \times (-1) \times (-2) = 4\)
化简最终表达式:\(l_1(x) = \frac{(x-1)(x-4)(x-5)}{4}\)
已知函数 \(f(x)\) 通过节点 \((0,1), (1,1.25), (1.5,2.5), (2,5.5)\),用 Newton 插值公式求其三次插值多项式 \(N_3(x)\)及截断误差。
解析
- 差商表构建
本题给定的插值节点为非等距节点,因此需采用牛顿差商多项式构建向前与向后插值格式。根据给定节点 \((0,1), (1,1.25), (1.5,2.5), (2,5.5)\) 计算完整的差商 (Divided Difference) 表:
\(x_i\) \(f(x_i)\) 一阶差商 二阶差商 三阶差商 0 1 1 1.25 0.25 1.5 2.5 2.5 1.5 2 5.5 6 3.5 1 牛顿向前插值方法
牛顿向前插值多项式利用差商表的主对角线(自上而下)元素,即 \(f(x_0)=1, f[x_0,x_1]=0.25, f[x_0,x_1,x_2]=1.5, f[x_0,x_1,x_2,x_3]=1\)。
向前插值公式依序展开为:
\[N_3(x) = f(x_0) + f[x_0,x_1](x-x_0) + f[x_0,x_1,x_2](x-x_0)(x-x_1) + f[x_0,x_1,x_2,x_3](x-x_0)(x-x_1)(x-x_2)\]
代入数值得到最终表达式:
\[N_3(x) = 1 + 0.25x + 1.5x(x-1) + 1 \cdot x(x-1)(x-1.5)\]
牛顿向后插值方法
牛顿向后插值多项式利用差商表的副对角线(自下而上)元素,即 \(f(x_3)=5.5, f[x_2,x_3]=6, f[x_1,x_2,x_3]=3.5, f[x_0,x_1,x_2,x_3]=1\)。
向后插值公式依序展开为:
\[N_3(x) = f(x_3) + f[x_2,x_3](x-x_3) + f[x_1,x_2,x_3](x-x_3)(x-x_2) + f[x_0,x_1,x_2,x_3](x-x_3)(x-x_2)(x-x_1)\]
代入数值得到最终表达式:
\[N_3(x) = 5.5 + 6(x-2) + 3.5(x-2)(x-1.5) + 1 \cdot (x-2)(x-1.5)(x-1)\]
(注:向前与向后多项式在数学上完全等价,展开后为同一三次多项式,仅构造形式与舍入误差累积顺序不同)
截断误差估计
三次多项式插值的截断误差 (Truncation Error) 表达式 \(R_3(x)\) 由四阶导数及节点连乘积构成:
\[R_3(x) = f(x) - N_3(x) = \frac{f^{(4)}(\xi)}{4!}(x-x_0)(x-x_1)(x-x_2)(x-x_3)\]
代入本题节点数据,截断误差公式为:
\[R_3(x) = \frac{f^{(4)}(\xi)}{24}x(x-1)(x-1.5)(x-2)\]
其中,未知参数 \(\xi\) 位于包含插值点 \(x\) 与所有已知节点 \(x_i\) 的最小区间内,即 \(\xi \in (\min(0, x), \max(2, x))\)。
若采用差商形式表示,截断误差也可写为无导数形式:
\[R_3(x) = f[x, 0, 1, 1.5, 2] \cdot x(x-1)(x-1.5)(x-2)\]
若插值结点数为 \(n+1=4\),请写出在第一类边界条件下,用 M 方法求三次样条插值函数 \(S(x)\) 需求解的线性方程组的系数矩阵。
解析
节点基数已知 \(n=3\),对应边界与内部未知向量:\(\mathbf{M} = [M_0, M_1, M_2, M_3]^T\)
按三次样条 M 方法标准控制方程逐行构造矩阵:
第一行(左边界方程):对应 \(M_0\) 与 \(M_1\) 关系系数为 \([2, 1, 0, 0]\)
第二行(内部节点 \(i=1\) 方程):系数为 \([\mu_1, 2, \lambda_1, 0]\)
第三行(内部节点 \(i=2\) 方程):系数为 \([0, \mu_2, 2, \lambda_2]\)
第四行(右边界方程):对应 \(M_2\) 与 \(M_3\) 关系系数为 \([0, 0, 1, 2]\)
组合为 \(4 \times 4\) 系数矩阵:
\[\begin{bmatrix} 2 & 1 & 0 & 0 \\ \mu_1 & 2 & \lambda_1 & 0 \\ 0 & \mu_2 & 2 & \lambda_2 \\ 0 & 0 & 1 & 2 \end{bmatrix}\]
已知 \(y=f(x)\) 的函数值如下表,用适当的多项式插值算法计算$ f(1.2) $的近似值,并估计截断误差。
\(x\) -1 1 2 3 \(f(x)\) 6 2 3 5 解析
【牛顿插值法】(Newton Interpolation)
构造差商表
取全部 4 个节点:\(x_0=-1,\ x_1=1,\ x_2=2,\ x_3=3\) \[ f[x_0]=6,\quad f[x_1]=2,\quad f[x_2]=3,\quad f[x_3]=5 \]
一阶差商: \[ f[x_0,x_1] = \frac{2-6}{1-(-1)} = -2,\quad f[x_1,x_2] = \frac{3-2}{2-1} = 1,\quad f[x_2,x_3] = \frac{5-3}{3-2} = 2 \]
二阶差商: \[ f[x_0,x_1,x_2] = \frac{1-(-2)}{2-(-1)} = 1,\quad f[x_1,x_2,x_3] = \frac{2-1}{3-1} = 0.5 \]
三阶差商: \[ f[x_0,x_1,x_2,x_3] = \frac{0.5-1}{3-(-1)} = -0.125 \]
写出牛顿插值多项式 \[ P_3(x) = f[x_0] + f[x_0,x_1](x-x_0) + f[x_0,x_1,x_2](x-x_0)(x-x_1) + f[x_0,x_1,x_2,x_3](x-x_0)(x-x_1)(x-x_2) \]
代入: \[ P_3(x) = 6 - 2(x+1) + (x+1)(x-1) - 0.125(x+1)(x-1)(x-2) \]
计算 \(P_3(1.2)\) \[ x+1=2.2,\quad x-1=0.2,\quad x-2=-0.8 \]
\[ P_3(1.2) = 6 - 2(2.2) + (2.2)(0.2) - 0.125(2.2)(0.2)(-0.8) = 6 - 4.4 + 0.44 + 0.044 = 2.084 \]
牛顿插值结果: \[ \boxed{f(1.2) \approx 2.084} \]
截断误差(牛顿形式) \[ R_3(x) = f[x_0,x_1,x_2,x_3,x]\,(x-x_0)(x-x_1)(x-x_2)(x-x_3) \]
在 \(x=1.2\) 时: \[ \omega(1.2) = (1.2+1)(1.2-1)(1.2-2)(1.2-3) = 0.6336 \] 所以: \[ R_3(1.2) = f[x_0,x_1,x_2,x_3,1.2] \times 0.6336 \]
【拉格朗日插值法】(Lagrange Interpolation)
基函数 \[ \ell_0(x) = \frac{(x-1)(x-2)(x-3)}{(-1-1)(-1-2)(-1-3)} \]
\[ \ell_1(x) = \frac{(x+1)(x-2)(x-3)}{(1+1)(1-2)(1-3)} \]
\[ \ell_2(x) = \frac{(x+1)(x-1)(x-3)}{(2+1)(2-1)(2-3)} \]
\[ \ell_3(x) = \frac{(x+1)(x-1)(x-2)}{(3+1)(3-1)(3-2)} \]
插值多项式
\[ P_3(x) = 6\ell_0(x) + 2\ell_1(x) + 3\ell_2(x) + 5\ell_3(x) \]
计算 \(P_3(1.2)\)
先算各基函数在 \(x=1.2\) 的值:
\[ \ell_0(1.2) = \frac{(0.2)(-0.8)(-1.8)}{(-2)(-3)(-4)} = \frac{0.288}{-24} = -0.012 \]
\[ \ell_1(1.2) = \frac{(2.2)(-0.8)(-1.8)}{(2)(-1)(-2)} = \frac{3.168}{4} = 0.792 \]
\[ \ell_2(1.2) = \frac{(2.2)(0.2)(-1.8)}{(3)(1)(-1)} = \frac{-0.792}{-3} = 0.264 \]
\[ \ell_3(1.2) = \frac{(2.2)(0.2)(-0.8)}{(4)(2)(1)} = \frac{-0.352}{8} = -0.044 \]
代入: \[ P_3(1.2) = 6(-0.012) + 2(0.792) + 3(0.264) + 5(-0.044) = -0.072 + 1.584 + 0.792 - 0.22 = 2.084 \]
拉格朗日插值结果:
\[ \boxed{f(1.2) \approx 2.084} \]
截断误差(拉格朗日形式)
\[ R_3(x) = \frac{f^{(4)}(\xi)}{4!}(x+1)(x-1)(x-2)(x-3) \]
在 \(x=1.2\) 时: \[ R_3(1.2) = \frac{f^{(4)}(\xi)}{24} \times 0.6336 \]
【最终答案汇总】
方法 \(f(1.2)\) 近似值 截断误差表达式 牛顿插值 2.084 \(R_3(1.2) = f[x_0,x_1,x_2,x_3,1.2]\times 0.6336\) 拉格朗日插值 2.084 \(R_3(1.2) = \dfrac{f^{(4)}(\xi)}{24}\times 0.6336\) 已知 \(y=f(x)\) 的函数值如下表,在区间 [-1.5, 2] 上求满足自然边界条件的三次样条插值函数 \(S(x)\),并计算 \(f(1)\)。(保留两位小数)
\(x\) -1.5 0 1 2 \(f(x)\) 1.25 -1 1 9 解析
计算步长与一阶差商
已知节点 \(x_0=-1.5, x_1=0, x_2=1, x_3=2\)。
步长:\(h_0 = 1.5\), \(h_1 = 1\), \(h_2 = 1\)。
一阶差商:
\(f[x_0, x_1] = \frac{-1 - 1.25}{0 - (-1.5)} = -1.5\)
\(f[x_1, x_2] = \frac{1 - (-1)}{1 - 0} = 2\)
\(f[x_2, x_3] = \frac{9 - 1}{2 - 1} = 8\)
计算二阶差商与方程参数
二阶差商:
\(f[x_0, x_1, x_2] = \frac{2 - (-1.5)}{1 - (-1.5)} = \frac{3.5}{2.5} = 1.4\)
\(f[x_1, x_2, x_3] = \frac{8 - 2}{2 - 0} = 3\)
计算参数 \(\mu_j, \lambda_j, d_j\):
对于 \(j=1\):\(\mu_1 = \frac{1.5}{2.5} = 0.6\);\(\lambda_1 = \frac{1}{2.5} = 0.4\);\(d_1 = 6 \times 1.4 = 8.4\)
对于 \(j=2\):\(\mu_2 = \frac{1}{2} = 0.5\);\(\lambda_2 = \frac{1}{2} = 0.5\);\(d_2 = 6 \times 3 = 18\)
建立并求解三弯矩方程组
结合自然边界条件 \(M_0 = 0\) 与 \(M_3 = 0\),列出方程组:
\(0.6M_0 + 2M_1 + 0.4M_2 = 8.4 \Rightarrow 5M_1 + M_2 = 21\)
\(0.5M_1 + 2M_2 + 0.5M_3 = 18 \Rightarrow M_1 + 4M_2 = 36\)
解此二元一次方程组,得到弯矩值:
\(M_1 = \frac{48}{19} \approx 2.53\)
\(M_2 = \frac{159}{19} \approx 8.37\)
构造三次样条函数解析式
根据三次样条插值的分段公式展开,代入对应区间参数得到表达式:
\[S(x) = \begin{cases} \frac{16}{57}(x+1.5)^3 - \frac{5}{6}x - \frac{74}{57}(x+1.5), & x \in [-1.5, 0] \\ \frac{8}{19}(1-x)^3 + \frac{53}{38}x^3 - \frac{27}{19}(1-x) - \frac{15}{38}x, & x \in [0, 1] \\ \frac{53}{38}(2-x)^3 - \frac{15}{38}(2-x) + 9(x-1), & x \in [1, 2] \end{cases}\]
计算 \(f(1)\)
因为 \(x=1\) 为给定插值节点,由插值条件严格成立,可直接得:
\(f(1) \approx S(1) = \mathbf{1.00}\)
设已知函数 \(y=f(x)\) 的函数值如下,求满足边界条件:\(S'(-1.5)=0.75\), \(S'(2)=14\) 的三次样条插值函数 \(S(x)\) 在小区间 [1, 2] 上的表达式,并计算 \(f'(1)\) 的近似值。
\(x\) -1.5 0 1 2 \(y\) 0.125 -1 1 8 解析
采用三转角(m法)构造三次样条。
先计算各子区间步长: \[h_0=x_1-x_0=0-(-1.5)=1.5,\quad h_1=x_2-x_1=1-0=1,\quad h_2=x_3-x_2=2-1=1.\]
计算一阶差商(即节点间平均斜率): \[f[x_0,x_1]=\frac{y_1-y_0}{x_1-x_0}=\frac{-1-0.125}{0+1.5}=-0.75,\] \[f[x_1,x_2]=\frac{y_2-y_1}{x_2-x_1}=\frac{1-(-1)}{1-0}=2,\] \[f[x_2,x_3]=\frac{y_3-y_2}{x_3-x_2}=\frac{8-1}{2-1}=7.\]
设 \(m_i=S'(x_i)\ (i=0,1,2,3)\)。由边界条件直接有 \[m_0=0.75,\qquad m_3=14.\]
对内部节点 \(x_1=0\)(即 \(j=1\))和 \(x_2=1\)(即 \(j=2\))分别建立三转角方程。
对于 \(j=1\): \[\lambda_1=\frac{h_1}{h_0+h_1}=\frac{1}{1.5+1}=0.4,\quad \mu_1=\frac{h_0}{h_0+h_1}=\frac{1.5}{1.5+1}=0.6,\] \[c_1=3\left(\lambda_1 f[x_0,x_1]+\mu_1 f[x_1,x_2]\right) =3\left(0.4(-0.75)+0.6\cdot 2\right)=3(-0.3+1.2)=2.7.\] 方程:\[\lambda_1 m_0+2m_1+\mu_1 m_2=c_1\] 代入 \(m_0=0.75\)得:\[2m_1+0.6m_2=2.4. \tag{1}\]
对于 \(j=2\): \[\lambda_2=\frac{h_2}{h_1+h_2}=\frac{1}{1+1}=0.5,\quad \mu_2=\frac{h_1}{h_1+h_2}=\frac{1}{1+1}=0.5,\] \[c_2=3\left(\lambda_2 f[x_1,x_2]+\mu_2 f[x_2,x_3]\right) =3\left(0.5\cdot 2+0.5\cdot 7\right)=3(1+3.5)=13.5.\] 方程:\[\lambda_2 m_1+2m_2+\mu_2 m_3=c_2\] 代入 \(m_3=14\)得:\[0.5m_1+2m_2=6.5. \tag{2}\]
联立: \[\begin{cases} 2m_1+0.6m_2=2.4,\\ 0.5m_1+2m_2=6.5. \end{cases}\]
于是\[m_1=\frac{9}{37},m_2=\frac{118}{37}\] 因此\[S'(1)=m_2=\frac{118}{37}.\]
现在只需写出区间 \([1,2]\) 上的样条表达式。
该区间为第 \(j=2\) 个子区间,有 \(h_2=1\),令 \(t=\dfrac{x-x_2}{h_2}=x-1\),则 \(0\le t\le 1\)。
使用三转角法分段公式: \[S_2(x)=y_2(1+2t)(1-t)^2+y_3(3-2t)t^2+m_2h_2\,t(1-t)^2+m_3h_2\,(t-1)t^2.\] 代入 \(y_2=1,\ y_3=8,\ m_2=\frac{118}{37},\ m_3=14,\ h_2=1\): \[S_2(x)=1\cdot(1+2t)(1-t)^2+8(3-2t)t^2+\frac{118}{37}\,t(1-t)^2+14(t-1)t^2\] \[S_2(x)=1+\frac{118}{37}t+\frac{23}{37}t^2+\frac{118}{37}t^3\] 代回 \(t=x-1\),得到在 \([1,2]\) 上的样条表达式: \[\boxed{S(x)=1+\frac{118}{37}(x-1)+\frac{23}{37}(x-1)^2+\frac{118}{37}(x-1)^3,\quad x\in[1,2].}\]
最后,由样条连续性,\(f'(1)\) 的近似值即为 \(S'(1)=m_2\),故 \[\boxed{f'(1)\approx S'(1)=\frac{118}{37}\approx 3.1892.}\]
若插值结点为 \(n+1\) 个,则按定义求三次样条插值函数 \(S(x)\) 需要求 _________ 个未知数,若用 M 方法求三次样条插值函数 \(S(x)\),则在周期边界条件下只需要求 _________ 个未知数。
解析
按定义求:共有 \(n\) 个区间段,每段三次多项式有 \(a,b,c,d\) 四个系数,故需解 \(4n\) 个未知数。
用 M 方法并结合周期边界条件:由于边界 \(M_0 = M_n\),只需解出 \(M_1, M_2, \dots, M_n\) 共 \(n\) 个独立未知数。
答案依次填入:\(4n\),\(n\)。
知识点三:数值积分(代数精度与复化梯形公式)
1 代数精度
如果数值积分公式对于所有次数不超过 \(m\) 的多项式都能准确成立,而对于 \(m+1\) 次多项式不能准确成立,则称该公式具有 \(m\) 阶代数精度。检验时,只需依次令 \(f(x)=1, x, x^2, \dots\) 代入公式,观察等式何时不再成立即可。
2 复化梯形公式
将积分区间 \([a,b]\) 等分为 \(n\) 个子区间,步长 \(h=\dfrac{b-a}{n}\),节点 \(x_i=a+ih\)。复化梯形公式为: \[T_n = \frac{h}{2}\left[f(a) + 2\sum_{i=1}^{n-1}f(x_i) + f(b)\right].\] 其截断误差上限为: \[|E_T| \le \frac{(b-a)h^2}{12}\max_{a \le x \le b}|f''(x)|.\]
3 龙贝格(Romberg)积分算法
龙贝格积分是在复化梯形公式逐次分半的基础上,通过 Richardson 外推,将低精度的梯形值依次加工成高精度的辛普森值(\(S\))、柯特斯值(\(C\))和龙贝格值(\(R\))。
第1步(准备):令 \(T^{(0)}_0 = T_1\)(初始一步梯形值)。逐次二分区间,计算复化梯形序列: \[T^{(0)}_0,\ T^{(0)}_1,\ T^{(0)}_2,\ T^{(0)}_3,\ \cdots\] 其中 \(T^{(0)}_k = T_{2^k}\)(即将区间等分为 \(2^k\) 份)。如果题目直接给出了 \(T_2, T_4, T_8, T_{16}\),则可直接作为 \(T^{(0)}_1, T^{(0)}_2, T^{(0)}_3, T^{(0)}_4\) 使用。
第2步(Richardson 外推):构造 Romberg 数表,按列从左到右计算。表中第 \(m\) 列(\(m=1,2,3\))的递推公式为: \[T^{(m)}_k = T^{(m-1)}_{k+1} + \frac{T^{(m-1)}_{k+1} - T^{(m-1)}_k}{4^m - 1}.\] 具体展开为三列公式(考场直接套用):
- 第1列(Simpson):\(S_k = T_{2^{k+1}} + \dfrac{T_{2^{k+1}} - T_{2^k}}{3}\);
- 第2列(Cotes):\(C_k = S_{k+1} + \dfrac{S_{k+1} - S_k}{15}\);
- 第3列(Romberg ):\(R_k = C_{k+1} + \dfrac{C_{k+1} - C_k}{63}\)。
第3步(取结果与误差估计):取数表右下角的最新 \(R\) 值作为高精度近似积分值。该值的截断误差可用同列相邻两项之差来估计,即: \[|E| \approx |R_k - C_{k+1}|,\] 或者使用外推通用估计式 $ |E| $。考场中若题目只要求"估计算法截断误差上界",直接取最后一步外推的相邻列差值即可。
数值积分公式 \(\int_0^1 f(x)dx=\sum_{k=1}^n A_k f(x_k)\) 的代数精度大于 3,求 \(\sum_{k=1}^n A_k x_k^3\)。
解析
公式代数精度大于 3 意味着当 \(f(x) = x^3\)(3次多项式)时,该数值积分公式的离散求和结果与精确理论积分完全相等。
求左侧精确积分:
\[\int_0^1 x^3 dx = \left[ \frac{1}{4}x^4 \right]_0^1 = \frac{1}{4}\]
根据定义,离散求和项必定等于该精确值:
\[\sum_{k=1}^n A_k x_k^3 = \frac{1}{4}\]
设定积分 \(\int_a^b f(x)dx\) 在将积分区间 [a,b] 逐次分半的过程中用复合梯形公式计算的近似值如下表。请计算足够高精度的近似值,并估计算法截断误差的上界。
n 2 4 8 16 \(T_n\) 3.0 3.1 3.13 3.136 解析
已知复化梯形逐次分半的结果为: \[T_2=3.0,\qquad T_4=3.1,\qquad T_8=3.13,\qquad T_{16}=3.136.\]
按照龙贝格加速,将上述梯形值排列为第0列,然后依次外推。
第1列(辛普森 \(S\) 值): \[S_2 = T_4 + \frac{T_4 - T_2}{3} = 3.1 + \frac{3.1 - 3.0}{3} = 3.1 + 0.0333333 = 3.1333333,\] \[S_4 = T_8 + \frac{T_8 - T_4}{3} = 3.13 + \frac{3.13 - 3.1}{3} = 3.13 + 0.01 = 3.14,\] \[S_8 = T_{16} + \frac{T_{16} - T_8}{3} = 3.136 + \frac{3.136 - 3.13}{3} = 3.136 + 0.002 = 3.138.\]
第2列(柯特斯 \(C\) 值): \[C_2 = S_4 + \frac{S_4 - S_2}{15} = 3.14 + \frac{3.14 - 3.1333333}{15} = 3.14 + \frac{0.0066667}{15} = 3.1404444,\] \[C_4 = S_8 + \frac{S_8 - S_4}{15} = 3.138 + \frac{3.138 - 3.14}{15} = 3.138 + \frac{-0.002}{15} = 3.1378667.\]
第3列(龙贝格 \(R\) 值): \[R_2 = C_4 + \frac{C_4 - C_2}{63} = 3.1378667 + \frac{3.1378667 - 3.1404444}{63} = 3.1378667 + \frac{-0.0025777}{63}.\] 计算差值:\(-0.0025777 / 63 \approx -0.0000409\),因此 \[R_2 \approx 3.1378667 - 0.0000409 = 3.1378258.\]
整理成龙贝格数表如下(每列从左到右精度逐步提高):
梯形 \(T\)(第0列) 辛普森 \(S\)(第1列) 柯特斯 \(C\)(第2列) 龙贝格 \(R\)(第3列) 3.0 3.1 3.1333333 3.13 3.14 3.1404444 3.136 3.138 3.1378667 3.1378258 数表右下角的 \(R_2 = 3.1378258\) 为当前最高精度近似值,因此足够高精度的积分近似值为: \[\boxed{\int_a^b f(x)\,dx \approx 3.1378258}.\]
最后估计算法截断误差的上界。对比最后一步外推前后的相邻值,即取龙贝格值 \(R_2\) 与柯特斯值 \(C_4\) 之差的绝对值: \[|E| \approx |R_2 - C_4| = |3.1378258 - 3.1378667| \approx 0.0000409.\] 若严格按外推法误差估计式 $ |E| $,则得到完全相同的结果 \(0.0000409\)。因此截断误差上界约为: \[\boxed{|E| \le 4.09 \times 10^{-5}}.\]
(注:由于只给了四位梯形值,最终龙贝格值稳定在 \(3.1378\) 左右,实际真值约为此值,误差量级在 \(10^{-5}\) 是合理的。)
用复化梯形公式(8 等分)计算 \(\int_0^1\frac{\sin x}{x}dx\),保留四位有效数字并估计误差。
解析
解答(按):
第 1 步:确定参数与公式(Composite Trapezoidal Rule)
区间 \([0,1]\) 作 8 等分,步长 \(h=\dfrac{1-0}{8}=0.125\)。被积函数 \(f(x)=\dfrac{\sin x}{x}\) 在 \(x=0\) 处有可去奇点,定义 \(f(0)=1\)。节点 \(x_i=0.125i\ (i=0,1,\dots,8)\)。
第 2 步:列出各节点函数值(仅结果)
\[\begin{aligned} &f(0)=1,\\ &f(0.125)=0.99739786,\\ &f(0.25)=0.98961584,\\ &f(0.375)=0.97672675,\\ &f(0.5)=0.95885108,\\ &f(0.625)=0.93615566,\\ &f(0.75)=0.90885168,\\ &f(0.875)=0.87719257,\\ &f(1)=\sin 1=0.84147098. \end{aligned}\]
内部节点函数值之和:
\[\sum_{i=1}^{7}f(x_i)=0.99739786+0.98961584+0.97672675+0.95885108+0.93615566+0.90885168+0.87719257=6.64479144.\]
第 3 步:代入复化梯形公式并连等计算
\[\begin{aligned} T_8 &= \frac{h}{2}\left[f(0) + 2\sum_{i=1}^{7}f(x_i) + f(1)\right] \\ &= \frac{0.125}{2} \left[1 + 2(6.64479144) + 0.84147098\right] \\ &= 0.0625 \times \left[1 + 13.28958288 + 0.84147098\right] \\ &= 0.0625 \times 15.13105386 = 0.94569087. \end{aligned}\]
保留四位有效数字(从首位非零数字 9 开始数四位,第五位为 6 需进位):
\[\boxed{T_8 \approx 0.9457}.\]
第 4 步:估计截断误差(Composite Trapezoidal Error Bound)
利用余项公式:
\[|E_T| \le \frac{(b-a)h^2}{12} \max_{0\le x\le 1}|f''(x)|.\]
由 \(f(x)=\dfrac{\sin x}{x}=1-\dfrac{x^2}{3!}+\dfrac{x^4}{5!}-\cdots\),可知 \(f''(x)=-\dfrac{1}{3}+\dfrac{x^2}{12}-\cdots\),在 \([0,1]\) 上 \(\max |f''(x)|=\dfrac{1}{3}\)。代入连等:
\[|E_T| \le \frac{1 \times (0.125)^2}{12} \times \frac{1}{3} = \frac{0.015625}{36} = 4.34\times 10^{-4}.\]
因此截断误差上界为:
\[\boxed{|E_T| \le 4.34 \times 10^{-4}}.\]
最终结果:
\[\boxed{\int_0^1 \frac{\sin x}{x}\,dx \approx 0.9457 \quad (\text{四位有效数字}),\qquad \text{误差上界} \le 4.34 \times 10^{-4}.}\]
知识点四:线性方程组数值解(LU分解与迭代法)
1. Doolittle分解(LU分解)
适用:一般方阵,顺序主子式均不为零。分解 \(A=LU\),其中 \(L\) 为单位下三角(对角元全1),\(U\) 为上三角。
计算步骤(按 \(k=1,2,\dots,n\) 逐列/行):
- 先算 \(U\) 的第 \(k\) 行:\(u_{k,j}=a_{k,j}-\sum_{r=1}^{k-1} l_{k,r}u_{r,j},\quad j=k,k+1,\dots,n\);
- 再算 \(L\) 的第 \(k\) 列:\(l_{i,k}=\dfrac{a_{i,k}-\sum_{r=1}^{k-1} l_{i,r}u_{r,k}}{u_{k,k}},\quad i=k+1,\dots,n\)。
求解:先解 \(Ly=b\)(前代),再解 \(Ux=y\)(回代)。
2. Cholesky分解
适用:对称正定矩阵。分解 \(A=U^TU\),其中 \(U\) 为上三角且对角元为正。
计算步骤(按行 \(i=1,\dots,n\)):
- \(u_{i,i}=\sqrt{a_{i,i}-\sum_{k=1}^{i-1} u_{k,i}^2}\);
- 对 \(j=i+1,\dots,n\):\(u_{i,j}=\dfrac{a_{i,j}-\sum_{k=1}^{i-1} u_{k,i}u_{k,j}}{u_{i,i}}\)。
求解:先解 \(U^T y=b\)(前代),再解 \(Ux=y\)(回代)。
3. Jacobi迭代法
将 \(A=D+L+U\)(\(D\) 对角,\(L\) 严格下三角,\(U\) 严格上三角)。
迭代格式: \[x^{(k+1)}=D^{-1}(b-(L+U)x^{(k)})\]
分量形式: \[x_i^{(k+1)}=\frac{1}{a_{ii}}\left(b_i-\sum_{j\ne i}a_{ij}x_j^{(k)}\right).\]
收敛充要条件:迭代矩阵 \(J=-D^{-1}(L+U)\) 的谱半径 \(\rho(J)<1\)。充分条件:\(A\) 严格对角占优。
若原矩阵不收敛,可尝试行交换调整对角元(保持解不变)使矩阵严格对角占优或减小谱半径。
4. Gauss-Seidel迭代法
将 \(A=D+L+U\)。
迭代格式: \[x^{(k+1)}=(D+L)^{-1}(b-Ux^{(k)})\]
分量形式(立即使用最新分量): \[x_i^{(k+1)}=\frac{1}{a_{ii}}\left(b_i-\sum_{j<i}a_{ij}x_j^{(k+1)}-\sum_{j>i}a_{ij}x_j^{(k)}\right).\]
迭代矩阵:\(B_{gs}=-(D+L)^{-1}U\)。
收敛充要条件 \(\rho(B_{gs})<1\)。充分条件:严格对角占优或对称正定。
5. 计算谱半径
第1步:写出迭代矩阵 \(B\)(例如 Jacobi 迭代矩阵 \(J\),或 Gauss-Seidel 迭代矩阵 \(B_{gs}\))。
第2步:构造特征多项式,即计算 \(\det(\lambda I - B)=0\)(注意是 \(\lambda I - B\),这样最高次项系数为正,便于因式分解)。
第3步:解特征方程,求出所有特征值 \(\lambda_1,\lambda_2,\dots,\lambda_n\)。
第4步:取模的最大值,\(\rho(B)=\max\{|\lambda_1|,|\lambda_2|,\dots,|\lambda_n|\}\)。
- 若迭代矩阵是三角矩阵(上三角或下三角):特征值就是对角线元素,完全不需要展开行列式。
- 若迭代矩阵某一行/列只有非零元,或结构特殊(如秩1矩阵):往往能提出公因子 \(\lambda\),使高次方程降阶为低次方程。
- 三阶矩阵求根时:若一眼看不出因式分解,可先尝试 \(\lambda=0, \pm1\) 等简单值试根,再用多项式除法降阶。
6. 线性方程组数值解法对比与收敛充要条件
| 方法名称 | 适用矩阵类型 | 方法类别 | 收敛的充分必要条件 | 主要特征与优缺点 |
|---|---|---|---|---|
| Doolittle (LU) 分解 | 非对称实矩阵、一般方阵 | 直接法 | 系数矩阵的所有顺序主子式均不为零。 | 算法固定,计算量适中,但不能改变消元顺序(易受零主元影响)。 |
| Cholesky 分解 | 对称正定矩阵 | 直接法 | 矩阵非奇异且对称正定(各阶顺序主子式全大于零)。 | 存储量与计算量均比常规 LU 分解减半,数值稳定性优异。 |
| 雅可比 (Jacobi) 迭代 | 大型稀疏矩阵 | 迭代法 | 迭代矩阵的谱半径 \(\rho(J) < 1\)。(充分条件:矩阵严格对角占优)。 | 结构简单,各分量独立计算,易于并行化,但收敛可能较慢。 |
| Gauss-Seidel 迭代 | 大型稀疏矩阵 | 迭代法 | 迭代矩阵的谱半径 \(\rho(G) < 1\)。(充分条件:严格对角占优或对称正定)。 | 每次迭代计算立即利用最新的已知分量,通常收敛速度快于 Jacobi。 |
设 \(A=\begin{bmatrix}1&3&0\\1&2&4\\3&0&2\end{bmatrix}\),求矩阵 A 的 Doolittle 分解 L 和 U 矩阵。
解析
设分解形式:
\[L = \begin{bmatrix}1 & 0 & 0 \\ l_{21} & 1 & 0 \\ l_{31} & l_{32} & 1\end{bmatrix}, \quad U = \begin{bmatrix}u_{11} & u_{12} & u_{13} \\ 0 & u_{22} & u_{23} \\ 0 & 0 & u_{33}\end{bmatrix}\]
根据矩阵乘法对应元素相等,逐行求解:
第一行:
\[u_{11}=1, \quad u_{12}=3, \quad u_{13}=0\]
第二行:
\[l_{21}u_{11} = 1 \implies l_{21} \times 1 = 1 \implies l_{21} = 1\]
\[l_{21}u_{12} + u_{22} = 2 \implies 1 \times 3 + u_{22} = 2 \implies u_{22} = -1\]
\[l_{21}u_{13} + u_{23} = 4 \implies 1 \times 0 + u_{23} = 4 \implies u_{23} = 4\]
第三行:
\[l_{31}u_{11} = 3 \implies l_{31} \times 1 = 3 \implies l_{31} = 3\]
\[l_{31}u_{12} + l_{32}u_{22} = 0 \implies 3 \times 3 + l_{32} \times (-1) = 0 \implies l_{32} = 9\]
\[l_{31}u_{13} + l_{32}u_{23} + u_{33} = 2 \implies 3 \times 0 + 9 \times 4 + u_{33} = 2 \implies u_{33} = -34\]
最终分解结果:
\[L = \begin{bmatrix}1 & 0 & 0 \\ 1 & 1 & 0 \\ 3 & 9 & 1\end{bmatrix}, \quad U = \begin{bmatrix}1 & 3 & 0 \\ 0 & -1 & 4 \\ 0 & 0 & -34\end{bmatrix}\]
解方程组 \(\begin{bmatrix}1&3&0\\1&2&4\\3&0&2\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}4\\7\\5\end{bmatrix}\) 的 Gauss-Seidel 迭代法的迭代矩阵 G。
解析
将系数矩阵 \(A\) 拆分为 \(D+L_{lower}\)(对角+严格下三角)与 \(U_{upper}\)(严格上三角):
\[D+L_{lower} = \begin{bmatrix}1 & 0 & 0 \\ 1 & 2 & 0 \\ 3 & 0 & 2\end{bmatrix}, \quad U_{upper} = \begin{bmatrix}0 & 3 & 0 \\ 0 & 0 & 4 \\ 0 & 0 & 0\end{bmatrix}\]
利用初等行变换求三角矩阵 \((D+L_{lower})\) 的逆:
\[(D+L_{lower})^{-1} = \begin{bmatrix}1 & 0 & 0 \\ -0.5 & 0.5 & 0 \\ -1.5 & 0 & 0.5\end{bmatrix}\]
计算迭代矩阵 \(G = -(D+L_{lower})^{-1}U_{upper}\):
\[G = -\begin{bmatrix}1 & 0 & 0 \\ -0.5 & 0.5 & 0 \\ -1.5 & 0 & 0.5\end{bmatrix}\begin{bmatrix}0 & 3 & 0 \\ 0 & 0 & 4 \\ 0 & 0 & 0\end{bmatrix}\]
\[G = -\begin{bmatrix}0 & 3 & 0 \\ 0 & -1.5 & 2 \\ 0 & -4.5 & 0\end{bmatrix} = \begin{bmatrix}0 & -3 & 0 \\ 0 & 1.5 & -2 \\ 0 & 4.5 & 0\end{bmatrix}\]
对方程组 \(\begin{bmatrix}1 & a & 0\\a & 1 & a\\0 & a & 1\end{bmatrix}x=\begin{bmatrix}1\\1\\1\end{bmatrix}\) 建立 Gauss-Seidel 迭代式并讨论收敛条件。
解析
展开方程组分量:
\[x_1 + ax_2 = 1\]
\[ax_1 + x_2 + ax_3 = 1\]
\[ax_2 + x_3 = 1\]
建立新一层迭代值计算关系式(最新计算的变量立即投入下一步):
\[x_1^{(k+1)} = 1 - ax_2^{(k)}\]
\[x_2^{(k+1)} = 1 - ax_1^{(k+1)} - ax_3^{(k)}\]
\[x_3^{(k+1)} = 1 - ax_2^{(k+1)}\]
收敛性讨论:
系数矩阵 \(A\) 为对称矩阵。根据对称正定矩阵必收敛准则,要求 \(A\) 的各阶顺序主子式全大于0:
一阶:\(1 > 0\)
二阶:\(\det\begin{bmatrix}1 & a \\ a & 1\end{bmatrix} = 1 - a^2 > 0 \implies |a| < 1\)
三阶:\(\det(A) = 1(1 - a^2) - a(a - 0) = 1 - 2 a^2 > 0 \implies |a| < \frac{1}{\sqrt{2}}\)
取交集得收敛充分必要条件:
\[|a| < \frac{1}{\sqrt{2}}\]
用平方根法(Cholesky 分解)解线性方程组:\[\begin{cases} 4x_1 + 2x_2 + 4x_3 = 4, \\ 2x_1 + 5x_2 + 6x_3 = 3, \\ 4x_1 + 6x_2 + 11x_3 = 7. \end{cases}\]
解析
第1步(验证正定)
系数矩阵 \[A=\begin{bmatrix} 4 & 2 & 4 \\ 2 & 5 & 6 \\ 4 & 6 & 11 \end{bmatrix},\quad b=\begin{bmatrix}4\\3\\7\end{bmatrix}.\] \(A\) 对称,且顺序主子式 \(4>0,\ 16>0,\ 48>0\),故对称正定,可用 Cholesky 分解。
第2步
设 \[L=\begin{bmatrix} l_{11} & 0 & 0 \\ l_{21} & l_{22} & 0 \\ l_{31} & l_{32} & l_{33} \end{bmatrix},\quad A=LL^T.\]
由 \(A=LL^T\) 逐列比较:
- 第1列:\(l_{11}=\sqrt{4}=2\),同理 \(l_{21}=\dfrac{2}{l_{11}}=1\),\(l_{31}=\dfrac{4}{l_{11}}=2\);
- 第2列:\(l_{22}=\sqrt{5-l_{21}^2}=2\),同理 \(l_{32}=\dfrac{6-l_{31}l_{21}}{l_{22}}=2\);
- 第3列:同理 \(l_{33}=\sqrt{11-l_{31}^2-l_{32}^2}=\sqrt{3}\)。
故: \[L=\begin{bmatrix} 2 & 0 & 0 \\ 1 & 2 & 0 \\ 2 & 2 & \sqrt{3} \end{bmatrix},\quad L^T=\begin{bmatrix} 2 & 1 & 2 \\ 0 & 2 & 2 \\ 0 & 0 & \sqrt{3} \end{bmatrix}.\]
第3步(前代法解 \(Ly=b\),同理写出完整解)
\[\begin{cases} 2y_1=4,\\ y_1+2y_2=3,\\ 2y_1+2y_2+\sqrt{3}y_3=7. \end{cases}\] 由第一行得 \(y_1=2\),同理逐行代入解得: \[y=\begin{bmatrix}2\\[4pt]\dfrac{1}{2}\\[4pt]\dfrac{2}{\sqrt{3}}\end{bmatrix}.\]
第4步(回代法解 \(L^Tx=y\),同理写出完整解)
\[\begin{cases} 2x_1+x_2+2x_3=2,\\ 2x_2+2x_3=\dfrac{1}{2},\\ \sqrt{3}x_3=\dfrac{2}{\sqrt{3}}. \end{cases}\] 由第三行得 \(x_3=\dfrac{2}{3}\),同理逐行回代解得: \[x=\begin{bmatrix}\dfrac{13}{24}\\[6pt]-\dfrac{5}{12}\\[6pt]\dfrac{2}{3}\end{bmatrix}.\]
设方程组为 \(\begin{bmatrix} 1 & 1 & 2 & 3 \\ 0 & 2 & 1 & 0 \\ 2 & 6 & 7 & 6 \\ 1 & 3 & 3 & 4 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \\ x_4 \end{bmatrix} = \begin{bmatrix} 7 \\ 3 \\ 21 \\ 11 \end{bmatrix}\)
利用雅可比(Jacobi)迭代格式进行迭代计算求近似解,取初始值 \(X_0 = (0.00, 0.00, 0.00, 0.00)^T\),保留 2 位小数,迭代 2 次;
解析
建立 Jacobi 迭代格式
根据给定方程组展开各行,分离出对角线变量:
- \(x_1^{(k+1)} = 7 - x_2^{(k)} - 2x_3^{(k)} - 3x_4^{(k)}\)
- \(x_2^{(k+1)} = \frac{1}{2}(3 - x_3^{(k)}) = 1.5 - 0.5x_3^{(k)}\)
- \(x_3^{(k+1)} = \frac{1}{7}(21 - 2x_1^{(k)} - 6x_2^{(k)} - 6x_4^{(k)})\)
- \(x_4^{(k+1)} = \frac{1}{4}(11 - x_1^{(k)} - 3x_2^{(k)} - 3x_3^{(k)})\)
第一次迭代 \((k=0)\)
代入初始值 \(X_0 = (0.00, 0.00, 0.00, 0.00)^T\):
\(x_1^{(1)} = 7 - 0 - 0 - 0 = \mathbf{7.00}\)
\(x_2^{(1)} = 1.5 - 0 = \mathbf{1.50}\)
\(x_3^{(1)} = 21 / 7 = \mathbf{3.00}\)
\(x_4^{(1)} = 11 / 4 = \mathbf{2.75}\)
第一次迭代结果:\(X_1 = (7.00, 1.50, 3.00, 2.75)^T\)。
第二次迭代 \((k=1)\)
代入第一次迭代获得的值 \(X_1\):
\(x_1^{(2)} = 7 - 1.50 - 2(3.00) - 3(2.75) = 7 - 1.5 - 6 - 8.25 = \mathbf{-8.75}\)
\(x_2^{(2)} = 1.5 - 0.5(3.00) = \mathbf{0.00}\)
\(x_3^{(2)} = \frac{1}{7}(21 - 2(7.00) - 6(1.50) - 6(2.75)) = \frac{1}{7}(21 - 14 - 9 - 16.5) = -\frac{18.5}{7} \approx \mathbf{-2.64}\)
\(x_4^{(2)} = \frac{1}{4}(11 - 7.00 - 3(1.50) - 3(3.00)) = \frac{1}{4}(11 - 7 - 4.5 - 9) = -\frac{9.5}{4} \approx \mathbf{-2.38}\)
第二次迭代结果:\(X_2 = (-8.75, 0.00, -2.64, -2.38)^T\)。
设有方程组 \(A x = b\),其中,\(A = \begin{bmatrix} 2 & 3 & 0 \\ 4 & 2 & 3 \\ 5 & 0 & 6 \end{bmatrix}, b = \begin{pmatrix} 5 \\ 9 \\ 11 \end{pmatrix}\)。
(1)对方程组进行适当调整后,选用恰当的矩阵分解法求解该方程组;
(2)对调整后的方程组,分析判断 Jacobi 迭代方法求解方程组是否收敛;
(3)对调整后的方程组,写出解该方程组的 Gauss-Seidel 迭代矩阵。
解析
(1)调整方程组并选用矩阵分解法求解
为提高迭代收敛性,交换第1行与第2行(使对角元尽量大且迭代矩阵谱半径<1),得到调整后方程组: \[A'=\begin{bmatrix}4&2&3\\2&3&0\\5&0&6\end{bmatrix},\qquad b'=\begin{bmatrix}9\\5\\11\end{bmatrix}.\] (验证解不变:原方程解为 \(x=(1,1,1)^T\),显然满足。)
选用 Doolittle(LU)分解 求解 \(A'x=b'\)。
LU分解:
令 \(L\) 单位下三角,\(U\) 上三角。按步骤计算:- \(U\) 第一行:\(u_{11}=4,\ u_{12}=2,\ u_{13}=3\);
- \(L\) 第一列:\(l_{21}=2/4=0.5,\ l_{31}=5/4=1.25\);
- \(U\) 第二行:\(u_{22}=3-0.5\cdot2=2,\ u_{23}=0-0.5\cdot3=-1.5\);
- \(L\) 第二列:\(l_{32}=(0-1.25\cdot2)/2=-1.25\);
- \(U\) 第三行:\(u_{33}=6-1.25\cdot3-(-1.25)(-1.5)=6-3.75-1.875=0.375\)。
所以
\[L=\begin{bmatrix}1&0&0\\0.5&1&0\\1.25&-1.25&1\end{bmatrix},\quad U=\begin{bmatrix}4&2&3\\0&2&-1.5\\0&0&0.375\end{bmatrix}.\]解 \(Ly=b'\): \[y_1=9,\quad y_2=5-0.5\cdot9=0.5,\quad y_3=11-1.25\cdot9-(-1.25)\cdot0.5=11-11.25+0.625=0.375.\] 故 \(y=(9,0.5,0.375)^T\)。
解 \(Ux=y\): \[0.375x_3=0.375\Rightarrow x_3=1,\quad 2x_2-1.5x_3=0.5\Rightarrow 2x_2-1.5=0.5\Rightarrow x_2=1,\] \[4x_1+2x_2+3x_3=9\Rightarrow 4x_1+2+3=9\Rightarrow x_1=1.\] 解为:\(\boxed{x=(1,1,1)^T}\)。
(2)判断调整后方程组的 Jacobi 迭代是否收敛
调整后的 \(A'=\begin{bmatrix}4&2&3\\2&3&0\\5&0&6\end{bmatrix}\)。其对角矩阵 \(D=\mathrm{diag}(4,3,6)\)。Jacobi迭代矩阵: \[J=-D^{-1}(L+U)= \begin{bmatrix} 0 & -\frac{2}{4} & -\frac{3}{4}\\ -\frac{2}{3} & 0 & 0\\ -\frac{5}{6} & 0 & 0 \end{bmatrix} = \begin{bmatrix} 0 & -0.5 & -0.75\\ -0.6667 & 0 & 0\\ -0.8333 & 0 & 0 \end{bmatrix}.\] 求特征值: \[\det(\lambda I-J)= \begin{vmatrix} \lambda & 0.5 & 0.75\\ 0.6667 & \lambda & 0\\ 0.8333 & 0 & \lambda \end{vmatrix} = \lambda^3 - 0.3333\lambda - 0.625\lambda = \lambda(\lambda^2 - 0.9583)=0.\] 特征值为 \(0,\ \pm\sqrt{0.9583}\approx \pm0.979\),谱半径 \(\rho(J)\approx0.979<1\)。故 Jacobi 迭代收敛。
(3)写出调整后方程组的 Gauss-Seidel 迭代矩阵
调整后 \(A'=D+L+U\),其中
\(D=\mathrm{diag}(4,3,6)\),
\(L=\begin{bmatrix}0&0&0\\2&0&0\\5&0&0\end{bmatrix}\)(严格下三角),
\(U=\begin{bmatrix}0&2&3\\0&0&0\\0&0&0\end{bmatrix}\)(严格上三角)。Gauss-Seidel 迭代矩阵: \[B_{gs}=-(D+L)^{-1}U.\] 先计算 \((D+L)^{-1}\): \[D+L=\begin{bmatrix}4&0&0\\2&3&0\\5&0&6\end{bmatrix},\quad (D+L)^{-1}= \begin{bmatrix} \frac{1}{4}&0&0\\ -\frac{1}{6}&\frac{1}{3}&0\\ -\frac{5}{24}&0&\frac{1}{6} \end{bmatrix}.\] (验证:用初等变换或解方程可得。)
再乘 \(U\) 并取负: \(B_{gs}=- \begin{bmatrix} \frac{1}{4}&0&0\\ -\frac{1}{6}&\frac{1}{3}&0\\ -\frac{5}{24}&0&\frac{1}{6} \end{bmatrix} \begin{bmatrix} 0&2&3\\ 0&0&0\\ 0&0&0 \end{bmatrix}\) \(=- \begin{bmatrix} 0&\frac{1}{2}&\frac{3}{4}\\ 0&-\frac{1}{3}&-\frac{1}{2}\\ 0&-\frac{5}{12}&-\frac{5}{8} \end{bmatrix}\) \(=\begin{bmatrix} 0&-\frac{1}{2}&-\frac{3}{4}\\ 0&\frac{1}{3}&\frac{1}{2}\\ 0&\frac{5}{12}&\frac{5}{8} \end{bmatrix}.\)
故 Gauss-Seidel 迭代矩阵为: \[\boxed{ B_{gs}= \begin{bmatrix} 0 & -\frac{1}{2} & -\frac{3}{4}\\ 0 & \frac{1}{3} & \frac{1}{2}\\ 0 & \frac{5}{12} & \frac{5}{8} \end{bmatrix}. }\]
知识点五:非线性方程数值解
1. 压缩映像定理验证
对于不动点迭代 \(x_{k+1}=g(x_k)\),若在根 \(\alpha\) 的某邻域内满足 \(|g'(x)|\le L<1\)(\(L\) 为压缩常数),则迭代收敛。
验证步骤:
① 确定含根区间 \([a,b]\)(通常用零点定理 \(f(a)f(b)<0\));
② 构造函数 \(g(x)\),计算导数 \(g'(x)\);
③ 估计 \(\max_{a\le x\le b}|g'(x)|=L\)(单调性分析或直接求最值);
④ 判断 \(L<1\),若成立则迭代收敛。
2. 不动点迭代误差有界估计式
若压缩常数 \(L\) 已知,且已算得前两步迭代值 \(x_0,x_1\),则第 \(k\) 步误差满足:
\[|x_k-\alpha| \le \frac{L^k}{1-L}|x_1-x_0|.\]
用于预估达到指定精度所需的最小迭代次数。
3. 重根阶数判定定理(Multiplicity Test)
若 \(f(\alpha)=f'(\alpha)=\cdots=f^{(m-1)}(\alpha)=0\),但 \(f^{(m)}(\alpha)\ne0\),则 \(\alpha\) 是 \(f(x)=0\) 的 \(m\) 重根。
4. 修正Newton迭代公式
若已知根的重数 \(m\),使用如下公式可恢复二阶收敛速度:
\[x_{k+1}=x_k-m\frac{f(x_k)}{f'(x_k)}.\]
5. Aitken加速方法
当压缩常数 \(L\) 接近1时,基本迭代收敛极慢。Aitken加速通过三个连续迭代值外推,大幅提高收敛速度。
计算步骤(在基本迭代 \(x_{k+1}=g(x_k)\) 的基础上):
① 正常算两步:\(x_{k+1}=g(x_k),\ x_{k+2}=g(x_{k+1})\);
② 加速外推(考场直接套公式):
\[\hat{x}_k = x_k - \frac{(x_{k+1}-x_k)^2}{x_{k+2}-2x_{k+1}+x_k}.\]
③ 用 \(\hat{x}_k\) 替代 \(x_k\) 继续迭代(或作为最终近似值)。
注意:当分母接近0时(已收敛),停止加速。
对非线性方程:\(f(x)=4-x-2^x=0\)
(1)验证迭代公式 \(x_{k+1}=g(x_k)=\frac{\ln(4-x_k)}{\ln 2}\) 的收敛性;
(2)取初值 \(x_0=1.5\) 利用(1)中的公式迭代计算多少次可以达到 \(10^{-5}\) 精度要求?
解析
(1)构造 \(f(x)=4-x-2^x\),因 \(f(1)=4-1-2=1>0\),\(f(2)=4-2-4=-2<0\),根 \(\alpha\in(1,2)\)。
迭代函数导数: \[g'(x)=\frac{1}{\ln2}\cdot\frac{1}{4-x}\cdot(-1)=\frac{-1}{(4-x)\ln2}.\] 在 \(x\in(1,2)\) 上,\(4-x\in(2,3)\),故 \(|g'(x)|=\dfrac{1}{(4-x)\ln2}\) 单调递减,最大值在左端点 \(x=1\) 处取得: \[L=\max_{1\le x\le2}|g'(x)|=\frac{1}{(4-1)\ln2}=\frac{1}{3\ln2}\approx\frac{1}{2.0794}\approx0.4809<1.\] (注:原解答对区间选择有误,若取 \(x\in(1,2)\),分母最小为 \(4-2=2\),但实际 \(g'(x)\) 最大在 \(x=1\) 处,分母 \(4-1=3\),更严谨。)
因此压缩常数 \(L=0.4809<1\),由压缩映像定理,该不动点迭代在根邻域内收敛。
(2)初值 \(x_0=1.5\),计算: \[x_1=g(1.5)=\frac{\ln(4-1.5)}{\ln2}=\frac{\ln2.5}{\ln2}\approx1.321928.\] 初始误差跨度: \[|x_1-x_0|=|1.321928-1.5|=0.178072.\] 由误差有界估计式: \[\frac{L^k}{1-L}|x_1-x_0|\le 10^{-5}.\] 代入 \(L=0.4809\),\(1-L=0.5191\),\(\dfrac{|x_1-x_0|}{1-L}=\dfrac{0.178072}{0.5191}\approx0.3430\),于是: \[0.4809^k \times 0.3430 \le 10^{-5} \implies 0.4809^k \le 2.915\times10^{-5}.\] 两边取自然对数(或常用对数),这里用自然对数: \[k\ln(0.4809) \le \ln(2.915\times10^{-5})\] \[k \ge \frac{\ln(2.915\times10^{-5})}{\ln(0.4809)} = \frac{-10.443}{-0.7320} \approx 14.27.\] 向上取整,\(\boxed{k\ge15}\),即至少需要迭代 15 次。
\(x^*=0\) 是 \(f(x)=e^{3x}-1-3x-4.5x^2=0\) 的几重根?取 \(x_0=0.5\),分别用 Newton 公式与求重根的修正 Newton 公式计算此根的近似值,精确至 \(|f(x_k)|\le10^{-2}\)。
解析
确定重根数:
\[f(x) = e^{3x}-1-3x-4.5x^2 \implies f(0) = 1-1-0-0 = 0\]
\[f'(x) = 3e^{3x}-3-9x \implies f'(0) = 3-3-0 = 0\]
\[f''(x) = 9e^{3x}-9 \implies f''(0) = 9-9 = 0\]
\[f'''(x) = 27e^{3x} \implies f'''(0) = 27 \neq 0\]
根据定理,\(x^*=0\) 是系统的 3 重根 (\(m=3\))。
修正 Newton 迭代式计算:
\[x_{k+1} = x_k - 3\frac{f(x_k)}{f'(x_k)} = x_k - 3\frac{e^{3x_k}-1-3x_k-4.5x_k^2}{3e^{3x_k}-3-9x_k}\]
代入初始点进行数值推进,直至函数输出模长跨入 \(10^{-2}\) 阈值内。
知识点六:运筹与最优化(线性规划)
【核心知识与公式】
线性规划 (Linear Programming) 标准型:要求目标函数极大化(\(\max Z\)),所有约束条件均为等式(非等式加入非负松弛变量 \(\mathbf{x_s}\)),且所有决策变量非负。
数学模型三要素:决策变量 (Decision Variables)(即待求的生产数量)、目标函数 (Objective Function)(本题为追求利润最大化)、约束条件 (Constraints)(即资源总量的限制与变量的非负性)。
模型标准化 (Standardization):在使用单纯形法前,必须将一般线性规划模型转化为标准型。引入松弛变量 (Slack Variables),将不等式约束转化为等式约束。
极点最优性定理:线性规划如果存在可行最优解,该解必在可行域(凸多面体)的几何顶点(极点)上被截获。
单纯形法 (Simplex Method) 法则:
检验数 (Reduced Cost) \(\sigma_j\):用于判断当前基本可行解是否最优。对于最大化问题,若所有检验数 \(\sigma_j \le 0\),则达到最优解。
进基变量选择:检验数中具有最大正检验数的非基变量优先选入。
出基变量选择:依据最小非负比值原则 (\(\theta\) 规则) 确定离开基底的变量,以保证解的非负性。
\[\theta = \min_{a_{ik} > 0} \left\{ \frac{b_i}{a_{ik}} \right\}\]
填空:选择进基变量的基本原则是_____,选择出基变量的原则是_____。
解析
- 进基变量基本原则:最大正检验数原则(针对目标函数求最大值问题)。
- 出基变量选择原则:最小非负比值原则(或称 \(\theta\) 规则)。
(1)若线性规划有最优解,则必然在凸多边形(或凸多面体)的____上达到最优。(2)回归分析中,如果解释变量存在完全共线性,其影响( )。
解析
答案:(1)顶点(或极点)(2)\(X'X\) 矩阵不可逆,导致回归系数的最小二乘估计量 \(\hat{\beta} = (X'X)^{-1}X'y\) 不存在(无法唯一确定)。
某厂利用 A、B 两种原料生产甲、乙两种产品,技术参数如下:
(1)建立使工厂利润最大的生产计划数学模型;
(2)将模型标准化;利用单纯形法求出最优生产计划,列出单纯形表求解过程。
资源 产品甲消耗 (万吨/万件) 产品乙消耗 (万吨/万件) 资源总量 (万吨) A 5 2 15 B 4 8 20 产品利润 (万元/万件) 6 2 解析
### (1)建立数学模型
设生产产品甲的数量为 \(x_1\) 万件,生产产品乙的数量为 \(x_2\) 万件。
目标函数:
求利润最大化:
\[\max Z = 6x_1 + 2x_2\]
约束条件:
根据 A、B 两种资源的消耗量和总量限制,以及实际生产数量非负的特性,列出约束方程组:
\[s.t. \begin{cases} 5x_1 + 2x_2 \le 15 & \text{(原料A限制)} \\ 4x_1 + 8x_2 \le 20 & \text{(原料B限制)} \\ x_1, x_2 \ge 0 & \text{(非负约束)} \end{cases}\]
### (2)模型标准化与单纯形法求解
1. 将模型标准化
为了将不等号转换为等号,引入两个非负的松弛变量 \(x_3 \ge 0\) 和 \(x_4 \ge 0\)(分别代表原料A和原料B的剩余量)。
标准型数学模型如下:
\[\max Z = 6x_1 + 2x_2 + 0x_3 + 0x_4\]
\[s.t. \begin{cases} 5x_1 + 2x_2 + x_3 = 15 \\ 4x_1 + 8x_2 + x_4 = 20 \\ x_1, x_2, x_3, x_4 \ge 0 \end{cases}\]
2. 单纯形法迭代求解过程
初始基本可行解对应的基变量为 \(x_3\) 和 \(x_4\)。
初始单纯形表(迭代 0)
CB 基变量 常数项 b x1 (c1=6) x2 (c2=2) x3 (c3=0) x4 (c4=0) θi (最小比值) 0 \(x_3\) 15 5 2 1 0 \(15 / 5 = \mathbf{3}\) 0 \(x_4\) 20 4 8 0 1 \(20 / 4 = 5\) 检验数 \(\sigma_j\) 6 2 0 0 分析: 检验数中最大正数为 \(\sigma_1 = 6 > 0\),因此 \(x_1\) 为入基变量。计算 \(\theta_i\):\(\min(15/5, 20/4) = 3\),由第一行产生,因此 \(x_3\) 为出基变量。主元素(中心元)为 \(a_{11} = 5\)。
进行矩阵的初等行变换(旋转运算):
第一行除以主元素 5。
第二行减去(新的第一行 \(\times 4\))。
第一次迭代单纯形表(迭代 1)
CB 基变量 常数项 b x1 (c1=6) x2 (c2=2) x3 (c3=0) x4 (c4=0) 6 \(x_1\) 3 1 \(2/5\) \(1/5\) 0 0 \(x_4\) 8 0 \(32/5\) \(-4/5\) 1 检验数 \(\sigma_j\) 0 \(-2/5\) \(-6/5\) 0 计算检验数过程核对:
\(\sigma_1 = 6 - (6 \times 1 + 0 \times 0) = 0\)
\(\sigma_2 = 2 - (6 \times \frac{2}{5} + 0 \times \frac{32}{5}) = 2 - \frac{12}{5} = -\frac{2}{5}\)
\(\sigma_3 = 0 - (6 \times \frac{1}{5} + 0 \times -\frac{4}{5}) = -\frac{6}{5}\)
\(\sigma_4 = 0 - (6 \times 0 + 0 \times 1) = 0\)
结论判断: 在此单纯形表中,所有的检验数 \(\sigma_j \le 0\)(分别为 \(0, -2/5, -6/5, 0\)),满足最优性判定条件,迭代结束。
3. 输出最优生产计划
由最终的单纯形表可直接读出最优解:
基变量 \(x_1 = 3\),非基变量 \(x_2 = 0\)。
松弛变量 \(x_4 = 8\)(表明原料B剩余8万吨),\(x_3 = 0\)(原料A全部耗尽)。
最大利润 \(Z = 6 \times 3 + 2 \times 0 = 18\)。
最终答复:*最优生产计划为*生产产品甲 3 万件,生产产品乙 0 万件,此时工厂可获得最大利润 18 万元。
知识点七:概率统计与假设检验
1 常见分布速查总表(离散+连续)
| 类型 | 分布名称 | 记号 / 概率形态 | 期望 \(E(X)\) | 方差 \(D(X)\) | 适用场景 |
|---|---|---|---|---|---|
| 离散 | 二项分布 | \(X\sim B(n,p)\),\(P(X=k)=C_n^k p^k(1-p)^{n-k}\) | \(np\) | \(np(1-p)\) | \(n\)次独立重复试验成功次数 |
| 泊松分布 | \(X\sim P(\lambda)\),\(P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}\) | \(\lambda\) | \(\lambda\) | 单位时间内稀有事件发生次数 | |
| 几何分布 | \(P(X=k)=(1-p)^{k-1}p\)(首次成功) | \(1/p\) | \((1-p)/p^2\) | 首次成功所需试验次数 | |
| 超几何分布 | \(P(X=k)=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n}\) | \(n\frac{M}{N}\) | \(n\frac{M}{N}(1-\frac{M}{N})\frac{N-n}{N-1}\) | 无放回抽样的成功次数 | |
| 连续 | 正态分布 | \(X\sim N(\mu,\sigma^2)\),\(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\) | \(\mu\) | \(\sigma^2\) | 中心极限定理的基础 |
| 标准正态 | \(Z\sim N(0,1)\) | 0 | 1 | 标准化变换 \(Z=\frac{X-\mu}{\sigma}\) | |
| 卡方分布 | \(\chi^2\sim \chi^2(n)\)(\(n\)个独立标准正态平方和) | \(n\) | \(2n\) | 方差检验、拟合优度 | |
| \(t\) 分布 | \(t\sim t(n)\)(标准正态 / \(\sqrt{\chi^2/n}\)) | 0(\(n>1\)) | \(\frac{n}{n-2}\)(\(n>2\)) | 小样本均值检验(方差未知) | |
| \(F\) 分布 | \(F\sim F(n_1,n_2)\)(两卡方之比) | \(\frac{n_2}{n_2-2}\)(\(n_2>2\)) | 较复杂 | 方差齐性检验、ANOVA | |
| 指数分布 | \(X\sim Exp(\lambda)\),\(f(x)=\lambda e^{-\lambda x}\)(\(x>0\)) | \(1/\lambda\) | \(1/\lambda^2\) | 寿命、等待时间 | |
| 均匀分布 | \(X\sim U(a,b)\),\(f(x)=\frac{1}{b-a}\)(\(a\le x\le b\)) | \(\frac{a+b}{2}\) | \(\frac{(b-a)^2}{12}\) | 等概率区间 |
2 点估计的两大通用方法(MLE与矩估计)
极大似然估计(MLE):\(L(\theta)=\prod f(x_i;\theta)\) → 取对数 → 求导令为0(适用于表中任意分布,只需替换 \(f\))。
矩估计(MoM):令总体矩 = 样本矩。单参数:\(E(X)=\bar{X}\);多参数:再加 \(E(X^2)=\frac{1}{n}\sum X_i^2\) 联立。
例:指数分布 \(Exp(\lambda)\),\(E(X)=1/\lambda=\bar{X}\) ⇒ \(\hat{\lambda}=1/\bar{X}\)(矩估计);MLE结果相同(指数分布特例)。
3 区间估计与假设检验的统合框架(Z / t / 卡方 / F)
统一逻辑:
检验统计量 = \(\dfrac{\text{点估计} - \text{原假设值}}{\text{标准误}(SE)}\) (卡方和F另有形式,见下表)。
置信区间 = \(\text{点估计} \pm \text{分位数} \times SE\)。
| 检验目的 | 条件 / 变量 | 检验统计量显式公式 | 标准误 \(SE\)(区间用) | 分布(自由度) | 接受域(接受 \(H_0\) 的条件) |
|---|---|---|---|---|---|
| 单样本均值(Z检验) | \(\sigma\) 已知 | \(Z=\dfrac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}\) | \(\sigma/\sqrt{n}\) | \(Z\) | 双侧:\(\|Z\| \le Z_{\alpha/2}\) 右侧:\(Z \le Z_{\alpha}\) 左侧:\(Z \ge -Z_{\alpha}\) |
| 单样本均值(t检验) | \(\sigma\) 未知,用样本 \(s\) | \(t=\dfrac{\bar{x}-\mu_0}{s/\sqrt{n}}\) | \(s/\sqrt{n}\) | \(t(n-1)\) | 双侧:\(\|t\| \le t_{\alpha/2}(n-1)\) 右侧:\(t \le t_{\alpha}(n-1)\) 左侧:\(t \ge -t_{\alpha}(n-1)\) |
| 双样本均值差(Z检验) | 两 \(\sigma\) 已知 | \(Z=\dfrac{(\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2)_0}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\) | \(\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\) | \(Z\) | 双侧:\(\|Z\| \le Z_{\alpha/2}\) 右侧:\(Z \le Z_{\alpha}\) |
| 双样本均值差(t检验,齐性) | 两 \(\sigma\) 未知但相等 | \(t=\dfrac{(\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2)_0}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\) \(s_p^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}\) | \(s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\) | \(t(n_1+n_2-2)\) | 双侧:\(\|t\| \le t_{\alpha/2}(n_1+n_2-2)\) 右侧:\(t \le t_{\alpha}(n_1+n_2-2)\) |
| 单样本比例(Z检验) | 二项总体,大样本 | \(Z=\dfrac{\hat{p}-p_0}{\sqrt{p_0(1-p_0)/n}}\) | \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\) | \(Z\) | 双侧:\(\|Z\| \le Z_{\alpha/2}\) 右侧:\(Z \le Z_{\alpha}\) |
| 双样本比例差(Z检验) | 两独立二项,大样本 | \(Z=\dfrac{(\hat{p}_1-\hat{p}_2)-0}{\sqrt{\hat{p}(1-\hat{p})(\frac{1}{n_1}+\frac{1}{n_2})}}\) | \(\sqrt{\hat{p}(1-\hat{p})(\frac{1}{n_1}+\frac{1}{n_2})}\) | \(Z\) | 右侧:\(Z \le Z_{\alpha}\) |
| 单总体方差(卡方检验) | 正态总体,检验 \(\sigma^2\) | \(\chi^2=\dfrac{(n-1)s^2}{\sigma_0^2}\) | — | \(\chi^2(n-1)\) | 双侧:\(\chi^2_{1-\alpha/2}(n-1) \le \chi^2 \le \chi^2_{\alpha/2}(n-1)\) 右侧:\(\chi^2 \le \chi^2_{\alpha}(n-1)\) |
| 两总体方差齐性(F检验) | 两正态总体 | \(F=\dfrac{s_1^2}{s_2^2}\) (大者作分子) | — | \(F(n_1-1,n_2-1)\) | 双侧:\(F \le F_{\alpha/2}(n_1-1,n_2-1)\) |
| 卡方拟合优度/独立性 | 分类数据 | \(\chi^2=\sum\dfrac{(O-E)^2}{E}\) | — | \(\chi^2((r-1)(c-1))\) | 右侧:\(\chi^2 \le \chi^2_{\alpha}\) |
| 单因素方差分析(F检验) | 多组比较 | \(F=\dfrac{SSA/(k-1)}{SSE/(n-k)}\) | — | \(F(k-1,n-k)\) | 右侧:\(F \le F_{\alpha}(k-1,n-k)\) |
P值统一判定(覆盖全表):P值 = 在 \(H_0\) 成立下出现当前统计量或更极端值的概率。若 \(P<\alpha\),一律拒绝 \(H_0\)。
示例(袋装零食):\(\sigma\) 已知,单样本Z区间。\(\bar{x}=102,\ SE=3/\sqrt{25}=0.6\),区间 \(102\pm 1.96\times0.6=(100.824,103.176)\)。
4 一元线性回归(OLS)
4.1 模型与基本假定(BLUE)
- 模型:\(Y_i = \beta_0 + \beta_1 X_i + \varepsilon_i\)
- 高斯-马尔可夫假定:\(\varepsilon_i \sim N(0,\sigma^2)\) 独立同分布(线性、独立性、正态性、同方差性)。
4.2 最小二乘参数估计
- 斜率: \[\hat{\beta}_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2}\]
- 截距: \[\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X}\]
- 预测值:\(\hat{Y}_i = \hat{\beta}_0 + \hat{\beta}_1 X_i\)
4.3 拟合优度(\(R^2\) 与修正 \(R^2\))
总平方和:\(SS_T = \sum (Y_i - \bar{Y})^2\)
回归平方和:\(SS_R = \sum (\hat{Y}_i - \bar{Y})^2\)
残差平方和:\(SS_E = \sum (Y_i - \hat{Y}_i)^2\)
恒等关系:\(SS_T = SS_R + SS_E\)
决定系数: \[R^2 = \frac{SS_R}{SS_T} = 1 - \frac{SS_E}{SS_T}\]
修正决定系数(含 \(p\) 个自变量,一元时 \(p=1\)): \[R_{adj}^2 = 1 - \frac{SS_E / (n-p-1)}{SS_T / (n-1)}\]
防坑:\(R^2\) 随自变量增加只增不减,判断模型优劣必须看 \(R_{adj}^2\)。
4.4 显著性检验(整体与个体)
- 残差方差估计:\(s_e^2 = \frac{SS_E}{n-2}\)
- 回归系数 \(t\) 检验(检验 \(\beta_1 \neq 0\)): \[t = \frac{\hat{\beta}_1}{s_e / \sqrt{\sum (X_i - \bar{X})^2}} \sim t(n-2)\]
- 整体 \(F\) 检验(一元中等价于 \(t\) 检验): \[F = \frac{SS_R / 1}{SS_E / (n-2)} = t^2 \sim F(1, n-2)\]
4.5 预测区间(给定新点 \(x_0\))
\[\hat{y}_0 \pm t_{\alpha/2}(n-2) \cdot s_e \sqrt{1 + \frac{1}{n} + \frac{(x_0 - \bar{x})^2}{\sum (x_i - \bar{x})^2}}\]
4.6 补充:多重共线性(针对多元回归扩展)
- 完全共线性:\(X'X\) 奇异,OLS 无唯一解,软件自动剔除冗余变量。
- 近似共线性:方差膨胀因子 \(VIF>10\) 时,系数方差膨胀,\(t\) 检验失效,需改用逐步回归或岭回归。
5 方差分析与试验设计(ANOVA & DOE)
5.0 全局统一计算基石(所有 ANOVA 共用)
设总试验次数为 \(N\),所有观测值总和为 \(T=\sum y_i\)。
校正项:\(CT = \frac{T^2}{N}\)
总离差平方和:\(SS_T = \sum y_i^2 - CT\)
任一因素(组间)平方和的通式(核心公式,后续直接套用): \[SS_{因素} = \sum_{i=1}^{m} \frac{K_i^2}{n_i} - CT\] 其中 \(m\) 为该因素水平数,\(K_i\) 为第 \(i\) 水平的数据和,\(n_i\) 为该水平重复次数。
若为均衡设计(各水平重复次数相同,均为 \(r\)),简化为: \[SS_{因素} = \frac{1}{r}\sum_{i=1}^{m} K_i^2 - CT\]
5.1 单因素方差分析(One-Way ANOVA)
适用条件:1 个因素(\(k\) 个水平),总样本 \(N\)。
| 项目 | 公式/取值 |
|---|---|
| 模型 | \(Y_{ij} = \mu + \alpha_i + \varepsilon_{ij}\) |
| 平方和分解 | \[SS_T = SS_A + SS_E\] \[SS_A = \sum_{i=1}^{k} n_i (\bar{y}_{i\cdot} - \bar{y})^2= \sum_{i=1}^{k} \frac{T_i^2}{n_i} - \frac{T^2}{N}\] \[SS_E = \sum_{i=1}^{k} \sum_{j=1}^{n_i} (y_{ij} - \bar{y}_{i\cdot})^2= \sum_{i=1}^{k} \sum_{j=1}^{n_i} y_{ij}^2 - \sum_{i=1}^{k} \frac{T_i^2}{n_i}\] |
| 自由度 | \(df_A = k-1\);\(df_E = N-k\) |
| F 统计量 | \(F = \frac{SS_A / df_A}{SS_E / df_E} \sim F(df_A, df_E)\) |
5.2 双因素方差分析(Two-Way ANOVA)
5.2.1 无交互作用(无重复试验)
适用条件:行因素 \(A\)(\(r\) 水平)、列因素 \(B\)(\(c\) 水平),每个单元格 1 个数据。
| 项目 | 公式/取值 |
|---|---|
| 模型 | \(Y_{ij} = \mu + \alpha_i + \beta_j + \varepsilon_{ij}\) |
| 平方和分解 | \(SS_T = SS_A + SS_B + SS_E\) |
| \(SS_A\) 求法 | 将行因素 \(A\) 的 \(r\) 个水平合计 \(K_{A_i}\) 代入 5.0 通式(每个水平重复 \(c\) 次) |
| \(SS_B\) 求法 | 将列因素 \(B\) 的 \(c\) 个水平合计 \(K_{B_j}\) 代入 5.0 通式(每个水平重复 \(r\) 次) |
| 误差项 | \(SS_E = SS_T - SS_A - SS_B\) |
| 自由度 | \(df_A = r-1\);\(df_B = c-1\);\(df_E = (r-1)(c-1)\) |
| 双 F 统计量 | \(F_A = \frac{SS_A/df_A}{SS_E/df_E}\);\(F_B = \frac{SS_B/df_B}{SS_E/df_E}\) |
5.2.2 有交互作用(有重复试验)
适用条件:每格有 \(n'\) 次重复,总 \(N = r \times c \times n'\)。
| 项目 | 公式/取值 |
|---|---|
| 模型 | \(Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \varepsilon_{ijk}\) |
| 平方和分解 | \(SS_T = SS_A + SS_B + SS_{AB} + SS_E\) |
| \(SS_A, SS_B\) | 同 5.2.1 方法,代入 5.0 通式 |
| \(SS_{AB}\) | \(SS_{AB} = \left[ \frac{1}{n'} \sum_{i=1}^{r}\sum_{j=1}^{c} K_{ij}^2 - CT \right] - SS_A - SS_B\)(\(K_{ij}\) 为单元格内数据和) |
| 误差项 | \(SS_E = SS_T - SS_A - SS_B - SS_{AB}\) |
| 自由度 | \(df_A = r-1\);\(df_B = c-1\);\(df_{AB}=(r-1)(c-1)\);\(df_E = rc(n'-1)\) |
| 三 F 统计量 | \(F_A = \frac{MS_A}{MS_E}\);\(F_B = \frac{MS_B}{MS_E}\);\(F_{AB} = \frac{MS_{AB}}{MS_E}\) |
5.3 正交试验设计(极差分析与方差分析)
适用条件:L 型正交表(均衡设计),总试验 \(N\) 次,因素水平数 \(m\),每水平重复 \(r = N/m\) 次。
5.3.1 极差分析(排主次、选最优——直观判断)
- 第 \(j\) 列第 \(i\) 水平数据和:\(K_{ji}\)
- 极差: \[R_j = \max(K_{j1},...,K_{jm}) - \min(K_{j1},...,K_{jm})\]
- 决策:\(R_j\) 越大,该因素影响越大(主次排序依据);望大特性选 \(\max K_{ji}\),望小选 \(\min K_{ji}\)。
5.3.2 方差分析(看显著性——统计依据)
- 第 \(j\) 列平方和:直接将各列的 \(K_{ji}\) 代入 5.0 通式(均衡设计,分母为 \(r\)): \[SS_j = \frac{1}{r}\sum_{i=1}^{m} K_{ji}^2 - CT\]
- 自由度:\(df_j = m-1\)
5.3.3 误差项 \(SS_e\) 与 \(df_e\) 的确定(考场决策树)
| 情形 | 条件 | 处理方法 |
|---|---|---|
| A(有空列) | 正交表中存在未安排因素的空列 | 直接取:\(SS_e = SS_{\text{空列}}\),\(df_e = df_{\text{空列}}\) |
| B(有重复试验) | 无空列,但同一试验条件重复进行 | 计算单元格内波动:\(SS_e = \sum\sum (y_{ijk}-\bar{y}_{ij})^2\),\(df_e = N - \text{试验组合数}\) |
| C(无空列且无重复) | 饱和正交表(因素数 = 列数) | 合并小平方和法:将 \(SS\) 值最小的若干列合并,即 \(SS_e = SS_{(1)} + SS_{(2)} + \cdots\),\(df_e\) 对应相加;或声明近似指定某列为误差 |
5.3.4 构造 F 统计量
- \(MS_e = SS_e / df_e\)
- \(MS_j = SS_j / df_j\)
- \[F_j = \frac{MS_j}{MS_e} \sim F(df_j, df_e)\]
5.3.5 方差分析表模板(正交试验考场默写)
| 来源 | 平方和 \(SS\) | 自由度 \(df\) | 均方 \(MS\) | \(F\) 值 | 临界值 | 显著性 |
|---|---|---|---|---|---|---|
| 因素 1 | \(SS_1\) | \(m-1\) | \(SS_1/df_1\) | \(MS_1/MS_e\) | \(F_\alpha(df_1,df_e)\) | * |
| 因素 2 | \(SS_2\) | \(m-1\) | \(SS_2/df_2\) | \(MS_2/MS_e\) | \(F_\alpha(df_2,df_e)\) | * |
| ... | ... | ... | ... | ... | ... | ... |
| 误差 | \(SS_e\) | \(df_e\) | \(MS_e\) | — | — | — |
| 总和 | \(SS_T\) | \(N-1\) | — | — | — | — |
5.4 考场急救与优先规则(写在最后)
- F 值极端处理:若某因素 \(F_j < 1\),说明其影响小于误差波动,直接将该因素合并入误差(\(SS_e\) 和 \(df_e\) 重新累加),再重算其余因素的 F 值。
- 极差与 F 检验优先级:极差 \(R\) 只负责排主次顺序;显著性结论只看 F 检验。若 F 不显著,即便极差大,也不能写“影响显著”。
- 常见临界值速记(\(\alpha=0.05\)):\(F_{0.05}(1, n-2)\) 约等于 \(t^2\) 临界;\(F_{0.05}(2,2)=19.00\),\(F_{0.05}(2,3)=9.55\)。若试卷附 F 表,则直接查表。
采用最大似然法进行参数估计的前提是_____。
解析
答案:样本必须满足独立同分布条件。
判断以下 8 个变量中离散型随机变量的个数:交通事故次数、次品数量、零件加工时间、城市用电量、网站点击量、地区降雨量、成年人身高、地方气温。
解析
逐项审查变量在数学轴上的可列举性:
交通事故次数(计数值,可一一列举 \(\rightarrow\) 离散型)
次品数量(计数值,可一一列举 \(\rightarrow\) 离散型)
零件加工时间(连续实数段 \(\rightarrow\) 连续型)
城市用电量(连续实数段 \(\rightarrow\) 连续型)
网站点击量(计数值,可一一列举 \(\rightarrow\) 离散型)
地区降雨量(属于降雨物理体积,连续实数段 \(\rightarrow\) 连续型)
成年人身高(连续实数段 \(\rightarrow\) 连续型)
地方气温(连续实数段 \(\rightarrow\) 连续型)
统计离散随机变量总数:3 个。
设总体 X 服从 \([1,1+\theta]\) 上的均匀分布,则 \(\theta\) 的矩法估计为______,极大似联估计为______。
解析
矩估计推导:
均匀分布的理论期望公式为两端点均值:
\[E(X) = \frac{1 + (1+\theta)}{2} = 1 + \frac{\theta}{2}\]
令样本均值 \(\bar{X} = E(X)\):
\[\bar{X} = 1 + \frac{\theta}{2} \implies \frac{\theta}{2} = \bar{X} - 1 \implies \hat{\theta}_M = 2(\bar{X}-1)\]
极大似然估计推导:
似然函数要求所有样本点必须落在该定义域内:
\[1 \le X_i \le 1+\theta \implies 1+\theta \ge \max(X_i)\]
为了使似然概率密度 \(\frac{1}{\theta^n}\) 达到最大,\(\theta\) 必须尽量小,故取边界值:
\[1+\theta = X_{(n)} \quad (\text{其中 } X_{(n)} \text{ 表示样本最大值}) \implies \hat{\theta}_{MLE} = X_{(n)} - 1\]
如果$ x,y $有如下形式的一元线性回归模型 \(Y=a+0.8x+\varepsilon\),\(\varepsilon\sim N(0,\sigma^{2})\),独立观测数据为 \((x_i,y_i)\),则 a 的最小二乘估计为( ),\(\sigma^2\) 的无偏估计为( )。
解析
求 \(a\) 的估计值:
对回归模型两边同求期望均值:
\[\bar{y} = \hat{a} + 0.8\bar{x} \implies \hat{a} = \bar{y} - 0.8\bar{x}\]
求 \(\sigma^2\) 的无偏估计:
残差平方和 \(RSS = \sum_{i=1}^n (y_i - \hat{a} - 0.8x_i)^2\)。由于回归模型中斜率 0.8 是已知的确定常数,整个模型中只有 \(a\) 这一个未知参数被拟合估计,因此自由度只损失 1 个,分母除以 \(n-1\):
\[\hat{\sigma}^2 = \frac{1}{n-1}\sum_{i=1}^n(y_i - \hat{a} - 0.8x_i)^2\]
电子元件电阻数据:48, 52, 49, 51, 50, 53, 47, 54, 46。
求总体均值的 90% 置信区间;
检验 \(H_0:\mu\le50\) vs \(H_1:\mu>50\)(\(\alpha=0.1\));
说明 P 值含义。
解析
基础统计量提取:
\[\text{样本量 } n = 9, \quad \text{样本均值 } \bar{x} = 50\]
\[s^2 = \frac{1}{9-1}\sum(x_i - 50)^2 = 7.5 \implies \text{样本标准差 } s \approx 2.7386\]
置信区间(1)计算:
自由度 \(df = n-1 = 8\),双侧查表 \(t_{0.05}(8) = 1.8595\):
\[\text{误差边际 } E = 1.8595 \times \frac{2.7386}{\sqrt{9}} = 1.8595 \times 0.9129 \approx 1.698\]
置信区间为 \([50 - 1.698, 50 + 1.698] \implies \mathbf{(48.30, 51.70)}\)
假设检验(2)判定:
单侧检验统计量 \(t\) 构造:
\[t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} = \frac{50 - 50}{2.7386/3} = 0\]
单侧拒绝域临界值 \(t_{0.1}(8) = 1.396\)。由于 \(t = 0 < 1.396\),无法拒绝原假设 \(H_0\)。
P值(3)科学含义:
当原假设 \(H_0\) 严格成立时,获得的样本观测值(或比当前观测值更极端的情况)发生的概率。
原来的催化剂 \(\bar{x}_1=91.73, s_1^2=3.89, n_1=8\);新的催化剂 \(\bar{x}_2=93.75, s_2^2=4.02, n_2=8\)。
试问两总体的标准差是否相同?(取 \(\alpha=0.05\))
求得率差别 \(\mu_1 - \mu_2\) 的 90% 置信区间。
解析
方差齐性 F 检验(1):
\[F = \frac{s_2^2}{s_1^2} = \frac{4.02}{3.89} \approx 1.0334\]
查双侧临界表 \(F_{0.025}(7, 7) = 4.99\)。因为 \(F = 1.0334 < 4.99\),接受方差齐性假设,即标准差相同。
得率差置信区间(2)计算:
计算联合方差 \(s_p\):
\[s_p = \sqrt{\frac{(8-1)\times 3.89 + (8-1)\times 4.02}{8+8-2}} = \sqrt{\frac{7 \times 7.91}{14}} = \sqrt{3.955} \approx 1.9887\]
自由度 \(df = 14\),双侧 90% 查表临界值 \(t_{0.05}(14) = 1.7613\):
\[\text{误差半径 } E = 1.7613 \times 1.9887 \times \sqrt{\frac{1}{8}+\frac{1}{8}} = 1.7613 \times 1.9887 \times 0.5 \approx 1.7513\]
点估计中心:\(\bar{x}_1 - \bar{x}_2 = 91.73 - 93.75 = -2.02\)
置信区间:\(-2.02 \pm 1.7513 \implies \mathbf{(-3.771, -0.269)}\)
四种不同品种棉花产量数据如下,验证是否存在显著差异。
- 品种1 (\(n_1=3\)): 70, 75, 80. 均值 \(\bar{x}_1=75\)
- 品种2 (\(n_2=4\)): 77, 78, 80, 85. 均值 \(\bar{x}_2=80\)
- 品种3 (\(n_3=2\)): 46, 54. 均值 \(\bar{x}_3=50\)
- 品种4 (\(n_4=3\)): 82, 85, 88. 均值 \(\bar{x}_4=85\)
解析
总样本量 \(n = 3+4+2+3 = 12\),总体大均值 \(\bar{x} = 75\)。
计算组间平方和 (SSA):
\[SSA = \sum_{j=1}^4 n_j(\bar{x}_j - \bar{x})^2 = 3(75-75)^2 + 4(80-75)^2 + 2(50-75)^2 + 3(85-75)^2\]
\[SSA = 3(0) + 4(25) + 2(625) + 3(100) = 0 + 100 + 1250 + 300 = 1650\]
计算组内平方和 (SSE):
分别求各组内偏离平方和再累加:
\[\text{组1: } (70-75)^2+(75-75)^2+(80-75)^2 = 50\]
\[\text{组2: } (77-80)^2+(78-80)^2+(80-80)^2+(85-80)^2 = 9+4+0+25 = 38\]
\[\text{组3: } (46-50)^2+(54-50)^2 = 16+16 = 32\]
\[\text{组4: } (82-85)^2+(85-85)^2+(88-85)^2 = 9+0+9 = 18\]
\[SSE = 50 + 38 + 32 + 18 = 138\]
构建 F 统计量:
\[MSA = \frac{SSA}{k-1} = \frac{1650}{4-1} = 550, \quad MSE = \frac{SSE}{n-k} = \frac{138}{12-4} = 17.25\]
\[F = \frac{MSA}{MSE} = \frac{550}{17.25} \approx 31.884\]
查表临界值 \(F_{0.05}(3, 8) = 4.07\)。因为 \(F = 31.884 > 4.07\),强烈拒绝原假设,品种间产量存在显著差异。
四因素三水平正交试验结果表分析各因素对拉伸强度影响是否显著。
试验号 A B C D 拉伸强度 (指标值) 1 A1 180℃ 10MPa 圆形 50 2 A1 200℃ 15MPa 方形 55 3 A1 220℃ 20MPa 三角形 60 4 A2 180℃ 15MPa 三角形 58 5 A2 200℃ 20MPa 圆形 62 6 A2 220℃ 10MPa 方形 56 7 A3 180℃ 20MPa 方形 48 8 A3 200℃ 10MPa 三角形 52 9 A3 220℃ 15MPa 圆形 56 解析
本题共有 \(N=9\) 次试验,观测值总和:
\[T = 50+55+60+58+62+56+48+52+56 = 497\]
以因素 A 为例进行离差分析(每个水平重复 \(r=3\) 次):
计算各水平加和 \(K_i\):
\[K_{A1} = 50 + 55 + 60 = 165\]
\[K_{A2} = 58 + 62 + 56 = 176\]
\[K_{A3} = 48 + 52 + 56 = 156\]
计算因素 A 的平方和 (\(SS_A\)):
\[SS_A = \frac{1}{3}\left(K_{A1}^2 + K_{A2}^2 + K_{A3}^2\right) - \frac{T^2}{9}\]
\[SS_A = \frac{1}{3}\left(165^2 + 176^2 + 156^2\right) - \frac{497^2}{9}\]
\[SS_A = \frac{1}{3}(27225 + 30976 + 24336) - \frac{247009}{9} = \frac{82537}{3} - 27445.44 = 27512.33 - 27445.44 = 66.89\]
对其他因素 B、C、D 重复上述步骤求出 \(SS_B, SS_C, SS_D\),代入方差分析表求均方商,与对应的 \(F\) 临界值比较以评定各分量显著性。
A、B两厂生产同样材料,已知其抗压强度均服从正态分布,且 \(\sigma_A=27\),\(\sigma_B=32\)。现从A厂生产的材料中随机抽取81个样品,测得 \(\bar{x}_A=1035\ \text{kg/cm}^2\);从B厂生产的材料中随机抽取64个样品,测得 \(\bar{x}_B=1020\ \text{kg/cm}^2\)。
根据以上调查结果,在0.05的显著性水平下能否认为A厂生产的材料平均抗压强度比B厂高?(已知 \(Z_{0.025}=1.96\),\(Z_{0.05}=1.65\))
若计算得到统计量相应的P值为0.0031,试解释P值的含义。
解析
- 设A厂抗压强度均值为 \(\mu_A\),B厂为 \(\mu_B\)。检验 \(H_0:\mu_A\le\mu_B\)(即A不高于B),\(H_1:\mu_A>\mu_B\)(右侧单侧检验)。
已知:\(\bar{x}_A=1035,\ \bar{x}_B=1020,\ \sigma_A=27,\ \sigma_B=32,\ n_A=81,\ n_B=64\)。
检验统计量(Z):
\[Z=\frac{(\bar{x}_A-\bar{x}_B)-0}{\sqrt{\frac{\sigma_A^2}{n_A}+\frac{\sigma_B^2}{n_B}}} =\frac{1035-1020}{\sqrt{\frac{27^2}{81}+\frac{32^2}{64}}} =\frac{15}{\sqrt{9+16}} =\frac{15}{5}=3.\]
临界值 \(Z_{0.05}=1.65\)。由于 \(Z=3>1.65\),落入拒绝域,因此在0.05显著性水平下拒绝 \(H_0\),认为A厂材料的平均抗压强度显著高于B厂。
- P值为0.0031的含义是:在 \(H_0\)(A厂平均强度不高于B厂)成立的条件下,观察到当前样本均值差(15 kg/cm²)或更大差异的概率为0.0031。因为 \(0.0031<0.05\),说明在显著性水平0.05下拒绝 \(H_0\) 的证据非常充分。
某车间为了制定工时定额,需要确定加工零件所消耗的时间,为此进行了10次试验,其结果如下表所示:
X/个 68 53 70 84 60 72 51 83 70 64 Y/min 288 293 349 343 290 354 283 324 340 286 其中,X表示零件数,Y表示时间。基于以上数据,部分计算结果如下: \[\sum X=675,\quad \sum X^2=46659,\quad \sum Y=3150,\quad \sum XY=214267,\quad \sum (X_i-\bar{X})^2=1096.5,\quad \sum (Y_i-\bar{Y})^2=7870.\]
要求:
写出线性回归分析要满足的基本假定。
拟合简单线性回归方程,并解释方程中回归系数的意义。
进行显著性检验,显著性水平为0.05,\(t_{0.025}(8)=2.306\),\(t_{0.05}(8)=1.860\),\(F_{0.05}(1,8)=5.318\)。
假定 \(x_0=65\),利用拟合的回归方程预测相应的时间,并给出置信度为95%的预测区间。
解析
- 线性回归分析的基本假定:
① 线性性:因变量与自变量之间存在线性关系 \(Y=\beta_0+\beta_1X+\varepsilon\);
② 独立性:各观测值相互独立,即误差项 \(\varepsilon_i\) 相互独立;
③ 正态性:随机误差项服从正态分布 \(\varepsilon_i\sim N(0,\sigma^2)\);
④ 同方差性:各观测值的误差方差相等,即 \(\text{Var}(\varepsilon_i)=\sigma^2\) 为常数。
- 拟合线性回归方程
已知:\(n=10\),\(\sum X=675,\ \sum Y=3150,\ \sum X^2=46659,\ \sum XY=214267,\ \sum (X_i-\bar{X})^2=1096.5\)。
先算:
\[\bar{X}=\frac{675}{10}=67.5,\quad \bar{Y}=\frac{3150}{10}=315.\]
\[\sum(X_i-\bar{X})(Y_i-\bar{Y})=\sum XY-\frac{1}{n}(\sum X)(\sum Y) =214267-\frac{675\times3150}{10} =214267-212625=1642.\]
斜率:
\[\hat{\beta}_1=\frac{\sum(X_i-\bar{X})(Y_i-\bar{Y})}{\sum(X_i-\bar{X})^2} =\frac{1642}{1096.5}\approx1.4975.\]
截距:
\[\hat{\beta}_0=\bar{Y}-\hat{\beta}_1\bar{X} =315-1.4975\times67.5 =315-101.081=213.919.\]
回归方程:
\[\hat{Y}=213.919+1.4975X.\]
回归系数意义:斜率 \(\hat{\beta}_1=1.4975\) 表示零件数X每增加1个,加工时间Y平均增加约1.4975分钟。
- 显著性检验
先算残差平方和 \(SSE\):
\[\sum Y^2 = \sum(Y_i-\bar{Y})^2 + n\bar{Y}^2 = 7870 + 10\times315^2 = 7870 + 992250 = 1000120.\]
\[SSE=\sum Y^2-\hat{\beta}_0\sum Y-\hat{\beta}_1\sum XY =1000120-213.919\times3150-1.4975\times214267.\]
计算:
\(213.919\times3150=673844.85\),
\(1.4975\times214267=320864.83\)。
\[SSE=1000120-673844.85-320864.83=5410.32.\]
残差方差:
\[s_e^2=\frac{SSE}{n-2}=\frac{5410.32}{8}=676.29,\quad s_e=\sqrt{676.29}\approx26.006.\]
斜率的t检验:
\[s_{\hat{\beta}_1}=\frac{s_e}{\sqrt{\sum(X_i-\bar{X})^2}} =\frac{26.006}{\sqrt{1096.5}} =\frac{26.006}{33.113}=0.7854.\]
\[t=\frac{\hat{\beta}_1-0}{s_{\hat{\beta}_1}} =\frac{1.4975}{0.7854}=1.906.\]
临界值 \(t_{0.025}(8)=2.306\),\(|t|=1.906<2.306\),不拒绝 \(H_0\),即斜率在0.05显著性水平下不显著。
若用F检验:\(F=t^2=1.906^2=3.633<F_{0.05}(1,8)=5.318\),同样不显著。
因此,在显著性水平0.05下,零件数X对加工时间Y的线性影响不显著。
- 预测区间
给定 \(x_0=65\),预测值:
\[\hat{y}_0=213.919+1.4975\times65=213.919+97.3375=311.2565.\]
预测区间公式:
\[\hat{y}_0 \pm t_{0.025}(8)\cdot s_e\sqrt{1+\frac{1}{n}+\frac{(x_0-\bar{X})^2}{\sum(X_i-\bar{X})^2}}.\]
其中:
\[(x_0-\bar{X})^2=(65-67.5)^2=(-2.5)^2=6.25.\]
\[\sqrt{1+\frac{1}{10}+\frac{6.25}{1096.5}} =\sqrt{1+0.1+0.00570} =\sqrt{1.10570}\approx1.0515.\]
\[t_{0.025}(8)\cdot s_e\cdot1.0515=2.306\times26.006\times1.0515 =2.306\times27.345 \approx63.07.\]
预测区间:
\[311.2565 \pm 63.07 = (248.19,\ 374.33).\]
即在95%置信水平下,当零件数为65个时,加工时间的预测区间为:
\[(248.19,\ 374.33)\ \text{分钟}.\]


发表您的看法