> 技术文档 > 概率论与数理统计(八)

概率论与数理统计(八)


参数估计

通过取样本,并用样本构造函数,达成估计分布函数参数的目的

矩估计法

本质:用样本的各阶矩代替总体的各阶矩,即取:

E ( X ) = X ‾ = 1 n∑ iX i E ( X 2 ) = 1 n∑ iX i 2 E(X)=\\overline{X}=\\dfrac{1}{n}\\sum_i X_i\\\\ E(X^2)=\\dfrac{1}{n}\\sum_iX_i^2 E(X)=X=n1iXiE(X2)=n1iXi2

极大似然估计法

本质:将使得样本 A A A 发生概率最大的参数值作为估计值

1、写出总体概率/密度函数

2、构造似然函数 L(λ) L(\\lambda) L(λ)

3、两边取 ln⁡ \\ln ln

4、对 λ \\lambda λ 求导

点估计的优良性准则

一、无偏性 E( θ ^ )=θ E(\\hat{\\theta})=\\theta E(θ^)=θ

定理:总体为 X X X,且 E(X)=μ E(X)=\\mu E(X)=μ D(X)= σ 2 D(X)=\\sigma^2 D(X)=σ2,样本为 ( X 1 ,⋯   , X n ) (X_1,\\cdots,X_n) (X1,,Xn),那么有:

1、 X ‾ \\overline{X} X μ \\mu μ 的无偏估计

2、样本方差 S 2 S^2 S2 σ 2 \\sigma^2 σ2 的无偏估计

3、取 μ ^ = C 1 X 1 +⋯+ C n X n \\hat{\\mu}=C_1X_1 + \\cdots + C_nX_n μ^=C1X1++CnXn,若 C 1 +⋯+ C n =1 C_1+\\cdots + C_n=1 C1++Cn=1,则 μ ^ \\hat{\\mu} μ^ μ \\mu μ 的无偏估计

证明:

1 与 2:

已经在 上一份笔记 中证明过 E( X ‾ )=μ E(\\overline{X})=\\mu E(X)=μ E( S 2 )= σ 2 E(S^2)=\\sigma^2 E(S2)=σ2

3:

E ( μ ^ ) = E ( C 1 X 1 + ⋯ + C n X n ) = E ( C 1 X 1 ) + ⋯ + E ( C n X n ) = C 1 E ( X 1 ) + ⋯ + C n E ( X n ) = ( C 1 + ⋯ + C n ) μ = μ \\begin{align*} E(\\hat{\\mu}) &= E(C_1X_1 + \\cdots + C_nX_n)\\\\ &=E(C_1X_1)+\\cdots+E(C_nX_n)\\\\ &=C_1E(X_1)+\\cdots+C_nE(X_n)\\\\ &=(C_1+\\cdots+C_n)\\mu\\\\ &=\\mu \\end{align*} E(μ^)=E(C1X1++CnXn)=E(C1X1)++E(CnXn)=C1E(X1)++CnE(Xn)=(C1++Cn)μ=μ

!注意: θ ^\\hat{\\theta} θ^ θ \\theta θ 的无偏估计,但是 g ( θ ^ ) g(\\hat{\\theta}) g(θ^) 不一定是 g ( θ ) g(\\theta) g(θ) 的无偏估计
例如: S 2 S^2 S2 σ 2 \\sigma^2 σ2 的无偏估计,而 S S S 不是 σ \\sigma σ 的无偏估计(性质)
该性质的证明:
D ( S ) = E ( S 2 ) − E ( S ) 2 = σ 2 − E ( S ) 2 ⇒ E ( S ) =σ 2 − D ( S ) ⩽ σ \\begin{align*} &D(S) = E(S^2)-E(S)^2\\\\ &=\\sigma^2-E(S)^2\\\\ &\\Rightarrow E(S)=\\sqrt{\\sigma^2-D(S)}\\leqslant\\sigma \\end{align*}D(S)=E(S2)E(S)2=σ2E(S)2E(S)=σ2D(S) σ

二、有效性 D( θ 1 ^ )⩽D( θ 2 ^ ) D(\\hat{\\theta_1})\\leqslant D(\\hat{\\theta_2}) D(θ1^)D(θ2^)

定理:总体为 X X X,且 E(X)=μ E(X)=\\mu E(X)=μ D(X)= σ 2 D(X)=\\sigma^2 D(X)=σ2,样本为 ( X 1 ,⋯   , X n ) (X_1,\\cdots,X_n) (X1,,Xn),若 a 1 +⋯+ a n =1 a_1+\\cdots+a_n=1 a1++an=1,则现有两种 μ \\mu μ 的估计: a 1 X 1 +⋯+ a n X n a_1X_1+\\cdots+a_nX_n a1X1++anXn X ‾ \\overline{X} X,由有效性准则认为, X ‾ \\overline{X} X 更优

证明:

由 上一份笔记 知 D( X ‾ )= σ 2 n D(\\overline{X})=\\dfrac{\\sigma^2}{n} D(X)=nσ2

那么有:

D ( θ ^ ) = D ( a 1 X 1 + ⋯ + a n X n ) = a 1 2 D ( X 1 ) + ⋯ + a n 2 D ( X n ) = σ 2 ( a 1 2 + ⋯ + a n 2 ) ⩾σ 2 n \\begin{align*} D(\\hat{\\theta})&=D(a_1X_1+\\cdots+a_nX_n)\\\\ &=a_1^2D(X_1)+\\cdots+a_n^2D(X_n)\\\\ &=\\sigma^2(a^2_1+\\cdots+a^2_n)\\\\ &\\geqslant \\dfrac{\\sigma^2}{n} \\end{align*} D(θ^)=D(a1X1++anXn)=a12D(X1)++an2D(Xn)=σ2(a12++an2)nσ2

三、相合性(一致性) lim ⁡n → + ∞ P(∣ θ ^ −θ∣<ε)=1 \\lim\\limits_{n\\to +\\infty}P(|\\hat{\\theta}-\\theta|<\\varepsilon)=1 n+limP(θ^θ<ε)=1

置信区间

区间估计时,区间长度落在区间的概率 十分重要

P( θ 1 ⩽θ⩽ θ 2 )=1−α P(\\theta_1 \\leqslant \\theta \\leqslant \\theta_2)=1-\\alpha P(θ1θθ2)=1α,则 1−α 1-\\alpha 1α 称为 置信度,而 [ θ 1 , θ 2 ] [\\theta_1,\\theta_2] [θ1,θ2] 则是估计区间

定义:

1、 I=I(T,θ) I=I(T,\\theta) I=I(T,θ),其中 θ \\theta θ 是未知参数, T T T 是已知的,随机变量 I I I 的分布 F F F 已知且其分布与 θ \\theta θ 无关,则将 I I I 称为 枢轴变量

2、给定 1−α 1-\\alpha 1α,确定 F F F 的上 α 2 \\dfrac{\\alpha}{2} 2α 分位数为 v α 2 v_{\\frac{\\alpha}{2}} v2α,上 1− α 2 1-\\dfrac{\\alpha}{2} 12α v 1 − α 2 v_{1-\\frac{\\alpha}{2}} v12α,则:

P ( v α 2 ⩽ I ( T , θ ) ⩽ v 1 − α 2 ) = 1 − α P\\left(v_{\\frac{\\alpha}{2}}\\leqslant I(T,\\theta) \\leqslant v_{1-\\frac{\\alpha}{2}}\\right)=1-\\alpha P(v2αI(T,θ)v12α)=1α

一个正态总体的均值和方差的区间估计

v= n ( X ‾ − μ ) σ ∼N(0,1) v=\\dfrac{\\sqrt{n}(\\overline{X}-\\mu)}{\\sigma}\\sim N(0,1) v=σn (Xμ)N(0,1)

给定 1−α 1-\\alpha 1α,令 P(v> u α 2 )= α 2 P(v>u_{\\frac{\\alpha}{2}})=\\dfrac{\\alpha}{2} P(v>u2α)=2α

1、 σ 2 \\sigma^2 σ2 已知,对 μ \\mu μ 的区间估计:

P ( − u α 2 ⩽n ( X ‾ − μ ) σ ⩽ u α 2 ) = 1 − α P ( − σ u α 2 n ⩽ X ‾ − μ ⩽ σ u α 2 n ) = 1 − α P ( X ‾ − σ u α 2 n ⩽ μ ⩽ X ‾ + σ u α 2 n ) = 1 − α \\begin{align*} &P\\left(-u_{\\frac{\\alpha}{2}}\\leqslant \\dfrac{\\sqrt{n}(\\overline{X}-\\mu)}{\\sigma} \\leqslant u_{\\frac{\\alpha}{2}}\\right)=1-\\alpha\\\\ &P\\left(-\\dfrac{\\sigma u_{\\frac{\\alpha}{2}}}{\\sqrt{n}}\\leqslant\\overline{X}-\\mu\\leqslant\\dfrac{\\sigma u_{\\frac{\\alpha}{2}}}{\\sqrt{n}}\\right)=1-\\alpha\\\\ &P\\left(\\overline{X}-\\dfrac{\\sigma u_{\\frac{\\alpha}{2}}}{\\sqrt{n}}\\leqslant\\mu\\leqslant\\overline{X}+\\dfrac{\\sigma u_{\\frac{\\alpha}{2}}}{\\sqrt{n}}\\right)=1-\\alpha \\end{align*} P(u2ασn (Xμ)u2α)=1αP(n σu2αXμn σu2α)=1αP(Xn σu2αμX+n σu2α)=1α

也就是说,有 1−α 1-\\alpha 1α 的把握,认为 μ \\mu μ 在区间 [ X ‾ − σ u α 2 n , X ‾ + σ u α 2 n ] \\left[\\overline{X}-\\dfrac{\\sigma u_{\\frac{\\alpha}{2}}}{\\sqrt{n}}, \\overline{X}+\\dfrac{\\sigma u_{\\frac{\\alpha}{2}}}{\\sqrt{n}}\\right] [Xn σu2α,X+n σu2α]

2、 σ 2 \\sigma^2 σ2 未知,对 μ \\mu μ 的区间估计:

构造枢轴变量: T= n ( X ‾ − μ ) S ∼t(n−1) T=\\dfrac{\\sqrt{n}(\\overline{X}-\\mu)}{S}\\sim t(n-1) T=Sn (Xμ)t(n1)

P ( − t α 2 ( n − 1 ) ⩽n ( X ‾ − μ S ⩽ t α 2 ( n − 1 ) ) = 1 − α ⇒ P ( X ‾ − S n t α 2 ( n − 1 ) ⩽ μ ⩽ X ‾ + S n t α 2 ( n − 1 ) ) = 1 − α \\begin{align*} &P\\left(-t_{\\frac{\\alpha}{2}}(n-1)\\leqslant\\dfrac{\\sqrt{n}(\\overline{X}-\\mu}{S}\\leqslant t_{\\frac{\\alpha}{2}}(n-1)\\right)=1-\\alpha\\\\ &\\Rightarrow P\\left(\\overline{X}-\\dfrac{S}{\\sqrt{n}}t_{\\frac{\\alpha}{2}}(n-1) \\leqslant \\mu \\leqslant \\overline{X}+\\dfrac{S}{\\sqrt{n}}t_{\\frac{\\alpha}{2}}(n-1)\\right)=1-\\alpha \\end{align*} P(t2α(n1)Sn (Xμt2α(n1))=1αP(Xn St2α(n1)μX+n St2α(n1))=1α

也就是说,有 1−α 1-\\alpha 1α 的把握,认为 μ \\mu μ 在区间 [ X ‾ − S n t α 2 (n−1), X ‾ + S n t α 2 (n−1)] \\left[\\overline{X}-\\dfrac{S}{\\sqrt{n}}t_{\\frac{\\alpha}{2}}(n-1), \\overline{X}+\\dfrac{S}{\\sqrt{n}}t_{\\frac{\\alpha}{2}}(n-1)\\right] [Xn St2α(n1),X+n St2α(n1)]

3、 μ \\mu μ 已知,对 σ 2 \\sigma^2 σ2 的区间估计:

构造枢轴变量: χ 2 = 1 σ 2 ∑ i = 1 n ( X i −μ ) 2 ∼ χ 2 (n) \\chi^2=\\dfrac{1}{\\sigma^2}\\sum\\limits_{i=1}^n(X_i-\\mu)^2\\sim \\chi^2(n) χ2=σ21i=1n(Xiμ)2χ2(n),给定 1−α 1-\\alpha 1α χ 1 − α 22 (n) \\chi^2_{1-\\frac{\\alpha}{2}}(n) χ12α2(n) χ α 2 2 (n) \\chi^2_{\\frac{\\alpha}{2}}(n) χ2α2(n)

注意:之所以不继续使用正态分布的枢轴变量,是因为 σ \\sigma σ 在开平方后不是无偏估计

P ( χ 1 − α 2 2 ( n ) ⩽ 1 σ 2 ∑ i = 1 n ( X i − μ ) 2 ⩽ χ α 2 2 ( n ) ) = 1 − α ⇒ ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) ⩽ σ 2 ⩽ ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) \\begin{align*} &P\\left(\\chi^2_{1-\\frac{\\alpha}{2}}(n)\\leqslant\\dfrac{1}{\\sigma^2}\\sum_{i=1}^n(X_i-\\mu)^2\\leqslant\\chi^2_{\\frac{\\alpha}{2}}(n)\\right)=1-\\alpha\\\\ &\\Rightarrow \\dfrac{\\sum_{i=1}^n(X_i-\\mu)^2}{\\chi^2_{\\frac{\\alpha}{2}}(n)}\\leqslant\\sigma^2\\leqslant\\dfrac{\\sum_{i=1}^n(X_i-\\mu)^2}{\\chi^2_{1-\\frac{\\alpha}{2}}(n)} \\end{align*} P(χ12α2(n)σ21i=1n(Xiμ)2χ2α2(n))=1αχ2α2(n)i=1n(Xiμ)2σ2χ12α2(n)i=1n(Xiμ)2

也就是说,有 1−α 1-\\alpha 1α 的把握,认为 σ 2 \\sigma^2 σ2 在区间 [ ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) , ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) ] \\left[\\dfrac{\\sum_{i=1}^n(X_i-\\mu)^2}{\\chi^2_{\\frac{\\alpha}{2}}(n)},\\dfrac{\\sum_{i=1}^n(X_i-\\mu)^2}{\\chi^2_{1-\\frac{\\alpha}{2}}(n)}\\right] [χ2α2(n)i=1n(Xiμ)2,χ12α2(n)i=1n(Xiμ)2]

4、 μ \\mu μ 未知,对 σ 2 \\sigma^2 σ2 的区间估计:

构造枢轴变量: χ 2 = ( n − 1 ) S 2 σ 2 ∼ χ 2 (n−1) \\chi^2=\\dfrac{(n-1)S^2}{\\sigma^2}\\sim \\chi^2(n-1) χ2=σ2(n1)S2χ2(n1),给定 1−α 1-\\alpha 1α χ 1 − α 22 (n−1) \\chi^2_{1-\\frac{\\alpha}{2}}(n-1) χ12α2(n1) χ α 2 2 (n−1) \\chi^2_{\\frac{\\alpha}{2}}(n-1) χ2α2(n1)

P ( χ 1 − α 2 2 ( n − 1 ) ⩽ ( n − 1 ) S 2 σ 2 ⩽ χ α 2 2 ( n − 1 ) ) = 1 − α ⇒ P ( ( n − 1 ) S 2 χ α 22 ( n − 1 ) ⩽ σ 2 ⩽ ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) ) = 1 − α \\begin{align*} &P\\left(\\chi^2_{1-\\frac{\\alpha}{2}}(n-1)\\leqslant\\dfrac{(n-1)S^2}{\\sigma^2}\\leqslant\\chi^2_{\\frac{\\alpha}{2}}(n-1)\\right)=1-\\alpha\\\\ &\\Rightarrow P\\left(\\dfrac{(n-1)S^2}{\\chi^2_{\\frac{\\alpha}{2}}(n-1)}\\leqslant\\sigma^2\\leqslant\\dfrac{(n-1)S^2}{\\chi^2_{1-\\frac{\\alpha}{2}}(n-1)}\\right)=1-\\alpha \\end{align*} P(χ12α2(n1)σ2(n1)S2χ2α2(n1))=1αP(χ2α2(n1)(n1)S2σ2χ12α2(n1)(n1)S2)=1α

也就是说,有 1−α 1-\\alpha 1α 的把握,认为 σ 2 \\sigma^2 σ2 在区间 [ ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) ] \\left[\\dfrac{(n-1)S^2}{\\chi^2_{\\frac{\\alpha}{2}}(n-1)},\\dfrac{(n-1)S^2}{\\chi^2_{1-\\frac{\\alpha}{2}}(n-1)}\\right] [χ2α2(n1)(n1)S2,χ12α2(n1)(n1)S2]

实验室仪器设备