> 技术文档 > 切比雪夫不等式的理解以及推导【超详细笔记】

切比雪夫不等式的理解以及推导【超详细笔记】


文章目录

  • 参考教程
  • 一、意义
  • 二、不等式的证明
    • 1. 马尔科夫不等式
      • 马尔可夫不等式证明( Y Y Y 为非负随机变量 )
    • 2. 切比雪夫不等式推导

参考教程

一个视频,彻底理解切比雪夫不等式

一、意义

1. 正态分布的 3σ 法则

  • 不等式:切比雪夫不等式 P { ∣ X − E X ∣ ≥ ε } ≤ D X ε 2 P\\{|X - EX| \\geq \\varepsilon\\} \\leq \\frac{DX}{\\varepsilon^2} P{XEXε}ε2DX,用于描述随机变量偏离期望的概率上界
  • 法则:正态分布的 3σ 法则
    在这里插入图片描述
  • 分布表示:正态分布 N ( μ , σ 2 ) N(\\mu, \\sigma^2) N(μ,σ2)(图中标注对应分布形态 )
  • 概率占比
    • μ ± σ \\mu \\pm \\sigma μ±σ 区间概率约 68.2%
    • μ ± 2 σ \\mu \\pm 2\\sigma μ±2σ 区间概率约 95.4%
    • μ ± 3 σ \\mu \\pm 3\\sigma μ±3σ 区间概率约 99.7%

2. 不等式的含义

切比雪夫不等式公式的另一种形式:

P { ∣ X − E X ∣ < ε } ≥ 1 − D X ε 2 P\\{|X - EX| < \\varepsilon\\} \\geq 1 - \\frac{DX}{\\varepsilon^2} P{XEX<ε}1ε2DX

(其中 ( X ) 是随机变量,( EX ) 为其期望,( DX ) 为方差,( \\varepsilon ) 是任意正数 )

∣X−EX∣ |X - EX| XEX就是X到均值的距离
这个公式就是 ∣ X − E X ∣ < ε |X - EX| < \\varepsilon XEX<ε这件事的概率做估计

3. 不等式的意义

  • ε \\varepsilon ε = σ \\sigma σ 时:
    P { ∣ X − E X ∣ < σ } ≥ 1 − σ 2 σ 2 = 0 P\\{|X - EX| < \\sigma\\} \\geq 1 - \\frac{\\sigma^2}{\\sigma^2} = 0 P{XEX<σ}1σ2σ2=0

  • ε \\varepsilon ε = 2 σ 2\\sigma 2σ 时:
    P { ∣ X − E X ∣ < 2 σ } ≥ 1 − σ 2 ( 2 σ ) 2 = 1 − 1 4 = 3 4 = 75 % P\\{|X - EX| < 2\\sigma\\} \\geq 1 - \\frac{\\sigma^2}{(2\\sigma)^2} = 1 - \\frac{1}{4} = \\frac{3}{4} = 75\\% P{XEX<2σ}1(2σ)2σ2=141=43=75%
    由此可见切比雪夫的估计比较保守

假如随便画一个分布,求阴影部分概率,切比雪夫不等式告诉我们这个概率一定大于等于75%,这就是其高明之处
在这里插入图片描述

二、不等式的证明

1. 马尔科夫不等式

  • 公式: P { Y ≥ a } ≤ E Y a P\\{ Y \\geq a \\} \\leq \\frac{EY}{a} P{Ya}aEY ( Y Y Y 取非负 )
    在这里插入图片描述

马尔可夫不等式证明( Y Y Y 为非负随机变量 )

  1. 由期望定义, Y Y Y 的数学期望:
    E Y = ∫ 0 + ∞ y ⋅ f ( y )   d y EY = \\int_{0}^{+\\infty} y \\cdot f(y) \\, dy EY=0+yf(y)dy

  2. Y ≥ 0 Y \\geq 0 Y0,且积分区间可拆分,当 y ≥ a y \\geq a ya y ≥ a y \\geq a ya,故:
    E Y ≥ ∫ a + ∞ y ⋅ f ( y )   d y ≥ ∫ a + ∞ a ⋅ f ( y )   d y EY \\geq \\int_{a}^{+\\infty} y \\cdot f(y) \\, dy \\geq \\int_{a}^{+\\infty} a \\cdot f(y) \\, dy EYa+yf(y)dya+af(y)dy

  3. 化简右侧积分:
    ∫ a + ∞ a ⋅ f ( y )   d y = a ⋅ ∫ a + ∞ f ( y )   d y = a ⋅ P { Y ≥ a } \\int_{a}^{+\\infty} a \\cdot f(y) \\, dy = a \\cdot \\int_{a}^{+\\infty} f(y) \\, dy = a \\cdot P\\{ Y \\geq a \\} a+af(y)dy=aa+f(y)dy=aP{Ya}

  4. 综上,整理得:
    P { Y ≥ a } ≤ E Y a P\\{ Y \\geq a \\} \\leq \\frac{EY}{a} P{Ya}aEY

2. 切比雪夫不等式推导

  1. 基础:马尔可夫不等式
    P { Y ≥ a } ≤ E Y a P\\{ Y \\geq a \\} \\leq \\frac{EY}{a} P{Ya}aEY
    (其中 ( Y ) 为非负随机变量 )

  2. 变量代换:
    Y = ( X − E X ) 2Y = (X - EX)^2 Y=(XEX)2 a = ε 2a = \\varepsilon^2 a=ε2

  3. 代入推导:

    • 第一步推导:
      P { ( X − E X ) 2 ≥ ε 2 } ≤ E [ ( X − E X ) 2 ] ε 2 P\\{ (X - EX)^2 \\geq \\varepsilon^2 \\} \\leq \\frac{E\\left[(X - EX)^2\\right]}{\\varepsilon^2} P{(XEX)2ε2}ε2E[(XEX)2]
    • E [ ( X − E X ) 2 ] = D X E\\left[(X - EX)^2\\right] = DX E[(XEX)2]=DX(方差定义 ),且 ( X − E X ) 2 ≥ ε 2 ⇔ ∣ X − E X ∣ ≥ ε (X - EX)^2 \\geq \\varepsilon^2 \\Leftrightarrow |X - EX| \\geq \\varepsilon (XEX)2ε2XEXε ,进一步得:
      P { ∣ X − E X ∣ ≥ ε } ≤ D X ε 2 P\\{ |X - EX| \\geq \\varepsilon \\} \\leq \\frac{DX}{\\varepsilon^2} P{XEXε}ε2DX