跳轉到

常態分佈 (Normal Distribution)

記號: \(X \sim N(\mu, \sigma^2)\)

項目 公式/說明
PDF \(f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)
期望值 \(E[X] = \mu\)
變異數 \(\text{Var}(X) = \sigma^2\)
MGF \(M_X(t) = e^{\mu t + \frac{\sigma^2 t^2}{2}}\)
標準化 \(Z = \frac{X - \mu}{\sigma} \sim N(0,1)\)
線性變換 \(aX + b \sim N(a\mu + b, a^2\sigma^2)\)
獨立和 \(X_1 + X_2 \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)\)
特性 對稱分佈、鐘形曲線

故事理解:全班考試成績平均70分,標準差10分。大部分人會落在60-80分之間,少數人特別高或特別低。如果老師說「加10分」,整個分佈往右平移;如果說「乘以1.2倍」,分佈會變寬。兩次獨立考試的總分,也會是常態分佈!

進階思考題

某智慧工廠使用感測器監測產品厚度。感測器的測量值 \(X\) 可表示為 \(X = \mu + \epsilon\),其中 \(\mu\) 是真實厚度,\(\epsilon \sim N(0, \sigma^2)\) 是測量誤差。已知 \(\sigma = 0.5\) mm。

(a) 基礎計算與機率

某產品的真實厚度 \(\mu = 10\) mm,測量值 \(X \sim N(10, 0.25)\)

  1. 寫出 \(X\) 的 PDF,計算 \(P(9.5 < X < 10.5)\)(提示:\(\Phi(1) \approx 0.8413\)
  2. 品管規定:若測量值落在 \([9, 11]\) 之外則判定為不良品。求誤判良品為不良品的機率(提示:\(\Phi(2) \approx 0.9772\)
  3. 若要使誤判率低於 1%,判定區間應設為 \([\mu - k\sigma, \mu + k\sigma]\),求 \(k\)(提示:\(\Phi(2.576) \approx 0.995\)

(b) 樣本平均與精度提升

為提高測量精度,對同一產品測量 \(n\) 次,取平均 \(\bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i\)

  1. 利用 MGF 證明 \(\bar{X}_n \sim N(\mu, \sigma^2/n)\)
  2. \(n = 4\),計算 \(P(|\bar{X}_4 - \mu| < 0.25)\)(提示:標準化後使用 \(\Phi(1) \approx 0.8413\)
  3. 要使 \(P(|\bar{X}_n - \mu| < 0.1) \geq 0.95\),至少需要測量幾次?(提示:\(\Phi(1.96) \approx 0.975\)

© 中央極限定理應用大二

生產線每小時產出 \(n = 100\) 件產品,每件重量獨立,期望值 \(\mu = 500\) g,標準差 \(\sigma = 20\) g(不一定是常態分佈)。

  1. 說明為何總重量 \(S_n = \sum_{i=1}^n X_i\) 近似服從常態分佈
  2. 計算 \(P(S_{100} > 50500)\)(提示:\(\Phi(2.5) \approx 0.9938\)
  3. 每箱裝 100 件,卡車限重 5100 kg。求「隨機裝 100 箱超重」的機率(提示:\(\Phi(5) \approx 1\)

(d) 參數估計與無偏性大二

感測器需要校正。工程師對已知厚度 \(\mu\) 的標準件測量 \(n\) 次,得到 \(X_1, X_2, \ldots, X_n\),其中 \(X_i = \mu + \epsilon_i\)\(\epsilon_i \sim N(0, \sigma^2)\) 獨立。

  1. 證明 \(\hat{\mu} = \bar{X}_n\)\(\mu\) 的無偏估計量(即 \(E[\hat{\mu}] = \mu\)
  2. 計算 \(\text{Var}(\hat{\mu})\),說明為何 \(n\) 越大估計越精確
  3. 若改用估計量 \(\tilde{\mu} = \frac{1}{2}(X_1 + X_n)\),判斷是否無偏,並比較 \(\text{Var}(\tilde{\mu})\)\(\text{Var}(\hat{\mu})\)

(e) 信賴區間大二

承上題,\(\sigma = 0.5\) 已知,\(n = 25\) 次測量得到 \(\bar{x} = 10.08\)

  1. 建構 \(\mu\) 的 95% 信賴區間(提示:\(z_{0.025} = 1.96\)
  2. 若要使信賴區間寬度不超過 0.2,至少需要幾次測量?
  3. \(\sigma\) 未知,樣本標準差 \(s = 0.48\),如何修正信賴區間?(提示:使用 \(t\) 分佈,\(t_{24, 0.025} \approx 2.064\)

(f) 雙變量常態與品質關聯大三

產品有兩個品質指標 \((X, Y)\) 服從雙變量常態分佈,\(\mu_X = 10\)\(\mu_Y = 20\)\(\sigma_X = 1\)\(\sigma_Y = 2\),相關係數 \(\rho = 0.6\)

  1. 寫出聯合 PDF 的表達式
  2. 若已知 \(Y = 22\),求 \(X\) 的條件期望 \(E[X \mid Y = 22]\) 和條件變異數 \(\text{Var}(X \mid Y = 22)\)
  3. 解釋 \(\rho = 0.6\) 在品質管理中的意義:若 \(Y\) 偏高,\(X\) 傾向如何變化?

(g) 樣本變異數與卡方分佈大三

定義樣本變異數 \(S_n^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X}_n)^2\)

  1. 證明 \(E[S_n^2] = \sigma^2\)(即 \(S_n^2\)\(\sigma^2\) 的無偏估計)
  2. \(X_i \sim N(\mu, \sigma^2)\),證明 \(\frac{(n-1)S_n^2}{\sigma^2} \sim \chi^2_{n-1}\)
  3. 利用卡方分佈,建構 \(\sigma^2\) 的 95% 信賴區間(提示:\(\chi^2_{24, 0.025} \approx 39.36\)\(\chi^2_{24, 0.975} \approx 12.40\)