常態分佈 (Normal Distribution)¶
記號: \(X \sim N(\mu, \sigma^2)\)
| 項目 | 公式/說明 |
|---|---|
| \(f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\) | |
| 期望值 | \(E[X] = \mu\) |
| 變異數 | \(\text{Var}(X) = \sigma^2\) |
| MGF | \(M_X(t) = e^{\mu t + \frac{\sigma^2 t^2}{2}}\) |
| 標準化 | \(Z = \frac{X - \mu}{\sigma} \sim N(0,1)\) |
| 線性變換 | \(aX + b \sim N(a\mu + b, a^2\sigma^2)\) |
| 獨立和 | \(X_1 + X_2 \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)\) |
| 特性 | 對稱分佈、鐘形曲線 |
故事理解:全班考試成績平均70分,標準差10分。大部分人會落在60-80分之間,少數人特別高或特別低。如果老師說「加10分」,整個分佈往右平移;如果說「乘以1.2倍」,分佈會變寬。兩次獨立考試的總分,也會是常態分佈!
進階思考題
某智慧工廠使用感測器監測產品厚度。感測器的測量值 \(X\) 可表示為 \(X = \mu + \epsilon\),其中 \(\mu\) 是真實厚度,\(\epsilon \sim N(0, \sigma^2)\) 是測量誤差。已知 \(\sigma = 0.5\) mm。
(a) 基礎計算與機率
某產品的真實厚度 \(\mu = 10\) mm,測量值 \(X \sim N(10, 0.25)\)。
- 寫出 \(X\) 的 PDF,計算 \(P(9.5 < X < 10.5)\)(提示:\(\Phi(1) \approx 0.8413\))
- 品管規定:若測量值落在 \([9, 11]\) 之外則判定為不良品。求誤判良品為不良品的機率(提示:\(\Phi(2) \approx 0.9772\))
- 若要使誤判率低於 1%,判定區間應設為 \([\mu - k\sigma, \mu + k\sigma]\),求 \(k\)(提示:\(\Phi(2.576) \approx 0.995\))
(b) 樣本平均與精度提升
為提高測量精度,對同一產品測量 \(n\) 次,取平均 \(\bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i\)。
- 利用 MGF 證明 \(\bar{X}_n \sim N(\mu, \sigma^2/n)\)
- 若 \(n = 4\),計算 \(P(|\bar{X}_4 - \mu| < 0.25)\)(提示:標準化後使用 \(\Phi(1) \approx 0.8413\))
- 要使 \(P(|\bar{X}_n - \mu| < 0.1) \geq 0.95\),至少需要測量幾次?(提示:\(\Phi(1.96) \approx 0.975\))
© 中央極限定理應用大二
生產線每小時產出 \(n = 100\) 件產品,每件重量獨立,期望值 \(\mu = 500\) g,標準差 \(\sigma = 20\) g(不一定是常態分佈)。
- 說明為何總重量 \(S_n = \sum_{i=1}^n X_i\) 近似服從常態分佈
- 計算 \(P(S_{100} > 50500)\)(提示:\(\Phi(2.5) \approx 0.9938\))
- 每箱裝 100 件,卡車限重 5100 kg。求「隨機裝 100 箱超重」的機率(提示:\(\Phi(5) \approx 1\))
(d) 參數估計與無偏性大二
感測器需要校正。工程師對已知厚度 \(\mu\) 的標準件測量 \(n\) 次,得到 \(X_1, X_2, \ldots, X_n\),其中 \(X_i = \mu + \epsilon_i\),\(\epsilon_i \sim N(0, \sigma^2)\) 獨立。
- 證明 \(\hat{\mu} = \bar{X}_n\) 是 \(\mu\) 的無偏估計量(即 \(E[\hat{\mu}] = \mu\))
- 計算 \(\text{Var}(\hat{\mu})\),說明為何 \(n\) 越大估計越精確
- 若改用估計量 \(\tilde{\mu} = \frac{1}{2}(X_1 + X_n)\),判斷是否無偏,並比較 \(\text{Var}(\tilde{\mu})\) 與 \(\text{Var}(\hat{\mu})\)
(e) 信賴區間大二
承上題,\(\sigma = 0.5\) 已知,\(n = 25\) 次測量得到 \(\bar{x} = 10.08\)。
- 建構 \(\mu\) 的 95% 信賴區間(提示:\(z_{0.025} = 1.96\))
- 若要使信賴區間寬度不超過 0.2,至少需要幾次測量?
- 若 \(\sigma\) 未知,樣本標準差 \(s = 0.48\),如何修正信賴區間?(提示:使用 \(t\) 分佈,\(t_{24, 0.025} \approx 2.064\))
(f) 雙變量常態與品質關聯大三
產品有兩個品質指標 \((X, Y)\) 服從雙變量常態分佈,\(\mu_X = 10\),\(\mu_Y = 20\),\(\sigma_X = 1\),\(\sigma_Y = 2\),相關係數 \(\rho = 0.6\)。
- 寫出聯合 PDF 的表達式
- 若已知 \(Y = 22\),求 \(X\) 的條件期望 \(E[X \mid Y = 22]\) 和條件變異數 \(\text{Var}(X \mid Y = 22)\)
- 解釋 \(\rho = 0.6\) 在品質管理中的意義:若 \(Y\) 偏高,\(X\) 傾向如何變化?
(g) 樣本變異數與卡方分佈大三
定義樣本變異數 \(S_n^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X}_n)^2\)。
- 證明 \(E[S_n^2] = \sigma^2\)(即 \(S_n^2\) 是 \(\sigma^2\) 的無偏估計)
- 若 \(X_i \sim N(\mu, \sigma^2)\),證明 \(\frac{(n-1)S_n^2}{\sigma^2} \sim \chi^2_{n-1}\)
- 利用卡方分佈,建構 \(\sigma^2\) 的 95% 信賴區間(提示:\(\chi^2_{24, 0.025} \approx 39.36\),\(\chi^2_{24, 0.975} \approx 12.40\))