伯努利分佈 (Bernoulli Distribution)¶
定義與性質¶
記號: \(X \sim \text{Ber}(p)\)
| 項目 | 公式/說明 |
|---|---|
| PMF | \(P(X=1) = p, \quad P(X=0) = 1-p\) |
| 期望值 | \(E[X] = p\) |
| 變異數 | \(\text{Var}(X) = p(1-p)\) |
| MGF | \(M_X(t) = 1 - p + pe^t\) |
| 用途 | 單次成功/失敗試驗 |
故事理解:投一枚不公平的硬幣,正面朝上的機率是 \(p=0.6\)。投一次,結果只有兩種:正面(記為1)或反面(記為0)。就這麼簡單——二項分佈的基本單位!
基礎思考題¶
1. 設 \(X \sim \text{Ber}(0.3)\),求 \(E[X^2]\)。大一
解答
\(X\) 只取 0 或 1,所以 \(X^2 = X\)。
2. 設 \(X \sim \text{Ber}(p)\),直接從定義驗證 \(\text{Var}(X) = p(1-p)\)。大一
解答
3. 若 \(X \sim \text{Ber}(p)\),求 \(E[(2X-1)^2]\)。大一
解答
\(2X-1\) 把 \(\{0,1\}\) 映射到 \(\{-1,1\}\),平方後恆為 1。
4. 設 \(X_1, X_2\) 獨立,皆服從 \(\text{Ber}(1/2)\)。求 \(P(X_1 + X_2 = 1)\)。大一
解答
\(X_1 + X_2 = 1\) 表示恰好一次成功:
進階思考題:貝氏 A/B 測試與序貫分析¶
某電商平台目前使用推薦演算法 A,轉換率為 \(p_A = 0.10\)。工程師開發了新演算法 B,但不確定效果如何。根據過去經驗,產品經理的先驗信念為:
- \(P(H_1) = 0.6\):B 是「改良版」,轉換率 \(p_1 = 0.15\)
- \(P(H_0) = 0.4\):B 是「退化版」,轉換率 \(p_0 = 0.05\)
對 \(n\) 位訪客進行獨立測試,觀測到 \(s\) 次成功(購買)、\(f = n - s\) 次失敗。
(a) 推導後驗機率 \(P(H_1 | s, f)\) 的一般公式。定義概似比 \(\Lambda(s,f) = \frac{P(D|H_1)}{P(D|H_0)}\),證明後驗勝率滿足:大三
提示
用貝氏定理:\(P(H_1|D) = \frac{P(D|H_1)P(H_1)}{P(D)}\)。概似比 \(\Lambda = \left(\frac{p_1}{p_0}\right)^s \left(\frac{1-p_1}{1-p_0}\right)^f\),代入 \(p_1=0.15, p_0=0.05\) 計算。
(b) 考慮序貫檢定:每次觀測後根據後驗機率決定「採用 B」(\(P(H_1|D) \geq 0.95\))、「放棄 B」(\(P(H_1|D) \leq 0.10\))或「繼續測試」。將此問題建模為二維隨機漫步 \((S_n, F_n)\),其中 \(S_n, F_n\) 分別為累計成功和失敗次數。求停止區域在 \((s, f)\) 平面上的邊界方程式。大三
提示
從 (a) 的後驗勝率出發,令 \(\frac{P(H_1|s,f)}{P(H_0|s,f)} = 19\)(對應 0.95)和 \(\frac{1}{9}\)(對應 0.10),取對數得到 \(s\) 與 \(f\) 的線性關係。
© 假設 \(H_1\) 為真(即 \(p_B = 0.15\))。令 \(T\) 為首次到達「採用」邊界的觀測次數。利用 Wald 等式或其他方法,推導 \(E[T | H_1]\) 的近似值。(提示:考慮對數概似比的漂移)碩一
提示
設 \(Z_i = \log\frac{P(X_i|H_1)}{P(X_i|H_0)}\),則 \(E[Z_i|H_1] = p_1\log\frac{p_1}{p_0} + (1-p_1)\log\frac{1-p_1}{1-p_0}\)(KL 散度)。Wald 近似:\(E[T] \approx \frac{\text{邊界值}}{\text{平均漂移}}\)。
(d) 在 Wald 的序貫機率比檢定(SPRT)框架下,設計一個檢定使得型一錯誤率 \(\alpha \leq 0.05\)、型二錯誤率 \(\beta \leq 0.10\)。寫出停止規則與決策規則。若前 7 次觀測為 \((1,1,0,1,0,1,1)\),計算累積對數概似比 \(\sum_{i=1}^{7} \log \frac{f(X_i|H_1)}{f(X_i|H_0)}\),並判斷是否已達到停止條件。碩一
提示
SPRT 邊界:下界 \(\log\frac{\beta}{1-\alpha}\),上界 \(\log\frac{1-\beta}{\alpha}\)。代入 \(\alpha=0.05, \beta=0.10\) 求數值。對於觀測序列,\(X=1\) 貢獻 \(\log 3\),\(X=0\) 貢獻 \(\log\frac{17}{19}\)。