跳轉到

伯努利分佈 (Bernoulli Distribution)

定義與性質

記號: \(X \sim \text{Ber}(p)\)

項目 公式/說明
PMF \(P(X=1) = p, \quad P(X=0) = 1-p\)
期望值 \(E[X] = p\)
變異數 \(\text{Var}(X) = p(1-p)\)
MGF \(M_X(t) = 1 - p + pe^t\)
用途 單次成功/失敗試驗

故事理解:投一枚不公平的硬幣,正面朝上的機率是 \(p=0.6\)。投一次,結果只有兩種:正面(記為1)或反面(記為0)。就這麼簡單——二項分佈的基本單位!


基礎思考題

1.\(X \sim \text{Ber}(0.3)\),求 \(E[X^2]\)大一

解答

\(X\) 只取 0 或 1,所以 \(X^2 = X\)

\[E[X^2] = E[X] = p = 0.3\]

2.\(X \sim \text{Ber}(p)\),直接從定義驗證 \(\text{Var}(X) = p(1-p)\)大一

解答
\[\text{Var}(X) = E[X^2] - (E[X])^2 = p - p^2 = p(1-p)\]

3.\(X \sim \text{Ber}(p)\),求 \(E[(2X-1)^2]\)大一

解答

\(2X-1\)\(\{0,1\}\) 映射到 \(\{-1,1\}\),平方後恆為 1。

\[E[(2X-1)^2] = 1\]

4.\(X_1, X_2\) 獨立,皆服從 \(\text{Ber}(1/2)\)。求 \(P(X_1 + X_2 = 1)\)大一

解答

\(X_1 + X_2 = 1\) 表示恰好一次成功:

\[P(X_1=1, X_2=0) + P(X_1=0, X_2=1) = \frac{1}{2} \cdot \frac{1}{2} + \frac{1}{2} \cdot \frac{1}{2} = \frac{1}{2}\]

進階思考題:貝氏 A/B 測試與序貫分析

某電商平台目前使用推薦演算法 A,轉換率為 \(p_A = 0.10\)。工程師開發了新演算法 B,但不確定效果如何。根據過去經驗,產品經理的先驗信念為:

  • \(P(H_1) = 0.6\):B 是「改良版」,轉換率 \(p_1 = 0.15\)
  • \(P(H_0) = 0.4\):B 是「退化版」,轉換率 \(p_0 = 0.05\)

\(n\) 位訪客進行獨立測試,觀測到 \(s\) 次成功(購買)、\(f = n - s\) 次失敗。

(a) 推導後驗機率 \(P(H_1 | s, f)\) 的一般公式。定義概似比 \(\Lambda(s,f) = \frac{P(D|H_1)}{P(D|H_0)}\),證明後驗勝率滿足:大三

\[\frac{P(H_1|s,f)}{P(H_0|s,f)} = \Lambda(s,f) \cdot \frac{P(H_1)}{P(H_0)} = 3^s \cdot 3^{-f} \cdot \frac{3}{2}\]
提示

用貝氏定理:\(P(H_1|D) = \frac{P(D|H_1)P(H_1)}{P(D)}\)。概似比 \(\Lambda = \left(\frac{p_1}{p_0}\right)^s \left(\frac{1-p_1}{1-p_0}\right)^f\),代入 \(p_1=0.15, p_0=0.05\) 計算。

(b) 考慮序貫檢定:每次觀測後根據後驗機率決定「採用 B」(\(P(H_1|D) \geq 0.95\))、「放棄 B」(\(P(H_1|D) \leq 0.10\))或「繼續測試」。將此問題建模為二維隨機漫步 \((S_n, F_n)\),其中 \(S_n, F_n\) 分別為累計成功和失敗次數。求停止區域在 \((s, f)\) 平面上的邊界方程式。大三

提示

從 (a) 的後驗勝率出發,令 \(\frac{P(H_1|s,f)}{P(H_0|s,f)} = 19\)(對應 0.95)和 \(\frac{1}{9}\)(對應 0.10),取對數得到 \(s\)\(f\) 的線性關係。

© 假設 \(H_1\) 為真(即 \(p_B = 0.15\))。令 \(T\) 為首次到達「採用」邊界的觀測次數。利用 Wald 等式或其他方法,推導 \(E[T | H_1]\) 的近似值。(提示:考慮對數概似比的漂移)碩一

提示

\(Z_i = \log\frac{P(X_i|H_1)}{P(X_i|H_0)}\),則 \(E[Z_i|H_1] = p_1\log\frac{p_1}{p_0} + (1-p_1)\log\frac{1-p_1}{1-p_0}\)(KL 散度)。Wald 近似:\(E[T] \approx \frac{\text{邊界值}}{\text{平均漂移}}\)

(d) 在 Wald 的序貫機率比檢定(SPRT)框架下,設計一個檢定使得型一錯誤率 \(\alpha \leq 0.05\)、型二錯誤率 \(\beta \leq 0.10\)。寫出停止規則與決策規則。若前 7 次觀測為 \((1,1,0,1,0,1,1)\),計算累積對數概似比 \(\sum_{i=1}^{7} \log \frac{f(X_i|H_1)}{f(X_i|H_0)}\),並判斷是否已達到停止條件。碩一

提示

SPRT 邊界:下界 \(\log\frac{\beta}{1-\alpha}\),上界 \(\log\frac{1-\beta}{\alpha}\)。代入 \(\alpha=0.05, \beta=0.10\) 求數值。對於觀測序列,\(X=1\) 貢獻 \(\log 3\)\(X=0\) 貢獻 \(\log\frac{17}{19}\)