幾何分佈 (Geometric Distribution)¶
記號: \(X \sim \text{Geom}(p)\)
| 項目 | 公式/說明 |
|---|---|
| PMF | \(P(X = k) = (1-p)^{k-1}p, \quad k = 1, 2, 3, \ldots\) |
| 期望值 | \(E[X] = \frac{1}{p}\) |
| 變異數 | \(\text{Var}(X) = \frac{1-p}{p^2}\) |
| MGF | \(M_X(t) = \frac{pe^t}{1 - (1-p)e^t}, \quad t < -\ln(1-p)\) |
| 無記憶性 | \(P(X > m+n \| X > m) = P(X > n)\) |
| 用途 | 第一次成功所需試驗次數 |
故事理解:你在玩抽卡遊戲,每抽一次中SSR的機率是 \(p=0.01\)(1%)。你要抽幾次才會第一次抽到SSR?期望值是100次(\(1/0.01\))。無記憶性表示:即使你已經抽了50次都沒中,接下來還要抽超過100次的機率,跟一開始就要抽超過100次的機率一樣——遊戲不會可憐你!
進階思考題
某手遊推出限定 SSR 角色,每次抽卡獨立,抽中機率為 \(p = 0.02\)(2%)。令 \(X\) 為首次抽中 SSR 所需的抽數,則 \(X \sim \text{Geom}(p)\)。
(a) 基礎計算
- 寫出 \(P(X = k)\) 的公式,並驗證 \(\sum_{k=1}^{\infty} P(X = k) = 1\)
- 計算 \(E[X]\) 和 \(\text{Var}(X)\) 的數值
- 求 \(P(X > 100)\),即抽超過 100 次仍未中的機率(提示:\((0.98)^{100} \approx 0.133\))
(b) 無記憶性與條件機率
玩家小明已經抽了 50 次都沒中。
- 證明無記憶性:\(P(X > 50 + k \mid X > 50) = P(X > k)\)
- 在已知 \(X > 50\) 的條件下,求「再抽 50 次內會中」的機率
- 小明說:「我已經抽這麼多次了,接下來一定很快中!」這個想法對嗎?用數學解釋
© 保底機制分析大二
遊戲設有保底機制:若前 79 次都沒中,第 80 次必定中(機率變成 100%)。令 \(Y\) 為有保底時首次抽中的抽數。
- 寫出 \(Y\) 的 PMF:\(P(Y = k)\) 對於 \(k = 1, 2, \ldots, 80\)
- 計算 \(E[Y]\)(提示:\(\sum_{k=1}^{79} k \cdot (0.98)^{k-1} = \frac{1 - 80 \cdot (0.98)^{79} + 79 \cdot (0.98)^{80}}{(0.02)^2}\),\((0.98)^{79} \approx 0.136\))
- 比較有保底和無保底的期望抽數差異
(d) 多人競速抽卡大二
三位玩家 A、B、C 同時開始抽同一個 SSR(各自獨立),抽中機率都是 \(p = 0.02\)。令 \(W = \min(X_A, X_B, X_C)\) 為「第一個人抽中」所需的抽數。
- 證明 \(P(W > k) = P(X_A > k) \cdot P(X_B > k) \cdot P(X_C > k) = (1-p)^{3k}\)
- 由此證明 \(W \sim \text{Geom}(1 - (1-p)^3)\),並計算 \(W\) 的期望值
- 令 \(p' = 1 - (0.98)^3 \approx 0.0588\),驗證 \(E[W] \approx 17\) 次
(e) 湊齊套卡問題大三
遊戲有 \(r = 5\) 種不同的 SSR,每次抽到每種的機率相等(\(1/5\))。令 \(T\) 為湊齊全部 5 種所需的總抽數。
- 設 \(T_i\) 為「已有 \(i-1\) 種後,抽到第 \(i\) 種新卡」所需抽數。證明 \(T_i \sim \text{Geom}(\frac{r-i+1}{r})\)
- 利用 \(T = T_1 + T_2 + \cdots + T_r\),證明 \(E[T] = r \cdot H_r\),其中 \(H_r = 1 + \frac{1}{2} + \cdots + \frac{1}{r}\) 是調和級數
- 計算 \(E[T]\) 當 \(r = 5\)(提示:\(H_5 = 1 + 0.5 + 0.333 + 0.25 + 0.2 = 2.283\))
(f) 負二項分佈推導大二
令 \(X_1, X_2, \ldots, X_r\) 獨立同分布,\(X_i \sim \text{Geom}(p)\)。定義 \(Y = \sum_{i=1}^r X_i\) 為獲得 \(r\) 次成功所需的總試驗次數。
- 推導 \(Y\) 的 PMF:\(P(Y = k) = \binom{k-1}{r-1} p^r (1-p)^{k-r}\),\(k = r, r+1, \ldots\)
- 證明 \(E[Y] = r/p\) 和 \(\text{Var}(Y) = r(1-p)/p^2\)
(g) 條件期望與全期望公式大三
對於 \(X \sim \text{Geom}(p)\):
- 證明 \(E[X \mid X > k] = k + \frac{1}{p}\)(利用無記憶性)
- 利用全期望公式,從 \(E[X] = P(X=1) \cdot 1 + P(X>1) \cdot E[X \mid X > 1]\) 推導 \(E[X] = 1/p\)
- 計算 \(E[X^2]\) 並驗證 \(\text{Var}(X) = \frac{1-p}{p^2}\)
(h) 與指數分佈的關係碩一
考慮連續時間類比:若事件在每個微小時間段 \(\Delta t\) 內發生的機率為 \(\lambda \Delta t + o(\Delta t)\)。
- 證明當 \(\Delta t \to 0\) 時,\(P(X > k\Delta t) = (1 - \lambda\Delta t)^{k} \to e^{-\lambda t}\)(令 \(t = k\Delta t\))
- 說明這表示幾何分佈趨向指數分佈 \(\text{Exp}(\lambda)\)
- 解釋為何「離散無記憶性」在極限下變成「連續無記憶性」