跳轉到

幾何分佈 (Geometric Distribution)

記號: \(X \sim \text{Geom}(p)\)

項目 公式/說明
PMF \(P(X = k) = (1-p)^{k-1}p, \quad k = 1, 2, 3, \ldots\)
期望值 \(E[X] = \frac{1}{p}\)
變異數 \(\text{Var}(X) = \frac{1-p}{p^2}\)
MGF \(M_X(t) = \frac{pe^t}{1 - (1-p)e^t}, \quad t < -\ln(1-p)\)
無記憶性 \(P(X > m+n \| X > m) = P(X > n)\)
用途 第一次成功所需試驗次數

故事理解:你在玩抽卡遊戲,每抽一次中SSR的機率是 \(p=0.01\)(1%)。你要抽幾次才會第一次抽到SSR?期望值是100次(\(1/0.01\))。無記憶性表示:即使你已經抽了50次都沒中,接下來還要抽超過100次的機率,跟一開始就要抽超過100次的機率一樣——遊戲不會可憐你!

進階思考題

某手遊推出限定 SSR 角色,每次抽卡獨立,抽中機率為 \(p = 0.02\)(2%)。令 \(X\) 為首次抽中 SSR 所需的抽數,則 \(X \sim \text{Geom}(p)\)

(a) 基礎計算

  1. 寫出 \(P(X = k)\) 的公式,並驗證 \(\sum_{k=1}^{\infty} P(X = k) = 1\)
  2. 計算 \(E[X]\)\(\text{Var}(X)\) 的數值
  3. \(P(X > 100)\),即抽超過 100 次仍未中的機率(提示:\((0.98)^{100} \approx 0.133\)

(b) 無記憶性與條件機率

玩家小明已經抽了 50 次都沒中。

  1. 證明無記憶性:\(P(X > 50 + k \mid X > 50) = P(X > k)\)
  2. 在已知 \(X > 50\) 的條件下,求「再抽 50 次內會中」的機率
  3. 小明說:「我已經抽這麼多次了,接下來一定很快中!」這個想法對嗎?用數學解釋

© 保底機制分析大二

遊戲設有保底機制:若前 79 次都沒中,第 80 次必定中(機率變成 100%)。令 \(Y\) 為有保底時首次抽中的抽數。

  1. 寫出 \(Y\) 的 PMF:\(P(Y = k)\) 對於 \(k = 1, 2, \ldots, 80\)
  2. 計算 \(E[Y]\)(提示:\(\sum_{k=1}^{79} k \cdot (0.98)^{k-1} = \frac{1 - 80 \cdot (0.98)^{79} + 79 \cdot (0.98)^{80}}{(0.02)^2}\)\((0.98)^{79} \approx 0.136\)
  3. 比較有保底和無保底的期望抽數差異

(d) 多人競速抽卡大二

三位玩家 A、B、C 同時開始抽同一個 SSR(各自獨立),抽中機率都是 \(p = 0.02\)。令 \(W = \min(X_A, X_B, X_C)\) 為「第一個人抽中」所需的抽數。

  1. 證明 \(P(W > k) = P(X_A > k) \cdot P(X_B > k) \cdot P(X_C > k) = (1-p)^{3k}\)
  2. 由此證明 \(W \sim \text{Geom}(1 - (1-p)^3)\),並計算 \(W\) 的期望值
  3. \(p' = 1 - (0.98)^3 \approx 0.0588\),驗證 \(E[W] \approx 17\)

(e) 湊齊套卡問題大三

遊戲有 \(r = 5\) 種不同的 SSR,每次抽到每種的機率相等(\(1/5\))。令 \(T\) 為湊齊全部 5 種所需的總抽數。

  1. \(T_i\) 為「已有 \(i-1\) 種後,抽到第 \(i\) 種新卡」所需抽數。證明 \(T_i \sim \text{Geom}(\frac{r-i+1}{r})\)
  2. 利用 \(T = T_1 + T_2 + \cdots + T_r\),證明 \(E[T] = r \cdot H_r\),其中 \(H_r = 1 + \frac{1}{2} + \cdots + \frac{1}{r}\) 是調和級數
  3. 計算 \(E[T]\)\(r = 5\)(提示:\(H_5 = 1 + 0.5 + 0.333 + 0.25 + 0.2 = 2.283\)

(f) 負二項分佈推導大二

\(X_1, X_2, \ldots, X_r\) 獨立同分布,\(X_i \sim \text{Geom}(p)\)。定義 \(Y = \sum_{i=1}^r X_i\) 為獲得 \(r\) 次成功所需的總試驗次數。

  1. 推導 \(Y\) 的 PMF:\(P(Y = k) = \binom{k-1}{r-1} p^r (1-p)^{k-r}\)\(k = r, r+1, \ldots\)
  2. 證明 \(E[Y] = r/p\)\(\text{Var}(Y) = r(1-p)/p^2\)

(g) 條件期望與全期望公式大三

對於 \(X \sim \text{Geom}(p)\)

  1. 證明 \(E[X \mid X > k] = k + \frac{1}{p}\)(利用無記憶性)
  2. 利用全期望公式,從 \(E[X] = P(X=1) \cdot 1 + P(X>1) \cdot E[X \mid X > 1]\) 推導 \(E[X] = 1/p\)
  3. 計算 \(E[X^2]\) 並驗證 \(\text{Var}(X) = \frac{1-p}{p^2}\)

(h) 與指數分佈的關係碩一

考慮連續時間類比:若事件在每個微小時間段 \(\Delta t\) 內發生的機率為 \(\lambda \Delta t + o(\Delta t)\)

  1. 證明當 \(\Delta t \to 0\) 時,\(P(X > k\Delta t) = (1 - \lambda\Delta t)^{k} \to e^{-\lambda t}\)(令 \(t = k\Delta t\)
  2. 說明這表示幾何分佈趨向指數分佈 \(\text{Exp}(\lambda)\)
  3. 解釋為何「離散無記憶性」在極限下變成「連續無記憶性」