跳轉到

指數分佈 (Exponential Distribution)

定義與性質

記號: \(X \sim \text{Exp}(\lambda)\)

項目 公式/說明
PDF \(f(x) = \lambda e^{-\lambda x}, \quad x \geq 0\)
期望值 \(E[X] = \frac{1}{\lambda}\)
變異數 \(\text{Var}(X) = \frac{1}{\lambda^2}\)
MGF \(M_X(t) = \frac{\lambda}{\lambda - t}, \quad t < \lambda\)
無記憶性 \(P(X > s+t \| X > s) = P(X > t)\)
用途 等待時間、服務時間、到達間隔

故事理解:你的朋友群組平均每10分鐘會有人發訊息(\(\lambda = 0.1\))。無記憶性的意思是:即使群組已經安靜了5分鐘,接下來還要再等超過10分鐘才有訊息的機率,跟群組剛安靜下來時的機率是一樣的——群組不會因為沉默太久就突然熱鬧起來!這也解釋了為什麼有時候會突然爆量訊息,有時候又會莫名安靜很久。


基礎思考題

1.\(X \sim \text{Exp}(2)\),求 \(P(X > 1)\)大一

解答
\[P(X > 1) = e^{-2 \cdot 1} = e^{-2} \approx 0.135\]

2.\(X \sim \text{Exp}(\lambda)\),驗證無記憶性:\(P(X > s+t \mid X > s) = P(X > t)\)大一

解答
\[P(X > s+t \mid X > s) = \frac{P(X > s+t)}{P(X > s)} = \frac{e^{-\lambda(s+t)}}{e^{-\lambda s}} = e^{-\lambda t} = P(X > t)\]

3. 公車平均每 15 分鐘來一班,你剛到站。求等超過 20 分鐘的機率。大一

解答

\(\lambda = 1/15\)(每分鐘的到達率)

\[P(X > 20) = e^{-20/15} = e^{-4/3} \approx 0.264\]

4. 承上題,你已經等了 10 分鐘還沒來。再等超過 20 分鐘的機率是多少?大一

解答

由無記憶性,答案跟第 3 題一樣:\(e^{-4/3} \approx 0.264\)

等了多久不影響未來——這就是「無記憶」的意思。


進階思考題

考慮一個系統收到事件的過程,令 \(N(t)\) 表示時間區間 \([0,t]\) 內事件數量。假設 \(N(t)\) 滿足:

(i) \(N(0) = 0\)

(ii) 獨立增量性質:不重疊區間的事件數獨立

(iii) 平穩增量性質:\(N(t+h) - N(t)\) 的分佈只依賴於 \(h\)

(iv) \(P(N(h) = 1) = \lambda h + o(h)\)\(P(N(h) \geq 2) = o(h)\)

筆記
  • \(\lambda > 0\):事件發生的 強度(rate),表示單位時間內平均發生的事件數
  • \(o(h)\):當 \(h \to 0\) 時,比 \(h\) 更快趨近於零的量,即 \(\lim_{h \to 0} \frac{o(h)}{h} = 0\)
  • 條件 (iii) 平穩增量:\(N(t+h) - N(t)\) 的分佈只依賴於時間間隔 \(h\),與起始時間 \(t\) 無關。注意這是「分佈相同」,不是「值相等」——實際上 \(N(t+h) - N(t) \sim \text{Pois}(\lambda h)\),期望值為 \(\lambda h\)
  • 條件 (iv) 的兩個部分:
    • \(P(N(h) = 1) = \lambda h + o(h)\):在極短時間 \(h\) 內發生 恰好一個 事件的機率約為 \(\lambda h\),與時間長度成正比。\(\lambda\) 越大,單位時間內發生事件的機率越高
    • \(P(N(h) \geq 2) = o(h)\):在極短時間 \(h\) 內發生 兩個以上 事件的機率比 \(h\) 更快趨近於零。這稱為 普通性(Orderliness)——事件一個一個發生,不會「同時」出現多個事件

\(T\) 為第一個事件到達的等待時間。

(a) 從上述條件推導 \(P(T > t)\)(提示:考慮 \(\{T > t\}\)\(\{N(t) = 0\}\) 的關係,並利用性質推導 \(P(N(t) = 0)\) 滿足的微分方程)。碩一

思考框架:為什麼需要平穩增量?

思考脈絡

初看 \(N(0) = 0\) 會以為這只是說「從 0 開始計數」,但問題在於:題目從沒說過我們可以從任意時間點重新開始。如果沒有 (iii),所有描述都只能「從 0 出發」——這不是技術上麻煩,而是 增量根本沒有被定義

條件的角色

  • (iii) 結構條件:讓時間平移合法,任意時間點都能當新起點
  • (iv) 數值引擎\(\lambda h + o(h)\) 才決定機率長什麼樣

推導骨架

  1. (ii) + (iii) → 時間切片,\(P(N(t+h)=0) = P(N(t)=0) \cdot P(N(h)=0)\)
  2. (iv)\(P(N(h)=0) = 1 - \lambda h + o(h)\)
  3. 組合 → ODE: \(P_0'(t) = -\lambda P_0(t)\)
  4. \(P(T > t) = e^{-\lambda t}\)

一句話:Poisson process 是在聲明「任何時間點都可以重新視為 0,生成規則不變」。

生成觀點:為什麼要「往前踏一步」?

核心問題:條件 (iv) 只給了小 \(h\) 的局部行為,無法直接算出 \(P(N(t)=0)\)

解法:用局部資訊定義「變化率」,再積分回全域解。


關鍵洞察:\(T\) 是事件發生點

\(T\) 到來之前,狀態必然是 \(N=0\)——這是計數過程單調性的事實,不是假設。所以從任意 \(t\) 往前踏微小增量 \(h\),只要 \(t+h < T\),兩個時間點的狀態就必然一致。

這解釋了為什麼可以寫:

\[P(N(t+h)=0) = P(N(t)=0) \cdot P(N(h)=0)\]

不是在「假設狀態不變」,而是在「條件於尚未發生」的事件集合上計算。


為什麼往前踏,不是往回踏?

因為目的是**生成**,不是重建。Generator 只回答一個問題:「在現在這個狀態下,下一瞬間會怎麼變?」

  • 往前踏:定義瞬時變化率(切向量)
  • 往回積:從變化率還原整條軌跡

這就像用兩針畫面求切線,再積分出整個運動軌跡——只是這裡的「畫面」是機率狀態,而平穩增量保證每個時間點都是等價的觀測點。


一句話:微分不是比較過去,而是定義未來。我們不知道 \(p(t)\) 是多少,但知道它「下一瞬間會怎麼變」——這就夠了。

(b) 證明 \(T\) 的 CDF 為 \(F_T(t) = 1 - e^{-\lambda t}\),並推導其 PDF。碩一

生存函數與 CDF 是一體兩面
\[S(t) = P(T > t) = 1 - P(T \leq t) = 1 - F(t)\]

(a) 求的是 \(S(t) = e^{-\lambda t}\),這裡只是翻面:\(F(t) = 1 - S(t) = 1 - e^{-\lambda t}\)

PDF 則是 CDF 的導數:\(f(t) = F'(t) = \lambda e^{-\lambda t}\)

\(c\) 現有 \(n\) 個獨立的系統,各自的事件率為 \(\lambda_1, \lambda_2, \ldots, \lambda_n\)。令 \(T_i\) 為第 \(i\) 個系統的第一個事件時間,\(W = \min(T_1, T_2, \ldots, T_n)\) 為第一個發生事件的時間。證明 \(W \sim \text{Exp}(\sum_{i=1}^n \lambda_i)\)碩一

(d) 承 ©,求事件來自第 \(k\) 個系統的條件機率 \(P(\text{事件來自系統}k \mid W = w)\)碩一

(e)\(T \sim \text{Exp}(\lambda)\),推導條件期望 \(E[T \mid T > a]\)(記憶殘差)。證明 \(E[T \mid T > a] = a + \frac{1}{\lambda}\)碩一


某叫車平台在中午時段記錄乘客叫車後的等待時間。令 \(X\) 為第一輛車到達的時間,\(Y\) 為第二輛車到達的時間(以秒計),兩者的聯合 PDF 為:

\[f_{X,Y}(x,y) = \lambda^2 e^{-\lambda y}, \quad 0 \leq x < y\]

其中 \(\lambda > 0\) 為車輛到達率(calls/second)。

(a) 邊際分布與期望值

  1. \(X\) 的邊際 PDF \(f_X(x)\)(提示:對 \(y\)\(x\)\(\infty\) 積分)
  2. \(Y\) 的邊際 PDF \(f_Y(y)\)(提示:對 \(x\)\(0\)\(y\) 積分)
  3. 分別計算 \(E[X]\)\(E[Y]\),解釋為何 \(E[Y] = 2E[X]\)

(b) 到達時間差

\(W = Y - X\) 為第一輛車到達後,等待第二輛車的額外時間。

  1. 推導 \(W\) 的 PDF(提示:使用變數變換或卷積)
  2. 證明 \(W \sim \text{Exp}(\lambda)\),說明這個結果的直觀意義
  3. 這個結果與指數分布的「無記憶性」有什麼關係?

© 條件分布大二

  1. 已知第二輛車在 \(y\) 秒到達,求第一輛車到達時間 \(X\) 的條件 PDF \(f_{X|Y}(x|y)\)
  2. 計算 \(E[X \mid Y = y]\),解釋為何「給定 \(Y=y\)\(X\) 的期望值是 \(y/2\)
  3. 已知第一輛車在 \(x\) 秒到達,求第二輛車到達時間 \(Y\) 的條件分布

(d) 多平台競爭大二

乘客同時在兩個叫車平台叫車。平台 A 的車輛到達時間 \(T_A \sim \text{Exp}(\lambda_1)\),平台 B 的車輛到達時間 \(T_B \sim \text{Exp}(\lambda_2)\),兩者獨立。

  1. \(T = \min(T_A, T_B)\) 為「第一輛車到達」的時間,證明 \(T \sim \text{Exp}(\lambda_1 + \lambda_2)\)
  2. 求「第一輛車來自平台 A」的機率 \(P(T_A < T_B)\)
  3. \(\lambda_1 = 0.1\)(平台 A 平均 10 秒來車),\(\lambda_2 = 0.05\)(平台 B 平均 20 秒來車),計算 \(E[T]\)\(P(T_A < T_B)\)

(e) 電話費計算(110 年台大考題)大三

你打了 \(N\) 通電話,第 \(i\) 通電話的通話時間 \(T_i \sim \text{Exp}(\lambda)\)(單位:分鐘),各通電話獨立。電信公司按「不足一分鐘以一分鐘計」收費,即第 \(i\) 通電話的計費時間為 \(W_i = \lceil T_i \rceil\)

  1. \(T_1\) 的 PDF
  2. 推導 \(W_1\) 的 PMF:\(P(W_1 = k) = ?\)(提示:\(W_1 = k\) 當且僅當 \(k-1 < T_1 \leq k\)
  3. 證明 \(W_1\) 服從幾何分布,並求其參數
  4. \(N \sim \text{Pois}(\mu)\),令 \(L = \sum_{i=1}^N W_i\) 為總計費時間。推導 \(L\) 的 PMF(提示:這是複合 Poisson 分布)

(f) 無記憶性的唯一性大三

\(X\) 是一個連續型隨機變數,\(X \geq 0\),且滿足無記憶性:

\[P(X > s + t \mid X > s) = P(X > t), \quad \forall s, t \geq 0\]
  1. \(g(t) = P(X > t)\),證明 \(g(s+t) = g(s) \cdot g(t)\)
  2. 假設 \(g\) 連續,證明 \(g(t) = e^{-\lambda t}\)(某個 \(\lambda > 0\)
  3. 說明指數分布是「唯一具有無記憶性的連續分布」