指數分佈 (Exponential Distribution)¶
定義與性質¶
記號: \(X \sim \text{Exp}(\lambda)\)
| 項目 | 公式/說明 |
|---|---|
| \(f(x) = \lambda e^{-\lambda x}, \quad x \geq 0\) | |
| 期望值 | \(E[X] = \frac{1}{\lambda}\) |
| 變異數 | \(\text{Var}(X) = \frac{1}{\lambda^2}\) |
| MGF | \(M_X(t) = \frac{\lambda}{\lambda - t}, \quad t < \lambda\) |
| 無記憶性 | \(P(X > s+t \| X > s) = P(X > t)\) |
| 用途 | 等待時間、服務時間、到達間隔 |
故事理解:你的朋友群組平均每10分鐘會有人發訊息(\(\lambda = 0.1\))。無記憶性的意思是:即使群組已經安靜了5分鐘,接下來還要再等超過10分鐘才有訊息的機率,跟群組剛安靜下來時的機率是一樣的——群組不會因為沉默太久就突然熱鬧起來!這也解釋了為什麼有時候會突然爆量訊息,有時候又會莫名安靜很久。
基礎思考題¶
1. 設 \(X \sim \text{Exp}(2)\),求 \(P(X > 1)\)。大一
解答
2. 設 \(X \sim \text{Exp}(\lambda)\),驗證無記憶性:\(P(X > s+t \mid X > s) = P(X > t)\)。大一
解答
3. 公車平均每 15 分鐘來一班,你剛到站。求等超過 20 分鐘的機率。大一
解答
\(\lambda = 1/15\)(每分鐘的到達率)
4. 承上題,你已經等了 10 分鐘還沒來。再等超過 20 分鐘的機率是多少?大一
解答
由無記憶性,答案跟第 3 題一樣:\(e^{-4/3} \approx 0.264\)
等了多久不影響未來——這就是「無記憶」的意思。
進階思考題¶
考慮一個系統收到事件的過程,令 \(N(t)\) 表示時間區間 \([0,t]\) 內事件數量。假設 \(N(t)\) 滿足:
(i) \(N(0) = 0\)
(ii) 獨立增量性質:不重疊區間的事件數獨立
(iii) 平穩增量性質:\(N(t+h) - N(t)\) 的分佈只依賴於 \(h\)
(iv) \(P(N(h) = 1) = \lambda h + o(h)\),\(P(N(h) \geq 2) = o(h)\)
筆記
- \(\lambda > 0\):事件發生的 強度(rate),表示單位時間內平均發生的事件數
- \(o(h)\):當 \(h \to 0\) 時,比 \(h\) 更快趨近於零的量,即 \(\lim_{h \to 0} \frac{o(h)}{h} = 0\)
- 條件 (iii) 平穩增量:\(N(t+h) - N(t)\) 的分佈只依賴於時間間隔 \(h\),與起始時間 \(t\) 無關。注意這是「分佈相同」,不是「值相等」——實際上 \(N(t+h) - N(t) \sim \text{Pois}(\lambda h)\),期望值為 \(\lambda h\)
- 條件 (iv) 的兩個部分:
- \(P(N(h) = 1) = \lambda h + o(h)\):在極短時間 \(h\) 內發生 恰好一個 事件的機率約為 \(\lambda h\),與時間長度成正比。\(\lambda\) 越大,單位時間內發生事件的機率越高
- \(P(N(h) \geq 2) = o(h)\):在極短時間 \(h\) 內發生 兩個以上 事件的機率比 \(h\) 更快趨近於零。這稱為 普通性(Orderliness)——事件一個一個發生,不會「同時」出現多個事件
令 \(T\) 為第一個事件到達的等待時間。
(a) 從上述條件推導 \(P(T > t)\)(提示:考慮 \(\{T > t\}\) 與 \(\{N(t) = 0\}\) 的關係,並利用性質推導 \(P(N(t) = 0)\) 滿足的微分方程)。碩一
思考框架:為什麼需要平穩增量?
思考脈絡:
初看 \(N(0) = 0\) 會以為這只是說「從 0 開始計數」,但問題在於:題目從沒說過我們可以從任意時間點重新開始。如果沒有 (iii),所有描述都只能「從 0 出發」——這不是技術上麻煩,而是 增量根本沒有被定義。
條件的角色:
- (iii) 結構條件:讓時間平移合法,任意時間點都能當新起點
- (iv) 數值引擎:\(\lambda h + o(h)\) 才決定機率長什麼樣
推導骨架:
- (ii) + (iii) → 時間切片,\(P(N(t+h)=0) = P(N(t)=0) \cdot P(N(h)=0)\)
- (iv) → \(P(N(h)=0) = 1 - \lambda h + o(h)\)
- 組合 → ODE: \(P_0'(t) = -\lambda P_0(t)\)
- 解 → \(P(T > t) = e^{-\lambda t}\)
一句話:Poisson process 是在聲明「任何時間點都可以重新視為 0,生成規則不變」。
生成觀點:為什麼要「往前踏一步」?
核心問題:條件 (iv) 只給了小 \(h\) 的局部行為,無法直接算出 \(P(N(t)=0)\)。
解法:用局部資訊定義「變化率」,再積分回全域解。
關鍵洞察:\(T\) 是事件發生點
在 \(T\) 到來之前,狀態必然是 \(N=0\)——這是計數過程單調性的事實,不是假設。所以從任意 \(t\) 往前踏微小增量 \(h\),只要 \(t+h < T\),兩個時間點的狀態就必然一致。
這解釋了為什麼可以寫:
不是在「假設狀態不變」,而是在「條件於尚未發生」的事件集合上計算。
為什麼往前踏,不是往回踏?
因為目的是**生成**,不是重建。Generator 只回答一個問題:「在現在這個狀態下,下一瞬間會怎麼變?」
- 往前踏:定義瞬時變化率(切向量)
- 往回積:從變化率還原整條軌跡
這就像用兩針畫面求切線,再積分出整個運動軌跡——只是這裡的「畫面」是機率狀態,而平穩增量保證每個時間點都是等價的觀測點。
一句話:微分不是比較過去,而是定義未來。我們不知道 \(p(t)\) 是多少,但知道它「下一瞬間會怎麼變」——這就夠了。
(b) 證明 \(T\) 的 CDF 為 \(F_T(t) = 1 - e^{-\lambda t}\),並推導其 PDF。碩一
生存函數與 CDF 是一體兩面
(a) 求的是 \(S(t) = e^{-\lambda t}\),這裡只是翻面:\(F(t) = 1 - S(t) = 1 - e^{-\lambda t}\)。
PDF 則是 CDF 的導數:\(f(t) = F'(t) = \lambda e^{-\lambda t}\)。
\(c\) 現有 \(n\) 個獨立的系統,各自的事件率為 \(\lambda_1, \lambda_2, \ldots, \lambda_n\)。令 \(T_i\) 為第 \(i\) 個系統的第一個事件時間,\(W = \min(T_1, T_2, \ldots, T_n)\) 為第一個發生事件的時間。證明 \(W \sim \text{Exp}(\sum_{i=1}^n \lambda_i)\)。碩一
(d) 承 ©,求事件來自第 \(k\) 個系統的條件機率 \(P(\text{事件來自系統}k \mid W = w)\)。碩一
(e) 若 \(T \sim \text{Exp}(\lambda)\),推導條件期望 \(E[T \mid T > a]\)(記憶殘差)。證明 \(E[T \mid T > a] = a + \frac{1}{\lambda}\)。碩一
某叫車平台在中午時段記錄乘客叫車後的等待時間。令 \(X\) 為第一輛車到達的時間,\(Y\) 為第二輛車到達的時間(以秒計),兩者的聯合 PDF 為:
其中 \(\lambda > 0\) 為車輛到達率(calls/second)。
(a) 邊際分布與期望值
- 求 \(X\) 的邊際 PDF \(f_X(x)\)(提示:對 \(y\) 從 \(x\) 到 \(\infty\) 積分)
- 求 \(Y\) 的邊際 PDF \(f_Y(y)\)(提示:對 \(x\) 從 \(0\) 到 \(y\) 積分)
- 分別計算 \(E[X]\) 和 \(E[Y]\),解釋為何 \(E[Y] = 2E[X]\)
(b) 到達時間差
令 \(W = Y - X\) 為第一輛車到達後,等待第二輛車的額外時間。
- 推導 \(W\) 的 PDF(提示:使用變數變換或卷積)
- 證明 \(W \sim \text{Exp}(\lambda)\),說明這個結果的直觀意義
- 這個結果與指數分布的「無記憶性」有什麼關係?
© 條件分布大二
- 已知第二輛車在 \(y\) 秒到達,求第一輛車到達時間 \(X\) 的條件 PDF \(f_{X|Y}(x|y)\)
- 計算 \(E[X \mid Y = y]\),解釋為何「給定 \(Y=y\),\(X\) 的期望值是 \(y/2\)」
- 已知第一輛車在 \(x\) 秒到達,求第二輛車到達時間 \(Y\) 的條件分布
(d) 多平台競爭大二
乘客同時在兩個叫車平台叫車。平台 A 的車輛到達時間 \(T_A \sim \text{Exp}(\lambda_1)\),平台 B 的車輛到達時間 \(T_B \sim \text{Exp}(\lambda_2)\),兩者獨立。
- 令 \(T = \min(T_A, T_B)\) 為「第一輛車到達」的時間,證明 \(T \sim \text{Exp}(\lambda_1 + \lambda_2)\)
- 求「第一輛車來自平台 A」的機率 \(P(T_A < T_B)\)
- 若 \(\lambda_1 = 0.1\)(平台 A 平均 10 秒來車),\(\lambda_2 = 0.05\)(平台 B 平均 20 秒來車),計算 \(E[T]\) 和 \(P(T_A < T_B)\)
(e) 電話費計算(110 年台大考題)大三
你打了 \(N\) 通電話,第 \(i\) 通電話的通話時間 \(T_i \sim \text{Exp}(\lambda)\)(單位:分鐘),各通電話獨立。電信公司按「不足一分鐘以一分鐘計」收費,即第 \(i\) 通電話的計費時間為 \(W_i = \lceil T_i \rceil\)。
- 求 \(T_1\) 的 PDF
- 推導 \(W_1\) 的 PMF:\(P(W_1 = k) = ?\)(提示:\(W_1 = k\) 當且僅當 \(k-1 < T_1 \leq k\))
- 證明 \(W_1\) 服從幾何分布,並求其參數
- 若 \(N \sim \text{Pois}(\mu)\),令 \(L = \sum_{i=1}^N W_i\) 為總計費時間。推導 \(L\) 的 PMF(提示:這是複合 Poisson 分布)
(f) 無記憶性的唯一性大三
設 \(X\) 是一個連續型隨機變數,\(X \geq 0\),且滿足無記憶性:
- 令 \(g(t) = P(X > t)\),證明 \(g(s+t) = g(s) \cdot g(t)\)
- 假設 \(g\) 連續,證明 \(g(t) = e^{-\lambda t}\)(某個 \(\lambda > 0\))
- 說明指數分布是「唯一具有無記憶性的連續分布」