2016年8月8日 星期一

泊松分佈(Poisson Distribution)

假設某研究員平均每三年可以發表5篇期刊論文,那麼此研究員三年發表不到5篇的可能性為何?首先,我們列出剛好發表0, 1, 2, 3, 4篇論文的可能性:
  • 0篇:$ P\left ( 0, 5  \right )=\frac{e^{-5} 5^{0}}{0!} \approx  0.006737947 \approx 0.67\% $
  • 1篇:$ P\left ( 1, 5  \right )=\frac{e^{-5} 5^{1}}{1!} \approx  0.03368973 \approx 3.37\% $
  • 2篇:$ P\left ( 2, 5  \right )=\frac{e^{-5} 5^{2}}{2!} \approx  0.08422434 \approx 8.42\% $
  • 3篇:$ P\left ( 3, 5  \right )=\frac{e^{-5} 5^{3}}{3!} \approx 0.1403739 \approx 14.04\% $
  • 4篇:$ P\left ( 4, 5  \right )=\frac{e^{-5} 5^{4}}{4!} \approx 0.1754674 \approx 17.55\% $
也就是說即使有平均三年出5篇的實力,但實際上三年出不到5篇論文的可能性會是 (0.67+3.37+8.42+14.04+17.55) ≈ 44.05%,將近一半的機率達不到唷~

上述計算方式參考Stat Trek上的文章《Poisson Distribution》
泊松分佈(Poisson Distribution)是泊松試驗(Poisson experiment)所得結果的機率分佈。所謂的泊松試驗,包含下面幾個特性:
  1. 試驗的結果只分成“成功”與“失敗”(successes or failures)
  2. 在一個特定的區間(可以是時間、也可以是空間),已知平均成功的數目(average number of successes, λ)
  3. 出現成功的機率正比於區間的大小
  4. 當區間非常小的時候,出現成功的機率是零
$$ P\left ( x, \lambda  \right )=\frac{e^{-\lambda} \lambda^{x}}{x!} $$
上面描述泊松分佈用到的符號的意義分別是:
  • e:一個約莫是 2.718282 的常數,又稱歐拉數
  • λ:特定區間內平均成功的數目
  • x:特定區間內時間成功的數目
  • P(x; λ):給定λ,出現正好x次成功時的分佈

在R語言裡面,可以輸入下面的公式,得到最上面的結果
> p <- function(x, l) {return( exp(-l) * l^x / factorial(x) )}
> p(0,5)
[1] 0.006737947
> p(1,5)
[1] 0.03368973
> p(2,5)
[1] 0.08422434
> p(3,5)
[1] 0.1403739
> p(4,5)
[1] 0.1754674
> p(0,5)+p(1,5)+p(2,5)+p(3,5)+p(4,5)
[1] 0.4404933

> p(5,5)
[1] 0.1754674
> p(7,5)
[1] 0.1044449
> p(10,5)
[1] 0.01813279
> p(10,5)
[1] 0.01813279

_EOF_

沒有留言:

張貼留言