Poisson Dağılımı

  • Konuyu açan Konuyu açan BeReNN
  • Açılış tarihi Açılış tarihi

BeReNN

Alyam?
Özel üye
Poisson dağılımı, (okunuşu: puason dağılımı) olasılık kuramı ve istatistik bilim kollarında bir ayrık olasılık dağılımı olup belli bir sabit zaman birim aralığında meydana gelme sayısının olasığını ifade eder. Bu zaman aralığında ortalama olay meydana gelme sayısının bilindiği ve herhangi bir olayla onu hemen takip eden olay arasındaki zaman farkının, önceki zaman farklarından bağımsız oluştuğu kabul edilir.

Poisson dağılımı çok kere belirli sabit zaman aralığı birimleri bulunan problemlere uygulanmakla beraber, diğer birimsel aralıklı problemlere de (yani birim uzaklık, alan veya hacim içeren problemlere de) başarı ile uygulanabilir.

800px-Poisson_distribution_PMF.png

  • Yatay eksen indeks k . Fonksiyon yalnızca k'nın tamsayı değerleri için geçerlidir. Noktaları bağlayan çizgiler süreklilik göstermez; kullanıcıya yardımcı olmak üzere çizilmişlerdir.
800px-PoissonCDF.png

  • Yığmalı dağılım fonksiyonu
Örnekler

Poisson dağılımı Poisson süreci ile birlikte ortaya çıkar. Poisson süreci aralıklı karakterde olan (yani 0, 1, 2, 3 .. kere meydana çıkan) bazı olgularin bir birim zaman, alan, mekân veya hacimde sabit bir olasılıkla oluşması şekilini alır. Bu çeşit olaylara ve Poisson dağılımının uygulanmasına örnekler şunlardır:

Prusya süvari birliklerinde her bir yıl at ve katır tepmeleri ile ölen asker sayısı: Bu klasik örnek 1868'de Ladislaus Josephovich Bortkiewicz tarafından bir kitapta yayınlanmış ve çok tanınmış bir örnek olarak yıllarca askeri ve sivil yüksek okul öğrencilerine verilmiştir.
Bir saat aralığında belli bir Internet sitesine gelen bağlantılar sayısı;
Yarım saat içinde bir nakliyat deposuna yükleme-boşatılma için gelen kamyon sayısı;
Her bir beş dakika içinde bir telefon cevap merkezine gelen telefonlar sayısı;
Belli bir trafik kavşağından 1 dakika içinde geçen otomobil sayısı;
Belli bir zaman aralığında bir büyük binada yanıp çalışması duran florasan lambalarının sayısı;
Bir mucit kişinin çalışma hayatı boyunca patentini aldığı keşifler sayısı;

[Not: Birbirini takip eden Poisson tipi olaylar arasındaki aralık karşılıklı ilişkili olarak bir üstel dağılım olur. Örneğin, bir florans ampülünun çalışma süresi veya otobüslerin gelmesi arasındaki bekleme zamanı.]

Tarihçe

Bu dağılım ilk defa Siméon-Denis Poisson (1781–1840) tarafından diğer olasılık hakkındaki yazıları ile birlikte 1838'de yayınlanan Recherches sur la probabilité des jugements en matières criminelles et matière civile ("Ceza hukuku ve medeni hukuk alanlarındaki hükümlerin olasılığı üzerinde araştırmalar") adındaki eserinde ortaya atılmıştır.

Nadir olaylar için Poisson dağılımı

Poisson dağılımının genel odaklandığı rassal değişken bir sayılabilen olaydır; bu olay belli bir sabit uzunlukta olan (genellikle zaman) aralıkta ayrık olarak ortaya çıkar ve bu aralıkta gözlenen olayların sayısı Poisson dağılım için rassal değişkendir. Bu sabit aralıkta ortaya çıkan olaylar sayısının beklenen değeri (ortaya çıkmanın ortalama sayısı) λ olarak sabittir ve bu ortalama değer aralık uzunluğuna orantılıdır. Eğer her 4 dakikalık zaman aralığı içinde ortalama 5 olay meydana geliyorsa, sabit 8 dakikalık aralıkta ortalama 10 (=8x5/4) olay ortaya çıkar. Herhangi bir negatif olmayan bir tamsayı olan k sayıda (k = 0, 1, 2, 3...) olay ortaya çıkma olasılığı şöyle ifade edilir:

5ea551b82ae0b82182bd2e1b9ffdc807.png


burada

e, doğal logaritmanın tabanı (e = 2.71828...);
k, olasılığı fonksiyon ile verilmekte olan olayın ortaya çıkma sayısı;
k!, k için faktoriyel
λ verilen sabit aralıkta ortaya çıkma sayısının beklenen değeri; bir pozitif gerçel sayı.

Bu k'nin fonksiyonu Poisson dağılım için olasılık kütle fonksiyonu olur.

Poisson dağılımı için λ parametresi yalnızca beklenen değer, yani ortaya çıkan \scriptstyle\langle k \rangle sayıda olay için bir ortalama, değildir. Aynı zamanda

5c28c8afc9438ca2502bddb271c0025d.png


yani varyans da olur. Böylece gözlenen olay meydan çıkış sayısı bir ortalama değer λ ile bir standart sapması \scriptstyle\sigma_{k}\, =\, \sqrt{\lambda} olması niteliklerini taşiyan bir olasılık dağılımı, Poisson dağılımı, göstermektedir.

Genellikle bir Poisson dağılımı büyük sayıda olay ortaya çıkabilmesi mümkün olduğu, ama bu ortaya çıkması mümkün olayların nadir olduğu kabul edilen, sistemlerde uygulanabilir. Bilimsel alanlarda klasik örnekler atomların nükleer parçalanması; verilen bir DNA zincirinde ortaya çıkan mutasyon sayısı vb. Bu örneklerle ve diğer birçok örneğin için, ortaya çıkan nadir olay sayısı ayrık denemelerin sonucudur ve daha kesinlikle bir binom dağılım kullanılarak model haline getirebilinirler. Fakat n ve λ/n parametreli bir binom dağılımı (yani her deneme için λ/n başarı olasılığı olan n sayıda deneme için belirli bir başarı sayısı için olasılık dağılımı), deneme sayısı n büyüyüp limitte sonsuzluğa yaklaştıkça, beklenen değeri λ olan bir Poisson dağılıma yakınsalaşır. Bu limit bazan nadir olaylar kuralı olarak anılmaktadır. Bu ifade bir bakıma yanıltıcıdır; çünkü birçok Poisson dağılımı ile modellenebilen olaylar arasında birçoğu (örneğin bir otobüs durağına yarım saat aralığında gelen otobüs sayısı; bir mobil telefona bir saat aralığında gelen çağrı sayısı gibi) hiç de nadir olmayan olaylar bulunur. Ancak binom dağılımının büyük sayılar için hesaplanması faktöriyel sayılar kullanılmasi gerektirdiği için, bu uzun hesaplama biraz sıkıcı görülebilmekte ve bu nedenle Poisson dağılımı yaklaşık olarak binom dağılım yerine kullanılmaktadır.

Binom dağılımından limitte Poisson dağılım olasılık kütle fonksiyonunun çıkartılmasınin matemetiksel kanıtı şöyle yapılır:

 

Önce, değişkenler hesabı (calculus) içinde kullanılan limitin şöyle ifade edildiğı hatırlanır:

e9dd740c04b6afc43eeaf0cef6f362f0.png


p = λ/n eşitliği bu ifade içine konulursa, şu genel denkleme varılır:

f1e768243d0908ce55b8f3682814ec24.png


Şimdi bu son ifade biraz daha açılır ve şu elde edilir:

26aad4c4d79faa4856c5c8c2579c79c0.png


Limitte, ilk parantez içindeki ifade 1 e yakınsama gösterir (yani n ∞'a yaklaştıkça, ilk parantezdeki ifade 1'e yakınsar ) ve ikinci parantez içindeki ifade, ifade içinde n olmaması nedeniyle, sabit kalır; üçüncü parantez içindeki ifade e−λ değerine yakınsar ve son olarak da dördüncü parantezdeki ifade, 1 e yakınsar. Sonuçta, limitte şu ortaya çıkar:

6bb095dcb3a4566fe073d578884c2ab5.png


Daha genel olarak, n ve pn parametreleri olan binom rassal değişkenler için bir sıra Binom ifadesi

3646041d6608f0a48a84745064006098.png


olursa, bu seri dağılımda ortalaması λ olan bir Poisson rassal değişkeni için serilere yakınlaşır

Özellikler

Poisson dağılımı gösteren rassal bir değişken için beklenen değer ve varyans değeri de λdır. Poisson dağılımının yüksek momentleri λ terimleri ile oluşan (matematiksel kombinatorik kuramında anlamlı olan katsayıları bulunan) Touchard polinomlarıdır. Eğer Poisson dağılımı için beklenen değer 1 ise, o zaman Dobinski'nin formülüne göre ninci moment n büyüklüğünde olan set bölünümlerinin sayısına eşittir.

Tam sayılı olmayan bir λ lambda parametreli Poisson dağılımı gösteren bir rassal değişkenin mod değeri, λ 'dan küçük olan en büyük pozitif tamsayıya, yani \scriptstyle\lfloor \lambda \rfloor 'ya, eşittir.

Poisson dağılımı gösteren rassal değişkenlerin toplamı:

Eğer
db8e6e1d3333d790e757d8c66a2c8a85.png
ifadesi λi parametresi ile Poisson dağılımı gösteriyor ve Xi terimleri bağımsız iseler, o halde
6d9ec98f4174e74e11e5c9c279c7bd97.png
ifadesi de parametresi toplama katılan parametre toplamlarından olan bir Poisson dağılımı gösterir.
  • Beklenen değeri λ olan Poisson dağılımınin moment üreten fonksiyonu şu ifade ile verilir:
e7ef3fe15ee5d0a5f07cfff946854637.png

  • Poisson dağılımı için tüm kümülantlar beklenen değer olan λya eşittirler. Poisson dağılımı için ninci faktöriyel moment λn olur
  • Poisson dağılımlari sonsuz olarak bölünebilir olasılık dağılımlarıdır.
  • Poi(λ0) ile Poi(λ) arasındaki yönlendirilmiş Kullback-Leibler ayrılımı şöyle ifade edilir;
c349584b2069405f7e25544587c6b131.png


Poisson dağılımı ile üretilen rassal değişkenlerin simulasyonu

Poisson dağılımlı rassal sayıları üretmek için en basit yollardan birisi Knuth tarafından aşağıdaki gibi bir bilgisayar algoritmasıyla verilmiştir

algoritma poisson rassal sayı üretimi (Knuth):
init:
Let L ← e−λ, k ← 0 and p ← 1.
do:
k ← k + 1.
[0,1] aralığı içinde birörnek dağılımlı rassal sayı u üret ve let p ← p × u.
while p ≥ L.
return k − 1.

Basit olmakla beraber, karmaşıklık λ ile doğrusal olarak oranlıdır. Bu sorun etkisini azaltmak için çeşitli diğer algoritmalar geliştirilmiştir.

 

İlişkili dağılımlar
  • Eğer
    989a8742f6c56e380fcc897afcf7f948.png
    ve
    bc41e68bf5f368ab6188032f5db7d3d4.png
    ise, o halde Y = X1 − X2 farkı bir Skellam dağılımı gösterir.
  • Eğer
    989a8742f6c56e380fcc897afcf7f948.png
    ve
    bc41e68bf5f368ab6188032f5db7d3d4.png


    bağımsızlarsa ve Y = X1 + X2 ise, o zaman Y = yya koşullu X1 dağılımı, bir binom dağılımı olur. Özellikle,

    e9bd9e1b9567035b538b83271b1aada0.png


    olur. Daha genel olarak, eğer X1, X2,...,Xn rassal değişkenleri, parametreleri

    λ1, λ2,..., λn olan Poisson dağılımı gösteriyorlarsa, o zaman
    eca5425852c7b4c52b31489ce787012f.png
    .
  • Eğer denemeler sayısı limitte sonsuza doğru yaklaşır ve başarı sayısının beklenen değeri sabit kalırsa, bu binom dağılım limitte Poisson dağılıma yaklaşacağı isbat edilmiştir. Bu nedenle Poisson dağılım, eğer nyeterce büyük ve p yeterce küçük ise, bir binom dağılım yerine yaklaşım olarak kullanılabilir. Alışılagelen bir kurala göre, eğer n en aşağı 20 ise ve p 0,05e eşit veya daha küçük ise, Poisson dağılımı binom dağılımının iyi bir yaklaşımı olacaktır. Bu kurala göre eğer n ≥ 100 ve np ≤ 10 ise, bu yaklaşım mükemmel olur.
  • Yeter derecede yüksek λ değeri (diyelim λ>1000) için, ortalaması λ ve varyansı λ olan bir normal dağılım, Poisson dağılım için çok iyi bir yaklaşım olur. Eğer λ 10dan biraz büyük ise, bu halde normal dağılım ancak uygun bir süreklilik doğrulaması kullanılırsa uygun bir yaklaşım olabilir. Başka bir deyim ile, eğer P(Xx) ifadeleri P(Xx + 0.5) ile değiştirilirse
2dd1023a0a666aeb0b8eb8bbc9d4b92a.png
olur.
  • Eğer bir sabit zaman aralığı içinde bir hizmet alanına gelenler sayısı, ortalaması λ olan bir Poisson dağılımına uygun ise, o halde gelişler-arası zaman aralıkları, oran parametresi 1 / λ olan, bir üstel dağılım gösterir.
Parametre tahmini

Maksimum olabilirlik


ki için n tane ölçülmüş değer kapsayan bir örneklem alınsın. Bu örneklemin kökenindeki Poisson dağılım gösteren anakütle için Poisson parametresi olan λ için bir uygun bir kestirim değeri bulunması hesaplama hedefidir.

Bu kestirimi maksimum değişebilirlik yöntemi ile bulmak için önce bir log-değişebilirlilik fonksiyonu şöyle biçimlendirilir:

f53cbb1e4d19dcc36229fbde0d8eed9b.png
b0aab9c801bb6f17f1af97d3a65f4d4b.png
da6ef6c0a81e9928fc5d1c2a25851c29.png
λ ile Lfonksiyonunun türevi alınıp bu türev sıfıra eşitlenirse

5b97aea8ce4161c0f6064fac5a608a8b.png


ifadesi ortaya çıkar. λ için çözüm yapılırsa λ için maksimum-olabilirlilik kestirimini(MOK) şöyle buluruz:

301287a5f0fcee40bfc073b19abb2a04.png


Her gözlem için ortalama λ olduğu için bu ifadenin beklenen değeri de λ olur. Bu nedenle bu kestirim λ için bir yansiz kestirim olur. Bunun kestirim varyans değeri Cramer-Rao alt sınırına ulaşıp geçtigi için, bu kestirim bir etkin kestirim de olur.

 

Bayes tipi çıkarımsal analiz

Bayes tipi çıkarımsal analiz için Poisson dağılımının oran parametresi olan λ için eşlenik öncel bir gamma dağılımı gösterir. Şu ifadeye göre

382ee51dad3cd7f5a1e6431fa8bc41ae.png


λnin bir Gamma olasılık yoğunluk fonksiyonuna göre dağılım gösterdiğini; gnin bir şekil parametresi olan α ile bir ters ölçek parametresi olan β ile parametrelenmiş oldugunu, şöyle gösterilsin:

0b33c261354ca17dfc8f764f3555f38f.png


O zaman, daha önce olduğu gibi n sayıda ölçülmüş değerden oluşan örneklem ki ve bir Gamma(α,β) dağılımlı önsel verilmiş ise, sonsal dağılım şu olur:

7da60b8b31ff6f3ba289ad6b22beaca4.png


Sonsal ortalama olan E[λ] limitte
d77a7bc5672469ea1e7aa155c4705645.png
doğru gittikçe maksimum olabilirlik kestirimi olan
bac11a2d919ff8750efc2abfc8691f26.png
ifadesine yaklaşır.

Eklecek verilerin sonsal kestirimci dağılımı bir Gamma-Poisson dağılım yani bir negatif binom dağılımı olur.

Küçük sayılar kuralı

Kural sözcüğü istatistik bilimi içinde olasılık dağılımı kavramı ile eşanlamlı olarak kullanılmaktadır. Kurala göre yakınsama kavramı dağılımda yakınsama ile aynı anlamda kullanılmaktadır. Buna dayanarak Poisson dağılımı bazan küçük sayılar kuralı olarak anılmaktadır. Buna neden bu dağılımın, nadir olacağı kabul edilmekle beraber, bir çok fırsatta ortaya çıkabilen bir olayın ortaya çıkma sayısını açıklayan olasılık dağılımı olmasıdır. 1898de Ladisladus Bortkiewicz'in Poisson dağılımı hakkında yayınladığı kitabın adı Küçük Sayılar Kuralıdır. Bazı matematik tarihçileri buna ithafen Poisson dağılımının adının da Bortkiewicz dağılımı olmasını istemişlerdir.
 
Geri
Top