Hipergeometrična porazdelitev

Iz Wikipedije, proste enciklopedije
Skoči na: navigacija, iskanje
Hipergeometrična porazdelitev
parametri \begin{align}N&\in 0,1,2,\dots \\
                                 m&\in 0,1,2,\dots,N \\
                                 n&\in 0,1,2,\dots,N\end{align}\,
interval \scriptstyle{k\, \in\, \max{(0,\, n+m-N)},\, \dots,\, \min{(m,\, n )}}\,
funkcija verjetnosti
(pdf)
{{{m \choose k} {{N-m} \choose {n-k}}}\over {N \choose n}}
zbirna funkcija verjetnosti
(cdf)
pričakovana vrednost n m\over N
mediana
modus \left \lfloor \frac{(n+1)(m+1)}{N+2} \right \rfloor
varianca nm(N-n)(N-m)\over N^2(N-1)
simetrija \frac{(N-2m)(N-1)^\frac{1}{2}(N-2n)}{[nm(N-m)(N-n)]^\frac{1}{2}(N-2)}
sploščenost
(eksces)
 \left[\frac{N^2(N-1)}{n(N-2)(N-3)(N-n)}\right]

\cdot\left[\frac{N(N+1)-6N(N-n)}{m(N-m)}\right.
+\left.\frac{3n(N-n)(N+6)}{N^2}-6\right]

entropija
funkcija generiranja momentov
(mgf)
\frac{{N-m \choose n} \scriptstyle{\,_2F_1(-n, -m; N - m - n + 1; e^{t}) } }
                         {{N \choose n}}  \,\!
karakteristična funkcija \frac{{N-m \choose n} \scriptstyle{\,_2F_1(-n, -m; N - m - n + 1; e^{it}) }}
{{N \choose n}}
Opomba: Oznaka \,_2F_1 pomeni posplošeno Gaussovo hipergeometrično funkcijo \,_2F_1(a,b;c;z).

Hipergeometrična porazdelitev (tudi centralna hipergeometrična porazdelitev) je diskretna verjetnostna porazdelitev, ki opisuje verjetnost dogodkov, ki lahko imajo samo dva izzida (uspeh in neuspeh). S pomočjo hipergeometrične porazdelitve lahko določimo verjetnost števila uspešnih izzidov pri poskusu v katerem se z izvedbo dogodka verjetnost spremeni. Porazdelitev je v osnovi podobna binomski porazdelitvi, kjer pa vzorec po izvedbi poskusa vrnemo, pri hipergeometrični porazdelitvi pa vzorcev ne vračamo (vzorčenje brez vračanja). To pomeni, da je verjetnost pri binomski porazdelitvi konstantna, pri hipergeometrični pa se spreminja.

Primer[uredi | uredi kodo]

Hipergeometrično porazdelitev si najlažje predstavljamo s pomočjo modela žare. V žari (namišljena posoda) imamo dve vrsti enako velikih kroglic, ene so bele, druge črne. Vseh kroglic je N, od tega je m belih. Izvlečemo n kroglic, ki jih ne vračamo v žaro. Hipergeometrična porazdelitev določa porazdelitev belih izvlečenih kroglic.

Značilnosti[uredi | uredi kodo]

Hipergeometrična porazdelitev je odvisna od treh parametrov:

  • števila elementov N
  • števila elementov M\leq N z določeno značilnostjo (število možnih uspehov)
  • števila elementov n\leq N izvlečenih v enem poskusu

Funkcija verjetnosti[uredi | uredi kodo]

Verjetnost, da izmed N elementov, med katerimi jih ima m značilnosti uspešno, dobimo k uspešnih je enaka

{{{m \choose k} {{N-m} \choose {n-k}}}\over {N \choose n}}

V primeru modela žare je to verjetnost, da smo iz žare, kjer je N kroglic (m belih, N-m črnih) potegnili belo kroglico.

Pričakovana vrednost[uredi | uredi kodo]

Pričakovana vrednost je enaka n m\over N.

Varianca[uredi | uredi kodo]

Varianca je enaka nm(N-n)(N-m)\over N^2(N-1).

Koeficient simetrije[uredi | uredi kodo]

Koeficient simetrije je enak \frac{(N-2m)(N-1)^\frac{1}{2}(N-2n)}{[nm(N-m)(N-n)]^\frac{1}{2}(N-2)}.

Sploščenost[uredi | uredi kodo]

Sploščenost je enaka  \left[\frac{N^2(N-1)}{n(N-2)(N-3)(N-n)}\right] \cdot\left[\frac{N(N+1)-6N(N-n)}{m(N-m)}\right. +\left.\frac{3n(N-n)(N+6)}{N^2}-6\right].

Glej tudi[uredi | uredi kodo]

Zunanje povezave[uredi | uredi kodo]