Fisherjeva necentralna hipergeometrična porazdelitev

Iz Wikipedije, proste enciklopedije
Skoči na: navigacija, iskanje
Funkcija verjetnosti za Fisherjevo necentralno hipergeometrično porazdelitev za različne vrednosti ω.
m1 = 80, m2 = 60, n = 100, ω = 0.1 ... 20

Fisherjeva necentralna hipergeometrična porazdelitev je posplošitev hipergeometrične porazdelitve, V tej porazdelitvi je jemanje vzorcev odvisno od utežnih faktorjev. Takšno vzorčenje imenujemo tudi pristransko ali usmerjeno. Fisherjevo necentralno hipergeometrično porazdelitev lahko smatramo kot pogojno verjetnostno porazdelitev dveh ali več binomsko porazdeljenih spremenljivk, ki so odvisne od skupne vsote.V Fisherjevi necentralni hipergeometrični porazdelitvi ne obravnavamo elementov, ki so enaki, kot je to v hipergeometrični porazdelitvi. Elementi se morajo razlikovati še v neki drugi lastnosti (n. pr. teži).
Porazdelitev spada med diskretne verjetnostne porazdelitve.
Razen Fisherjeve necentralne hipergeometrične porazdelitve poznamo še Walleniusovo necentralno hipergeometrično porazdelitev, obe pa spadata med necentralne hipergeometrične porazdelitve.
Včasih Fisherjevo necentralno hipergeometrično porazdelitev imenujejo tudi razširjena hipergeometrična porazdelitev.

Primer[uredi | uredi kodo]

Najlažje si predstavljamo Fisherjevo necentralno hipergeometrično porazdelitev, če uporabimo model žare. Predpostavimo, da je v žari m1 rdečih in m2 belih kroglic. Skupaj jih je torej N = m1 + m2. Vsaka rdeča kroglica ima težo ω1, bela pa ω2. Razmerje med težama ω je ω1/ ω2. Iz žare potegnemo zaporedoma kroglice tako, da je verjetnost, da smo potegnili določeno kroglico sorazmerna z njeno težo, ni pa odvisna od tega kaj se je zgodilo z drugimi kroglicami. Lahko potegnemo tudi vseh n kroglic naenkrat. Število izvlečenih kroglic z določeno barvo se podreja binomski porazdelitvi. Če je znano skupno število izvlečenih kroglic n, potem je pogojna porazdelitev izvlečenih rdečih kroglic Fisherjeva necentralna hipergeometrična porazdelitev. Če želimo, da je n vnaprej določen, potem moramo izvleči posamezne kroglice eno za drugo. V tem primeru dobimo Walleniusovo necentralno hipergeometrično porazdelitev. Obe porazdelitvi sta enaki hipergeometrični porazdelitvi, kadar imajo vse kroglice enako težo (razmerje tež je enako 1).

Vedno obstoja več kot samo ena necentralna hipergeometrična porazdelitev.

Univariantna porazdelitev[uredi | uredi kodo]

Porazdelitev je univariantna, če imajo v žari kroglice samo dve barvi.

Univariantna Fisherjeva necentralna hipergeometrična porazdelitev
parametri m_1, m_2 \in \mathbb{N}
N = m_1 + m_2
n \in [0,N)
\omega \in \mathbb{R}_+
interval x \in [x_\min,x_\max]
x_\min=\max(0,n-m_2)
x_\max=\min(n,m_1)
funkcija verjetnosti
(pdf)
\frac{\binom{m_1}{x} \binom{m_2}{n-x} \omega^x}{P_0}
kjer je P_0 = \sum_{y=x_\min}^{x_\max} \binom{m_1}{y} \binom{m_2}{n-y} \omega^y
zbirna funkcija verjetnosti
(cdf)
pričakovana vrednost \frac{P_1}{P_0}, kjer je P_k = \sum_{y=x_\min}^{x_\max} \binom{m_1}{y} \binom{m_2}{n-y} \omega^y\, y^k
mediana
modus \,\, \left\lfloor \frac{-2C}{B - \sqrt{B^2-4AC}} \right\rfloor \, ,
kjer je A=\omega-1, B = m_1 + n - N -(m_1+n+2)\omega, C = (m_1+1)(n+1)\omega
varianca \frac{P_2}{P_0} - \left( \frac{P_1}{P_0} \right)^2, Pk je podan zgoraj
simetrija
sploščenost
(eksces)
entropija
funkcija generiranja momentov
(mgf)
karakteristična funkcija

Lastnosti[uredi | uredi kodo]

Funkcija verjetnosti[uredi | uredi kodo]

Funkcija verjetnosti je enaka \frac{\binom{m_1}{x} \binom{m_2}{n-x} \omega^x}{P_0}
kjer je
P_0 = \sum_{y=x_\min}^{x_\max} \binom{m_1}{y} \binom{m_2}{n-y} \omega^y.


Pričakovana vrednost[uredi | uredi kodo]

Pričakovana vrednost je enaka \frac{P_1}{P_0}, where P_k = \sum_{y=x_\min}^{x_\max} \binom{m_1}{y} \binom{m_2}{n-y} \omega^y\, y^k.

Modus[uredi | uredi kodo]

Modus je enak \,\, \left\lfloor \frac{-2C}{B - \sqrt{B^2-4AC}} \right\rfloor \, ,
kjer je A=\omega-1, B = m_1 + n - N -(m_1+n+2)\omega, C = (m_1+1)(n+1)\omega.

Varianca[uredi | uredi kodo]

Varianca je enaka \frac{P_2}{P_0} - \left( \frac{P_1}{P_0} \right)^2, kjer je Pk podan zgoraj.


Multivariantna porazdelitev[uredi | uredi kodo]

Porazdelitev je multivariantna, če imamo v žari kroglice več kot dveh različnih barv (vsaka pa ima samo po eno barvo).

Fisherjeva multivariantna necentralna hipergeometrična porazdelitev
parametri c \in \mathbb{N}
\mathbf{m}=(m_1,\ldots,m_c) \in \mathbb{N}^c
N = \sum_{i=1}^c m_i
n \in [0,N)
\boldsymbol{\omega} = (\omega_1,\ldots,\omega_c) \in \mathbb{R}_+^c
interval \mathrm{S} = \left\{ \mathbf{x} \in \mathbb{Z}_{0+}^c \, : \, \sum_{i=1}^{c} x_i = n \right\}
funkcija verjetnosti
(pdf)
\frac{1}{P_0}\prod_{i=1}^{c} \binom{m_i}{x_i}\omega_i^{x_i}
kjer je P_0 = \sum_{(y_0,\ldots,y_c)\in \mathrm{S}}\prod_{i=1}^{c} \binom{m_i}{y_i}\omega_i^{y_i}
zbirna funkcija verjetnosti
(cdf)
pričakovana vrednost Približek za pričakovano vrednost μi za xi je
\mu_i = \frac{m_i r \omega_i}{r \omega_i + 1} kjer je r edina pozitivna rešitev \sum_{i=1}^{c}\mu_i = n\,
mediana
modus
varianca
simetrija
sploščenost
(eksces)
entropija
funkcija generiranja momentov
(mgf)
karakteristična funkcija

Lastnosti[uredi | uredi kodo]

Funkcija verjetnosti[uredi | uredi kodo]

Funkcija verjetnosti je enaka

\frac{1}{P_0}\prod_{i=1}^{c} \binom{m_i}{x_i}\omega_i^{x_i}
kjer je
P_0 = \sum_{(y_0,\ldots,y_c)\in \mathrm{S}}\prod_{i=1}^{c} \binom{m_i}{y_i}\omega_i^{y_i}

Pričakovana vrednost[uredi | uredi kodo]

Približek za pričakovano vrednost μi za xi je
\mu_i = \frac{m_i r \omega_i}{r \omega_i + 1} kjer je r edina rešitev \sum_{i=1}^{c}\mu_i = n\,

Glej tudi[uredi | uredi kodo]

Zunanje povezave[uredi | uredi kodo]