Walleniusova necentralna hipergeometrična porazdelitev

Walleniusova necentralna hipergeometrična porazdelitev je posplošitev hipergeometrične porazdelitve. V Walleniusovi necentralni hipergeometrični porazdelitvi ne obravnavamo elementov, ki so enaki, kot v hipergeometrični porazdelitvi, ampak se med seboj razlikujejo še v neki drugi lastnosti (npr. teži). Porazdelitev se imenuje po Tedu Walleniusu
Porazdelitev spada med diskretne verjetnostne porazdelitve.
Razen Walleniusove necentralne hipergeometrične porazdelitve poznamo še Fisherjevo necentralno hipergeometrično porazdelitev, obe pa spadata med necentralne hipergeometrične porazdelitve.

Primer[uredi | uredi kodo]

Najlažje si predstavljamo Walleniusovo necentralno hipergeometrično porazdelitev, če uporabimo model žare. Predpostavimo, da je v žari m₁ rdečih in m₂ belih kroglic. Skupaj jih je torej N = m₁ + m₂. Vsaka rdeča kroglica ima težo ω₁, bela pa ω₂. Razmerje med težama ω je ω₁/ ω₂. Iz žare potegnemo zaporedoma n kroglic tako, da je verjetnost, da izvlečemo določeno kroglico enaka njenemu deležu v skupni teži vseh kroglic, ki so v žari v času izvlečenja. Kroglic ne vračamo. Med kroglicami deluje neka vrsta konkurence. Verjetnost, da je kroglica izvlečena, je nižja, ko so ostale kroglice v žari težje. Takšno vrsto poskusov imenujemo pristranski poskusi, ker nimajo vsi elementi enake vloge.Verjetnost za vsako izvlečenje kroglice (razen prvo) je odvisno od tega, katere kroglice so bile izvlečene prej. To pomeni, da kroglice vlečemo eno za drugo. Pri Fisherjevi necentralni hipergeometrični porazdelitvi pa lahko potegnemo vse kroglice naenkrat, ker ni odvisnosti med posameznimi izvleki.

Kadar imajo vse kroglice isto težo, dobimo običajno hipergeometrično porazdelitev.

Vedno obstoja več kot samo ena necentralna hipergeometrična porazdelitev.

Univariantna porazdelitev[uredi | uredi kodo]

Porazdelitev je univariantna, če imajo v žari kroglice samo dve barvi.

Univariantna Walleniusova necentralna hipergeometrična porazdelitev
parametri	$m_{1},m_{2}\in \mathbb {N}$ $N=m_{1}+m_{2}$ $n\in [0,N)$ $\omega \in \mathbb {R} _{+}$
interval	$k\in \{1,2,\ldots ,N\}$
funkcija verjetnosti (pdf)	${\binom {m_{1}}{x_{1}}}{\binom {m_{2}}{x_{2}}}\int _{0}^{1}(1-t^{\omega /D})^{x_{1}}(1-t^{1/D})^{x_{2}}\operatorname {d} t$ kjer je $D=\omega (m_{1}-x_{1})+(m_{2}-x_{2})$
zbirna funkcija verjetnosti (cdf)
pričakovana vrednost	Približek se dobi z rešitvijo $\mu$ za ${\frac {\mu }{m_{1}}}+\left(1-{\frac {n-\mu }{m_{2}}}\right)^{\omega }=1$
mediana
modus	$1\,$
varianca	$\approx {\frac {Nab}{(N-1)(m_{1}b+m_{2}a)}}\,$ , kjer je $a=\mu (m_{1}-\mu ),\;b=(n-\mu )(\mu +m_{2}-n)$
simetrija
sploščenost (eksces)
entropija
funkcija generiranja momentov (mgf)
karakteristična funkcija

Lastnosti[uredi | uredi kodo]

Funkcija verjetnosti[uredi | uredi kodo]

Funkcija verjetnosti je enaka ${\binom {m_{1}}{x_{1}}}{\binom {m_{2}}{x_{2}}}\int _{0}^{1}(1-t^{\omega /D})^{x_{1}}(1-t^{1/D})^{x_{2}}\operatorname {d} t$
kjer je $D=\omega (m_{1}-x_{1})+(m_{2}-x_{2})$ .

Pričakovana vrednost[uredi | uredi kodo]

Približek za pričakovano vrednost se dobi z rešitvijo $\mu$ za
${\frac {\mu }{m_{1}}}+\left(1-{\frac {n-\mu }{m_{2}}}\right)^{\omega }=1$ .

Modus[uredi | uredi kodo]

Modus je enak $1\,$ .

Varianca[uredi | uredi kodo]

Varianca je enaka $\approx {\frac {Nab}{(N-1)(m_{1}b+m_{2}a)}}\,$ , kjer je
$a=\mu (m_{1}-\mu ),\;b=(n-\mu )(\mu +m_{2}-n)$ .

Multivariantna porazdelitev[uredi | uredi kodo]

Porazdelitev je multivariantna, če imamo v žari kroglice več kot dveh različnih barv (vsaka pa ima samo po eno barvo).

Multivariantna Walleniusova necentralna hipergeometrična porazdelitev
parametri	$c\in \mathbb {N}$ $\mathbf {m} =(m_{1},\ldots ,m_{c})\in \mathbb {N} ^{c}$ $N=\sum _{i=1}^{c}m_{i}$ $n\in [0,N)$ ${\boldsymbol {\omega }}=(\omega _{1},\ldots ,\omega _{c})\in \mathbb {R} _{+}^{c}$
interval	$\mathrm {S} =\left\{\mathbf {x} \in \mathbb {Z} _{0+}^{c}\,:\,\sum _{i=1}^{c}x_{i}=n\right\}$
funkcija verjetnosti (pdf)	$\left(\prod _{i=1}^{c}{\binom {m_{i}}{x_{i}}}\right)\int _{0}^{1}\prod _{i=1}^{c}(1-t^{\omega _{i}/D})^{x_{i}}\operatorname {d} t\,,$ kjer je $D={\boldsymbol {\omega }}\cdot (\mathbf {m} -\mathbf {x} )=\sum _{i=1}^{c}\omega _{i}(m_{i}-x_{i})$
zbirna funkcija verjetnosti (cdf)
pričakovana vrednost	Približek se dobi z rešitvami $\mu _{1},\ldots ,\mu _{c}$ iz $\left(1-{\frac {\mu _{1}}{m_{1}}}\right)^{1/\omega _{1}}=\left(1-{\frac {\mu _{2}}{m_{2}}}\right)^{1/\omega _{2}}=\ldots =\left(1-{\frac {\mu _{c}}{m_{c}}}\right)^{1/\omega _{c}}$ $\wedge \,\sum _{i=1}^{c}\mu _{i}=n\,\wedge \,\forall \,i\in [0,c]\,:\,0\leq \mu _{i}\leq m_{i}\,.$
mediana
modus
varianca	Približek je varianca Fisherjeve necentralne hipergeometrične porazdelitve z enako pričakovano vrednostjo
simetrija
sploščenost (eksces)
entropija
funkcija generiranja momentov (mgf)
karakteristična funkcija