Walleniusova necentralna hipergeometrična porazdelitev

Iz Wikipedije, proste enciklopedije
Skoči na: navigacija, iskanje
Funkcija verjetnosti za Walleniusovo necentralno hipergeometrično porazdelitev za različne vrednosti ω.
m1 = 80, m2 = 60, n = 100, ω = 0.1 ... 20

Walleniusova necentralna hipergeometrična porazdelitev je posplošitev hipergeometrične porazdelitve. V Walleniusovi necentralni hipergeometrični porazdelitvi ne obravnavamo elementov, ki so enaki, kot v hipergeometrični porazdelitvi, ampak se med seboj razlikujejo še v neki drugi lastnosti (n. pr. teži). Porazdelitev se imenuje po Tedu Walleniusu
Porazdelitev spada med diskretne verjetnostne porazdelitve.
Razen Walleniusove necentralne hipergeometrične porazdelitve poznamo še Fisherjevo necentralno hipergeometrično porazdelitev, obe pa spadata med necentralne hipergeometrične porazdelitve.

Primer[uredi | uredi kodo]

Najlažje si predstavljamo Walleniusovo necentralno hipergeometrično porazdelitev, če uporabimo model žare. Predpostavimo, da je v žari m1 rdečih in m2 belih kroglic. Skupaj jih je torej N = m1 + m2. Vsaka rdeča kroglica ima težo ω1, bela pa ω2. Razmerje med težama ω je ω1/ ω2. Iz žare potegnemo zaporedoma n kroglic tako, da je verjetnost, da izvlečemo določeno kroglico enaka njenemu deležu v skupni teži vseh kroglic, ki so v žari v času izvlečenja. Kroglic ne vračamo. Med kroglicami deluje neka vrsta konkurence. Verjetnost, da je kroglica izvlečena, je nižja, ko so ostale kroglice v žari težje. Takšno vrsto poskusov imenujemo pristranski poskusi, ker nimajo vsi elementi enake vloge.Verjetnost za vsako izvlečenje kroglice (razen prvo) je odvisno od tega, katere kroglice so bile izvlečene prej. To pomeni, da kroglice vlečemo eno za drugo. Pri Fisherjevi necentralni hipergeometrični porazdelitvi pa lahko potegnemo vse kroglice naenkrat, ker ni odvisnosti med posameznimi izvleki.

Kadar imajo vse kroglice isto težo, dobimo običajno hipergeometrično porazdelitev.

Vedno obstoja več kot samo ena necentralna hipergeometrična porazdelitev.

Univariantna porazdelitev[uredi | uredi kodo]

Porazdelitev je univariantna, če imajo v žari kroglice samo dve barvi.

Univariantna Walleniusova necentralna hipergeometrična porazdelitev
parametri m_1, m_2 \in \mathbb{N}
N = m_1 + m_2
n \in [0,N)
\omega \in \mathbb{R}_+
interval k \in \{1,2,\ldots,N\}
funkcija verjetnosti
(pdf)
\binom{m_1}{x_1} \binom{m_2}{x_2} \int_0^1 (1-t^{\omega/D})^{x_1} (1-t^{1/D})^{x_2} \operatorname{d}t
kjer je  D=\omega(m_1-x_1)+(m_2-x_2)
zbirna funkcija verjetnosti
(cdf)
pričakovana vrednost Približek se dobi z rešitvijo \mu za
\frac{\mu}{m_1} + \left(1-\frac{n-\mu}{m_2}\right)^{\omega} = 1
mediana
modus 1\,
varianca \approx \frac{Nab}{(N-1)(m_1 b + m_2 a)}\,,   kjer je
a=\mu(m_1-\mu),\; b=(n-\mu)(\mu+m_2-n)
simetrija
sploščenost
(eksces)
entropija
funkcija generiranja momentov
(mgf)
karakteristična funkcija

Lastnosti[uredi | uredi kodo]

Funkcija verjetnosti[uredi | uredi kodo]

Funkcija verjetnosti je enaka \binom{m_1}{x_1} \binom{m_2}{x_2} \int_0^1 (1-t^{\omega/D})^{x_1} (1-t^{1/D})^{x_2} \operatorname{d}t
kjer je  D=\omega(m_1-x_1)+(m_2-x_2).


Pričakovana vrednost[uredi | uredi kodo]

Približek za pričakovano vrednost se dobi z rešitvijo \mu za
\frac{\mu}{m_1} + \left(1-\frac{n-\mu}{m_2}\right)^{\omega} = 1.

Modus[uredi | uredi kodo]

Modus je enak 1\,.

Varianca[uredi | uredi kodo]

Varianca je enaka \approx \frac{Nab}{(N-1)(m_1 b + m_2 a)}\,,   kjer je
a=\mu(m_1-\mu),\; b=(n-\mu)(\mu+m_2-n).


Multivariantna porazdelitev[uredi | uredi kodo]

Porazdelitev je multivariantna, če imamo v žari kroglice več kot dveh različnih barv (vsaka pa ima samo po eno barvo).

Multivariantna Walleniusova necentralna hipergeometrična porazdelitev
parametri c \in \mathbb{N}
\mathbf{m}=(m_1,\ldots,m_c) \in \mathbb{N}^c
N = \sum_{i=1}^c m_i
n \in [0,N)
\boldsymbol{\omega} = (\omega_1,\ldots,\omega_c) \in \mathbb{R}_+^c
interval \mathrm{S} = \left\{ \mathbf{x} \in \mathbb{Z}_{0+}^c \, : \, \sum_{i=1}^{c} x_i = n \right\}
funkcija verjetnosti
(pdf)
\left(\prod_{i=1}^c \binom{m_i}{x_i} \right) \int_0^1 \prod_{i=1}^c (1-t^{\omega_i/D})^{x_i} \operatorname{d}t\,,
kjer je  D=\boldsymbol{\omega}\cdot (\mathbf{m}-\mathbf{x}) = \sum_{i=1}^c \omega_i(m_i-x_i)
zbirna funkcija verjetnosti
(cdf)
pričakovana vrednost Približek se dobi z rešitvami \mu_1,\ldots,\mu_c iz
\left(1-\frac{\mu_1}{m_1}\right)^{1/\omega_1} = \left(1-\frac{\mu_2}{m_2}\right)^{1/\omega_2} = \ldots = \left(1-\frac{\mu_c}{m_c}\right)^{1/\omega_c}
\wedge \, \sum_{i=1}^c \mu_i = n \, \wedge \, \forall\, i \in [0,c]\, :\, 0 \le \mu_i \le m_i\,.
mediana
modus
varianca Približek je varianca Fisherjeve necentralne hipergeometrične porazdelitve
z enako pričakovano vrednostjo
simetrija
sploščenost
(eksces)
entropija
funkcija generiranja momentov
(mgf)
karakteristična funkcija

Lastnosti[uredi | uredi kodo]

Funkcija verjetnosti[uredi | uredi kodo]

Funkcija verjetnosti je enaka

\left(\prod_{i=1}^c \binom{m_i}{x_i} \right) \int_0^1 \prod_{i=1}^c (1-t^{\omega_i/D})^{x_i} \operatorname{d}t\,,
kjer je  D=\boldsymbol{\omega}\cdot (\mathbf{m}-\mathbf{x}) = \sum_{i=1}^c \omega_i(m_i-x_i)

Pričakovana vrednost[uredi | uredi kodo]

Približek pričakovane vrednosti se dobi z rešitvami :\mu_1,\ldots,\mu_c iz

\left(1-\frac{\mu_1}{m_1}\right)^{1/\omega_1} = \left(1-\frac{\mu_2}{m_2}\right)^{1/\omega_2} =
=\ldots = \left(1-\frac{\mu_c}{m_c}\right)^{1/\omega_c}
\wedge \, \sum_{i=1}^c \mu_i = n \, \wedge \, \forall\, i \in [0,c]\, :\, 0 \le \mu_i \le m_i\,..

Glej tudi[uredi | uredi kodo]

Zunanje povezave[uredi | uredi kodo]