Funkcija verjetnosti za Walleniusovo necentralno hipergeometrično porazdelitev za različne vrednosti ω.
m
1 = 80, m
2 = 60, n = 100, ω = 0.1 ... 20
Walleniusova necentralna hipergeometrična porazdelitev je posplošitev hipergeometrične porazdelitve . V Walleniusovi necentralni hipergeometrični porazdelitvi ne obravnavamo elementov, ki so enaki, kot v hipergeometrični porazdelitvi, ampak se med seboj razlikujejo še v neki drugi lastnosti (npr. teži). Porazdelitev se imenuje po Tedu Walleniusu
Porazdelitev spada med diskretne verjetnostne porazdelitve .
Razen Walleniusove necentralne hipergeometrične porazdelitve poznamo še Fisherjevo necentralno hipergeometrično porazdelitev , obe pa spadata med necentralne hipergeometrične porazdelitve .
Najlažje si predstavljamo Walleniusovo necentralno hipergeometrično porazdelitev, če uporabimo model žare . Predpostavimo, da je v žari m1 rdečih in m2 belih kroglic. Skupaj jih je torej N = m1 + m2 . Vsaka rdeča kroglica ima težo ω1 , bela pa ω2 . Razmerje med težama ω je ω1 / ω2 . Iz žare potegnemo zaporedoma n kroglic tako, da je verjetnost, da izvlečemo določeno kroglico enaka njenemu deležu v skupni teži vseh kroglic, ki so v žari v času izvlečenja. Kroglic ne vračamo. Med kroglicami deluje neka vrsta konkurence. Verjetnost, da je kroglica izvlečena, je nižja, ko so ostale kroglice v žari težje. Takšno vrsto poskusov imenujemo pristranski poskusi, ker nimajo vsi elementi enake vloge.Verjetnost za vsako izvlečenje kroglice (razen prvo) je odvisno od tega, katere kroglice so bile izvlečene prej. To pomeni, da kroglice vlečemo eno za drugo. Pri Fisherjevi necentralni hipergeometrični porazdelitvi pa lahko potegnemo vse kroglice naenkrat, ker ni odvisnosti med posameznimi izvleki.
Kadar imajo vse kroglice isto težo, dobimo običajno hipergeometrično porazdelitev .
Vedno obstoja več kot samo ena necentralna hipergeometrična porazdelitev.
Porazdelitev je univariantna, če imajo v žari kroglice samo dve barvi.
Univariantna Walleniusova necentralna hipergeometrična porazdelitev
parametri
m
1
,
m
2
∈
N
{\displaystyle m_{1},m_{2}\in \mathbb {N} }
N
=
m
1
+
m
2
{\displaystyle N=m_{1}+m_{2}}
n
∈
[
0
,
N
)
{\displaystyle n\in [0,N)}
ω
∈
R
+
{\displaystyle \omega \in \mathbb {R} _{+}}
interval
k
∈
{
1
,
2
,
…
,
N
}
{\displaystyle k\in \{1,2,\ldots ,N\}}
funkcija verjetnosti (pdf)
(
m
1
x
1
)
(
m
2
x
2
)
∫
0
1
(
1
−
t
ω
/
D
)
x
1
(
1
−
t
1
/
D
)
x
2
d
t
{\displaystyle {\binom {m_{1}}{x_{1}}}{\binom {m_{2}}{x_{2}}}\int _{0}^{1}(1-t^{\omega /D})^{x_{1}}(1-t^{1/D})^{x_{2}}\operatorname {d} t}
kjer je
D
=
ω
(
m
1
−
x
1
)
+
(
m
2
−
x
2
)
{\displaystyle D=\omega (m_{1}-x_{1})+(m_{2}-x_{2})}
zbirna funkcija verjetnosti (cdf)
pričakovana vrednost
Približek se dobi z rešitvijo
μ
{\displaystyle \mu }
za
μ
m
1
+
(
1
−
n
−
μ
m
2
)
ω
=
1
{\displaystyle {\frac {\mu }{m_{1}}}+\left(1-{\frac {n-\mu }{m_{2}}}\right)^{\omega }=1}
mediana
modus
1
{\displaystyle 1\,}
varianca
≈
N
a
b
(
N
−
1
)
(
m
1
b
+
m
2
a
)
{\displaystyle \approx {\frac {Nab}{(N-1)(m_{1}b+m_{2}a)}}\,}
, kjer je
a
=
μ
(
m
1
−
μ
)
,
b
=
(
n
−
μ
)
(
μ
+
m
2
−
n
)
{\displaystyle a=\mu (m_{1}-\mu ),\;b=(n-\mu )(\mu +m_{2}-n)}
simetrija
sploščenost (eksces)
entropija
funkcija generiranja momentov (mgf)
karakteristična funkcija
Funkcija verjetnosti je enaka
(
m
1
x
1
)
(
m
2
x
2
)
∫
0
1
(
1
−
t
ω
/
D
)
x
1
(
1
−
t
1
/
D
)
x
2
d
t
{\displaystyle {\binom {m_{1}}{x_{1}}}{\binom {m_{2}}{x_{2}}}\int _{0}^{1}(1-t^{\omega /D})^{x_{1}}(1-t^{1/D})^{x_{2}}\operatorname {d} t}
kjer je
D
=
ω
(
m
1
−
x
1
)
+
(
m
2
−
x
2
)
{\displaystyle D=\omega (m_{1}-x_{1})+(m_{2}-x_{2})}
.
Približek za pričakovano vrednost se dobi z rešitvijo
μ
{\displaystyle \mu }
za
μ
m
1
+
(
1
−
n
−
μ
m
2
)
ω
=
1
{\displaystyle {\frac {\mu }{m_{1}}}+\left(1-{\frac {n-\mu }{m_{2}}}\right)^{\omega }=1}
.
Modus je enak
1
{\displaystyle 1\,}
.
Varianca je enaka
≈
N
a
b
(
N
−
1
)
(
m
1
b
+
m
2
a
)
{\displaystyle \approx {\frac {Nab}{(N-1)(m_{1}b+m_{2}a)}}\,}
, kjer je
a
=
μ
(
m
1
−
μ
)
,
b
=
(
n
−
μ
)
(
μ
+
m
2
−
n
)
{\displaystyle a=\mu (m_{1}-\mu ),\;b=(n-\mu )(\mu +m_{2}-n)}
.
Multivariantna porazdelitev [ uredi | uredi kodo ]
Porazdelitev je multivariantna, če imamo v žari kroglice več kot dveh različnih barv (vsaka pa ima samo po eno barvo).
Multivariantna Walleniusova necentralna hipergeometrična porazdelitev
parametri
c
∈
N
{\displaystyle c\in \mathbb {N} }
m
=
(
m
1
,
…
,
m
c
)
∈
N
c
{\displaystyle \mathbf {m} =(m_{1},\ldots ,m_{c})\in \mathbb {N} ^{c}}
N
=
∑
i
=
1
c
m
i
{\displaystyle N=\sum _{i=1}^{c}m_{i}}
n
∈
[
0
,
N
)
{\displaystyle n\in [0,N)}
ω
=
(
ω
1
,
…
,
ω
c
)
∈
R
+
c
{\displaystyle {\boldsymbol {\omega }}=(\omega _{1},\ldots ,\omega _{c})\in \mathbb {R} _{+}^{c}}
interval
S
=
{
x
∈
Z
0
+
c
:
∑
i
=
1
c
x
i
=
n
}
{\displaystyle \mathrm {S} =\left\{\mathbf {x} \in \mathbb {Z} _{0+}^{c}\,:\,\sum _{i=1}^{c}x_{i}=n\right\}}
funkcija verjetnosti (pdf)
(
∏
i
=
1
c
(
m
i
x
i
)
)
∫
0
1
∏
i
=
1
c
(
1
−
t
ω
i
/
D
)
x
i
d
t
,
{\displaystyle \left(\prod _{i=1}^{c}{\binom {m_{i}}{x_{i}}}\right)\int _{0}^{1}\prod _{i=1}^{c}(1-t^{\omega _{i}/D})^{x_{i}}\operatorname {d} t\,,}
kjer je
D
=
ω
⋅
(
m
−
x
)
=
∑
i
=
1
c
ω
i
(
m
i
−
x
i
)
{\displaystyle D={\boldsymbol {\omega }}\cdot (\mathbf {m} -\mathbf {x} )=\sum _{i=1}^{c}\omega _{i}(m_{i}-x_{i})}
zbirna funkcija verjetnosti (cdf)
pričakovana vrednost
Približek se dobi z rešitvami
μ
1
,
…
,
μ
c
{\displaystyle \mu _{1},\ldots ,\mu _{c}}
iz
(
1
−
μ
1
m
1
)
1
/
ω
1
=
(
1
−
μ
2
m
2
)
1
/
ω
2
=
…
=
(
1
−
μ
c
m
c
)
1
/
ω
c
{\displaystyle \left(1-{\frac {\mu _{1}}{m_{1}}}\right)^{1/\omega _{1}}=\left(1-{\frac {\mu _{2}}{m_{2}}}\right)^{1/\omega _{2}}=\ldots =\left(1-{\frac {\mu _{c}}{m_{c}}}\right)^{1/\omega _{c}}}
∧
∑
i
=
1
c
μ
i
=
n
∧
∀
i
∈
[
0
,
c
]
:
0
≤
μ
i
≤
m
i
.
{\displaystyle \wedge \,\sum _{i=1}^{c}\mu _{i}=n\,\wedge \,\forall \,i\in [0,c]\,:\,0\leq \mu _{i}\leq m_{i}\,.}
mediana
modus
varianca
Približek je varianca Fisherjeve necentralne hipergeometrične porazdelitve z enako pričakovano vrednostjo
simetrija
sploščenost (eksces)
entropija
funkcija generiranja momentov (mgf)
karakteristična funkcija
Funkcija verjetnosti je enaka
(
∏
i
=
1
c
(
m
i
x
i
)
)
∫
0
1
∏
i
=
1
c
(
1
−
t
ω
i
/
D
)
x
i
d
t
,
{\displaystyle \left(\prod _{i=1}^{c}{\binom {m_{i}}{x_{i}}}\right)\int _{0}^{1}\prod _{i=1}^{c}(1-t^{\omega _{i}/D})^{x_{i}}\operatorname {d} t\,,}
kjer je
D
=
ω
⋅
(
m
−
x
)
=
∑
i
=
1
c
ω
i
(
m
i
−
x
i
)
{\displaystyle D={\boldsymbol {\omega }}\cdot (\mathbf {m} -\mathbf {x} )=\sum _{i=1}^{c}\omega _{i}(m_{i}-x_{i})}
Približek pričakovane vrednosti se dobi z rešitvami :
μ
1
,
…
,
μ
c
{\displaystyle \mu _{1},\ldots ,\mu _{c}}
iz
(
1
−
μ
1
m
1
)
1
/
ω
1
=
(
1
−
μ
2
m
2
)
1
/
ω
2
=
{\displaystyle \left(1-{\frac {\mu _{1}}{m_{1}}}\right)^{1/\omega _{1}}=\left(1-{\frac {\mu _{2}}{m_{2}}}\right)^{1/\omega _{2}}=}
=
…
=
(
1
−
μ
c
m
c
)
1
/
ω
c
{\displaystyle =\ldots =\left(1-{\frac {\mu _{c}}{m_{c}}}\right)^{1/\omega _{c}}}
∧
∑
i
=
1
c
μ
i
=
n
∧
∀
i
∈
[
0
,
c
]
:
0
≤
μ
i
≤
m
i
.
{\displaystyle \wedge \,\sum _{i=1}^{c}\mu _{i}=n\,\wedge \,\forall \,i\in [0,c]\,:\,0\leq \mu _{i}\leq m_{i}\,.}
.