Zipf-Mandelbrotova porazdelitev

Iz Wikipedije, proste enciklopedije
(Preusmerjeno s strani Zipf-Mandelbrotov zakon)
Zipf-Mandelbrotova porazdelitev
parametri (celo število)
(realno število)
(realno število)
interval
funkcija verjetnosti
(pdf)
zbirna funkcija verjetnosti
(cdf)
pričakovana vrednost
mediana
modus
varianca
simetrija
sploščenost
(eksces)
entropija
funkcija generiranja momentov
(mgf)
karakteristična funkcija

Zipf-Mandelbrotova porazdelitev (tudi Zipf-Mandelbrotov zakon ali Pareto-Zipfova porazdelitev) je diskretna verjetnostna porazdelitev.

Imenuje se po ameriškem jezikoslovcu in filologu Georgeu Kingsleyu Zipfu (1902–1950), francosko-ameriškem matematiku poljskega rodu Benoîtu Mandelbrotu (1924–2010) in italijanskem ekonomistu in sociologu Vilfredu Paretu (1848–1923). Zipf je predlagal enostavnejšo varianto, ki so jo imenovali Zipfov zakon. Pozneje je Mandelbrot problem posplošil in ga uporabil celo za idealni plin.

Funkcija verjetnosti je enaka kjer je:

  • ,

kadar je q = 0 in je s približno 1, se dobi Zipfov zakon.

To vrednost se ima lahko kot posplošitev harmoničnih števil (glej tudi harmonična vrsta). Ko se N približuje neskončnosti, postane to Hurwitzeva funkcija zeta . Za končne N pri q = 0 postane Zipf-Mandelbrotova porazdelitev enaka Zipfovemu zakonu. Za nekončne N pri q = 0 postane porazdelitev zeta.

Uporaba[uredi | uredi kodo]

Zipf-Mandelbrotov zakon se uporablja v jezikoslovju (kvantitativna lingvistika). Opisuje porazdelitev besed (ne skupin besed, kot so fraze) v besedilih naravnih jezikov oziroma v besedilnih korpusih. Porazdelitev besed v poljubnem besedilu po pogostosti (frekvenci) pojavljanja se podreja potenčni porazdelitvi, ki je znana kot Zipfov zakon. Če prikažemo pogostost (frekvenco) pojavljanja (v padajočem redu) posameznih besed v zelo velikih besedilih, dobimo porazdelitev, ki je potenčna in ima eksponent zelo blizu vrednosti 1. Lahko jo zapišemo kot

.

Eksponent ima vrednost, ki je zelo blizu 1. Podoben zakon velja še na nekaterih drugih področjih (ekonomija, fizika, biologija, demografija, glasba, bibliografija). Iz tega sledi, da se določene besede v naravnih jezikih uporabljajo bolj pogosto kot druge.

Značilnosti[uredi | uredi kodo]

Funkcija verjetnosti[uredi | uredi kodo]

Funkcija verjetnosti je enaka
kjer je

  • :.

Zbirna funkcija verjetnosti[uredi | uredi kodo]

Zbirna funkcija verjetnosti je .

Pričakovana vrednost[uredi | uredi kodo]

Pričakovana vrednost je enaka .

Modus[uredi | uredi kodo]

Modus je enak .

Glej tudi[uredi | uredi kodo]

Zunanje povezave[uredi | uredi kodo]