GIZA++

Iz Wikipedije, proste enciklopedije

GIZA++ je brezplačno orodje za statistično strojno prevajanje, ki se uporablja za učenje modelov IBM 1-5 in za model poravnave besed Hidden Markov (HMM). [1] GIZA++ je razširitev programa GIZA (dela orodja za statistično strojno prevajanje EGYPT), ki ga je razvila skupina za statistično strojno prevajanje na poletni delavnici leta 1999 na Centru za računalniško obdelavo jezikov in govora Univerze Johns Hopkins. Dodatke k programu je osnoval Franz Josef Och.[2]

GIZA++ se uporablja za poravnavo besed in besednih zvez v stavčno poravnanem korpusu. V vzporednem korpusu se s programom lahko ustvari dvojezični slovar za prevajalni sistem.

Viri[uredi | uredi kodo]

  1. Franz Josef Och, Hermann Ney (Marec 2003). »"A Systematic Comparison of Various Statistical Alignment Models", Computational Linguistics, volume 29, number 1« (v angleščini). str. 19–51. Pridobljeno 1. aprila 2011.
  2. Franz Josef Och, Hermann Ney (Oktober 2000). »"Improved Statistical Alignment Models" Proc. of the 38th Annual Meeting of the Association for Computational Linguistics« (v angleščini). Association for Computational Linguistics, Hongkong, Kitajska. str. 440–447. Arhivirano iz prvotnega spletišča dne 20. septembra 2016. Pridobljeno 1. aprila 2011.