Repozitorij vsebuje primer uporabe dveh postopkov grafemsko fonemske pretvorbe. Programske skripte omogočajo učenje in testiranje grafemsko fonemskega pretvornika na leksikonih za slovenski jezik. Učenje postopkov smo izvedli na leksikonu gigafidaleks_asr_gfp_v1.dict, ki vsebuje 1440067 besedilnih nizov, testiranje pa na leksikonu sofesleks_asr_gfp.dict s 1196 besedilnimi nizi.
Celotno orodje je dostopno na repozitoriju https://github.com/sequitur-g2p/sequitur-g2p. Učenje in testiranje pretvornika z orodjem Sequitur izvedemo s pomočjo skripte Sequitur_g2p.sh. Pri preskusu na testnih besedah se lahko poslužimo predhodno naučenega modela.
Pretvornik DeepPhonemizer iz repozitorija https://github.com/as-ideas/DeepPhonemizer temelji na uporabi globokih nevronskih mrež. Proces učenja na leksikonu Gigafida in testiranje na leksikonu Sofesleks je povzeto v programski skripti DeepPhonemizer_g2p.py. Datoteka config.yaml vsebuje nastavitve učne paramtrov in definicijo grafemov in fonemov za slovenski jezik. Test lahko izvedemo na predhodno naučenem modelu.
Učenje in testiranje pretvornika z orodjem Phonetisaurus povzema skripta Phonetisaurus_g2p.py.