-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Fjern dobbeltgenererte former av samansetjingar i MT - ± bindestrek #23
Comments
Dette er eit problem berre om ein har uvekta FST-ar. Med ein vekta FST, konfigurert slik: ./configure --enable-apertium --with-backend-format=openfst-tropical så blir resultatet dette: echo 'goltelesijjie<n><sg><nom>' | hfst-lookup -q tools/mt/apertium/generator-mt-apertium-norm.hfstol
goltelesijjie<n><sg><nom> goltelesijjie 0.000000
goltelesijjie<n><sg><nom> goltele-sijjie 10.000000 og då kan ein enkelt filtrera vekk alle andre enn den analysen med lågast vekt, anten med CG-reglar, eller allereie med lookup: echo 'goltelesijjie<n><sg><nom>' | hfst-lookup -q -b 1 tools/mt/apertium/generator-mt-apertium-norm.hfstol
goltelesijjie<n><sg><nom> goltelesijjie 0.000000 |
For at dette skal fungera i produksjonssystem krevst det sjølvsagt at:
|
Etter testing så ser @leneantonsen og eg at ting fungerer lokalt for oss begge. Det som då står att er å sjekka om det er feil i bygginga for apertium-serveren. Kan du sjekka det, @unhammer ? |
Feilen ligg ikkje i |
så siste gong ei lang-sma-pakke blei bygd i Tino sitt system er april 1045a5f . Er det slik at
|
Lang-sma gjev korrekte former med nyaste og eldre versjonar dersom:
Men eg veit ikkje om det fyrste punktet stemmer for Tino sitt byggjesystem, og heller ikkje om det andre punktet stemmer for oppsettet på serveren. |
På gtweb køyrer berre det Lene lastar opp, så viss det fungerer for ho, så burde det fungera på gtweb. Det ser ut som giella-sma.deb blir bygd med |
...right, gramtool kræves jo nu af mange sprog. Den har jeg packaged, men glemt faktisk at bruge i builds. |
Dette er problemet. For at analysatorane som blir bygde skal fungera korrekt med MT, så må den delen av |
giella-sma rebuilt with gtgramcheck and backend-format=openfst-tropical. Se om det virker. |
det skulle fungere med foma backend nå også fra 169c636, mt/apertium blir alltid bygt med openfst men det del av reweight som disambiguerer bindestrek uten +Cmp tagg i https://github.com/giellalt/lang-sma/blob/main/src/Makefile.am#L26-L27 var ikke i bruk uten openfst |
@leneantonsen fungerer ting som dei skal no? Kan denne feilmeldinga avsluttast? Det er elles same feil som er meldt tidlegare i Bugzilla, og som no finst som #32 . |
Frå @leneantonsen:
Det blir altså bindestrek som eit alternativ til null, og det gjev doble former i teksten som MT genererer. Det er sjølvsagt ikkje ok.
The text was updated successfully, but these errors were encountered: