-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Grammar: det er forskjeller mellom trace-mode og divvun-checker #38
Comments
Siktar du til at det står to forslag i trace-output? I så fall er det berre det at divvun-checker i json-mode vil fjerna duplikat frå lista (ser ut som generatoren gav to strengar for giehtja+Num+Sg+Par) |
divvun-checker får ikke med seg dajs-feilen |
Åh, hehe :) Kan du visa output før divvun-suggest-steget? Viss du køyrer |
|
Det ser ut som det er lenge sidan
Kan du lasta opp zcheck-fila så eg kan samanlikna? (Kva betyr forresten setninga? mt-testing via sme gav |
Du finner en smj.zcheck der "dajs" ikke merkes opp her: https://www.dropbox.com/scl/fi/rzlkjqdzwce091f3rtra7/smj.zcheck.zip?rlkey=vb3d959i86lm3ir0r6qsj5vpm&dl=0 |
Betydning: I alle disse sju utkantsområdene er det mye utflytting |
… ahem. Eg får reprodusert feilen med divvun-checker, men så blir det rett når eg unzipper fila og køyrer pipelinen med json output
|
… forskjellen kjem av at CG-en køyrer i trace:
Nyaste libdivvun sender
tippar suggest har ein bug med matching av feilkodar i CG-output |
@ilm024 Den er markert Med det sagt, så burde kanskje |
Nå tar det av med samme problem igjen: Test 78/78: Valla såjttij dat giergge báhtsám mij ij vuojnnum.tools/grammarcheckers/tests/REL-msyn-soajtta-PASS.yaml uit-mac-219:lang-smj ilm024$ echo "Valla såjttij dat giergge báhtsám mij ij vuojnnum." | tools/grammarcheckers/modes/trace-smjgram-dev.mode -R |
@ilm024 prøvde du å legga inn LEFT-relasjon på den opprinnelege setninga? Altså ein ADDRELATION LEFT frå gietjav til dajs |
Er det det som gjør at yaml failer selv om Gramchecker foreslår rett? |
Veit ikkje kva som skjer i yaml-en, men etter det eg forstod blei det feil med |
Her er output fra divvun-checker:
|
|
Aha, same problem: vuojnnum er markert |
Eg la inn ei endring i libdivvun som gjer at du kan skriva |
Så må vi endre i yaml-testene? Slik at slike feil som gjelder flere ord bare markeres som en feil? |
Eg veit ikkje korleis yaml-testane fungerer, men generelt er det slik at når fleire ord skal endrast som ein del av eitt retteforslag, så må ein velja éitt ord til å vera det «sentrale», og det må ha relasjon RIGHT/LEFT mot dei andre (som er tagga COERROR). |
En test er en setning der feilene er merket opp, med retteforslag. Den konverteres til json á la divvun-checker sitt format. Deretter sendes den originale, urettede versjonen av setningen gjennom divvun-checker, og testeprogrammet sammenligner om de oppmerkede feilene er på samme plass som divvun-checker mener de er. Om de er det, sjekker testeprogrammet om divvun-checker sitt forslag inneholder den korrekte formen som står i feiloppmerkingen i testen. Om alt stemmer blir det tommel opp. |
Eg antar testane alltid plukkar «første» forslag, og ikkje bryr seg om ei retting er delt i to retteforslag vs. eitt som dekker fleire ord? |
Tja, jo, kanskje … Men i alle fall, om vi tar eksemplet som Inga har her ovenfor: Den oppmerkede setningen ser slik ut: For at det skal bli tommel opp, må svaret fra divvun-checker ha en flik som ser ut noe á la dette: [
"vuojnnum",
41,
50,
"co-error-kode",
"co-error-kode",
[
"vuojnnu"
],
"co-error-kode"
] Og for å få blåstrek i LibreOffice, så må vel divvun-checker produsere noe slikt? |
Ja, men den kan gi 1 blåstrek over heile ij vuojnnum eller 2 ulike blåstrekar, éin på ij og éin på vuojnnum slik at det er mogleg å retta dei uavhengig av kvarandre. Bryr yaml-testane seg om den forskjellen? |
@unhammer koffor må vi legge inn LEFT? Æ trudde LEFT og RIGHT brukes bare med ADDCOHORT, ihvertfall sier dokumentasjonen det. Vi laga |
Det samme skjer om vi skriv:
Det er ikkje det vi vil ha, dvs. det som står etter "vuojnnum"-kohorten vil vi ha på "ij"-kohorten (bortsett fra at vi ikkje ønsker "ittjijojnnu"), og det som står etter "ij"-kohorten vil vi ikkje ha separat. Hvorfor går det galt @unhammer ? |
Etter mitt syn (men eg har ikkje vore så djupt involvert i dette, så kanskje eg legg for mykje i det), så burde denne strukturen i feiloppmerkinga:
Men eg veit ikkje om det er logikken som andre har fylgt. |
Oppmerking som følger @lynnda-hill sitt eksempel fra
og det skal yaml-testen kunne håndtere om divvun-checker svarer med noe á la (i en blåstrek): [
"ij vuojnnum",
38,
50,
"co-error-kode",
"co-error-kode",
[
"ihttji vuojnnu"
],
"co-error-kode"
] |
hvorfor skal "ij" markers som "egen" feil, men ikkje "vuojnnum"? (Ser altså scopinga, men hvorfor er det likevel bare ett ord som markeres selvstendig?) |
Slik jeg forstår logikken, så er |
Poenget her er at det som er lengst til høyre i en oppmerkingssgruppe bør være det som kommer ut av divvun-checker som et av retteforslagene og at området feilen ligger i må samsvare både i oppmerkingen og svaret fra divvun-checker. |
$ echo "Valla såjttij dat giergge báhtsám mij ij vuojnnum." | divvun-checker -a smj.zcheck -n smjgram |jq .
divvun-suggest: WARNING: No <description> for "msyn-sme_interference_neg" in xml:lang 'smj', trying 'en'
divvun-suggest: WARNING: No <description> for "msyn-sme_interference_neg" in any xml:lang
{
"errs": [
[
"såjttij",
6,
13,
"typo",
"Báhko \"såjttij\" la vuojnnet boasstot tjáleduvvam.",
[
"såjtij",
"sujttij",
"såttij",
"såjådij",
"såjdij",
"sujttit",
"sujtti",
"såjij",
"sujttiji",
"sujttim"
],
"\"såjttij\" la vuojnnet boasstot tjáleduvvam"
],
[
"ij vuojnnum",
38,
49,
"msyn-sme_interference_neg",
"msyn-sme_interference_neg",
[
"ittjij vuojnnu"
],
"msyn-sme_interference_neg"
]
],
"text": "Valla såjttij dat giergge báhtsám mij ij vuojnnum."
} Dette burde bli rett no? |
men så....
The text was updated successfully, but these errors were encountered: