Šī ir latviešu valodas seno tekstu korpusa iztrādes vide: atvērto datu un atvērtā pirmkoda repozitorijs.
Lietotājiem paredzētā publiskā vide ir brīvi pieejama Korpuss.lv platformā: korpuss.lv/id/Senie.
Sources
- korpusa avotu faili un statistika.Docs
- topošā korpusa dokumentācija, specifikāciju faili.TEI
- korpusa dati, pārveidoti TEI formātā.Indexing
&Unicoding
- korpusa apstrādes rīki.DB
&Web
- ar korpusa tīmekļa vietni senie.korpuss.lv saisītais materiāls, datu medelis un saskarnes pirmkods (daļēji novecojis, pārejot uz NoSketch Engine platformu).
Korpusa dati ir pieejami ar CC BY-SA 4.0 licenci.
Korpusa programmrīki ir pieejami ar GPLv3 licenci.
LU Matemātikas un informātikas institūts
LU Latviešu valodas institūts