LU Datorikas fakultātes Bakalaura studiju programmas kurss
- Teksta izgūšana: TextExtraction.ipynb
- Teksta priekšapstrāde: TextPreprocessing.ipynb
- Morfoloģiskā analīze un sintēze: HFST.ipynb
- Teksta izvēršana un savēršana: Thrax.ipynb, Pynini.ipynb
- Latviešu valodas morfoloģiskais analizators un sintezators: TezaursAPI.ipynb
- Rīkkopas universālo atkarību parsēšanai: ParsingUD.ipynb
- N-grammu modeļi: NGram.ipynb
- Word2vec apmācība un lietojums: Word2vec.ipynb
- Teksta klasificēšana: LangID.ipynb, NaiveBayes.ipynb
- Teksta klasificēšana: fastText.ipynb (1-layer, linear) → BERT.ipynb (deep, non-linear)
- Modeļi un demonstrācijas Hugging Face platformā:
- Skatīt Tasks, piemēram:
Feature Extraction
: AiLab-IMCS-UL/lvbertFill-Mask
: google-bert/bert-base-casedSentence Similarity
: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- Vārdšķiru un morfoloģiskā marķēšana (Part of Speech (POS) Tagging): POS_tagging.ipynb
- Nosaukto entitāšu marķēšana (Named entity recognition): NER.ipynb
LU HZF magistra studiju programmas kurss
prof. Inguna Skadiņa
asoc. prof. Normunds Grūzītis
asistents Viesturs Jūlijs Lasmanis
Kursa izstrādi finansē Eiropas Savienības Atveseļošanas un noturības mehānisma investīcija un valsts budžets projekta “Valodu tehnoloģiju iniciatīva” (2.3.1.1.i.0/1/22/I/CFLA/002) ietvaros.