Vo workshope sa venujeme knižnici PyParsing. PyParsing je Python knižnica poskytujúca sadu tried, funkcií a metód vhodných na vytvorenie syntaktického analyzátora.
Na aké use casy je PyParsing vhodný Keď potrebujeme parsovať (viac-menej) štruktúrovaný komplikovaný text
- parsovanie z textových súborov, pdf, kníh,...
- extrahovanie dát z webových stránok
- komplexné full textové vyhľadávanie
- čítanie dát z tabuliek
- čítanie komplikovaných log súborov
- čítanie dát z komplikovaných zanorených API štruktúr
- natural language processing
- mnoho iného
Link na prezentáciu k workshopu nájdete tu.
V prvom kroku si nainštalujeme virtuálne prostredie, v ktorom budeme našu aplikáciu vyvíjať a spúštať. Virtuálne prostredie slúži k oddeleniu rôznych inštalácií balíčkov, verzií Pythonu na jednom počítači. Taktiež ak sa niečo v projekte pokazí, ktorý je vytvorený v rámci daného virtuálneho prostedia, neohrozí to ďalšie projekty na počítači.
Úlohy:
-
Otvor si príkazový riadok (terminál - Mac OS, Linux)
-
Zvoľ si adresár, v ktorom budeš mať vytvorený projekt a následne pracovať.
-
Naviguj sa do adresára
-
Vytvor novú složku a vstúp do novo-vytvorej zložky
-
Vytvor virtuálne prostredie. Príkazy pre vytvorenie virtuálneho prostredia sa líšia podľa operačného systému:
Windows:
> py 3 -m venv venv
Linux/Mac OS:
$ python3 -m venv venv
Po vytvorení virtuálneho prostredia je potrebné ho spustiť. . Spustenie virtuálneho prostredia sa taktiež líši podľa operačného systému:
Windows:
>\venv\Scripts\activate
Linux/Mac OS:
$ source /venv/bin/activate
Po spustení by malo ukázať pred >
alebo $
slovo (venv)
.
(venv) MacBook-Pro:pyconworkshop svetlanamargetova$
Na inštaláciu budeme využívať pip.
PyParsing je knižnica umožňujúca napísať nám gramatiku, lexikálne parse v Pythone.
$ pip install pyparsing