Analiza języka naturalnego w R

Repozytorium zawiera materiały omawiane w ramach warsztatu Analiza języka naturalnego w R, prowadzonego podczas konferencji Machine Learning@Enterprise 2018 (18 września 2018 r.).

Agenda:

Do czego może przydać się analiza tekstu
Skąd wziąć dane tekstowe
Przygotowanie i podstawowa analiza tekstu
Zagadka kryminalna: kto napisał książkę

Co użytkownik zyska:

Dowiesz się jak przetworzyć tekst w języku R z użyciem stosownych pakietów, wyszukać najpopularniejsze słowa (tf-idf). Spróbujemy znaleźć tematy kilku lektur szkolnych (LDA), porównać język ich autorów i znajdziemy autora nieznanego tekstu.

Wymagania wobec uczestnika:

Zainteresowanie tematyką przetwarzania tekstu
Podstawowa znajomość programowania (R)
Przydatna będzie znajomość pakierów tidyverse i tidytext
Własny komputer z zainstalowanym R/RStudio – dla chcących aktywnie uczestniczyć w warsztacie

Zawartość repo:

prezentacja - folder z prezentacją (treść i pliki)
prezentacja_skrypty - skrypty omawiane podczas prezentacji
data miejsce na dane - ściągnięte albo obliczone
dicts - potrzebne słowniki

Potrzebne pakiety:

manipulacja danymi, wykresy:
- tidyverse (wraz z zależnościami, szczególnie dplyr i ggplot2)
- widyr
- lubridate
- glue
analiza i manipulacja danymi tekstowymi:
- tidytext
- tm
- topicmodels
- text2vec
- lsa
- wordcloud
modele:
- e1071
- randomForest
- xgboost
pobieranie danych:
- rvest
- rtweet
grafy:
- igraph
inne przydatne:
- fs
- ggrepel
- ggridges

Do poczytania przy okazji

Kilka tekstów związanych z tematem warsztatu:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Analiza języka naturalnego w R

Agenda:

Co użytkownik zyska:

Wymagania wobec uczestnika:

Zawartość repo:

Potrzebne pakiety:

Do poczytania przy okazji

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
data		data
dicts		dicts
prezentacja		prezentacja
prezentacja_skrypty		prezentacja_skrypty
README.md		README.md

prokulski/ML_Forum

Folders and files

Latest commit

History

Repository files navigation

Analiza języka naturalnego w R

Agenda:

Co użytkownik zyska:

Wymagania wobec uczestnika:

Zawartość repo:

Potrzebne pakiety:

Do poczytania przy okazji

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages