Skip to content

kopecp/WarsztatPythonDataScience

 
 

Repository files navigation

Program Semestru

1. Język Python 1

  • podstawowe elementy składni

  • struktury danych

  • Środowisko pracy do pracy z danymi – anakonda, jupyter, biblioteki i moduły

2. Język Python 2

  • instrukcje sterujące

  • obsługa błędów

  • Korzystanie z pythona – notebooks, skrypty

3. Data Wrangling 1

  • Tidy Data – co to jest

  • Data wrangling, munging, tidying

  • Biblioteka Pandas – wprowadzenie. Czytanie danych

4. Data Wrangling 2

  • Data Wrangling w praktyce – podstawowe operacje

  • Biblioteka Pandas – wybieranie kolumn i „krojenie danych”

5. Data Wrangling 3

  • Czyszczenie danych

  • Pandas – agregacja, grupowanie

6. Wizualizacja danych 1

  • Matplotlib – wprowadzenie

  • Proste wykresy

  • Konfiguracja wykresu, sztuczki i kruczki

7. Wizualizacja danych 2

  • Seaborn – wprowadzenie

  • Różnice i podobieństwa do Matplotlib

  • Dash by Plotly - interfejsy webowe

8. Zewnętrzne źródła danych

  • Pojęcie API i korzystanie z nich. JSON

  • Samodzielne pobieranie danych

9. Scraping

  • Biblioteka Scrapy

  • Biblioteki Beautiful Soup, lxml

  • Ściąganie danych z sieci

10. Machine Learning 1

  • Klasyfikacja w ML

  • Biblioteka scikit

11. Machine Learning 2

  • Metryki skuteczności optymalizacja modeli

  • Trening klasyfikatorów w scikit

12. Machine Learning 3

  • Wybór optymalnego modelu

  • Badanie charakterystyk modeli

  • Grid search w scikit

13. Machine Learning 4

  • Regresja w ML

  • Regresja w Scikit

14. Wprowadzenie do maszynowego przetwarzania tekstu

  • Specyfika danych tekstowych

  • Postawowe metryki dla danych tekstowych

  • Klasyfikacja dokumentów w Scikit.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%