L'azienda ProfessionAI vuole realizzare una libreria capace di fare analisi delle email ricevute.
Nello specifico, il CEO ha richiesto di identificare le email di tipo SPAM sulle quali fare analisi contenutistiche.
Il CTO nello specifico ti fornisce un dataset e ti chiede di:
-
Addestrare un classificatore per identificare SPAM
-
Individuare i Topic principali tra le email SPAM presenti nel dataset
-
Calcolare la distanza semantica tra i topics ottenuti, per dedurne l'eterogeneità.
-
Estrarre dalle mail NON SPAM le Organizzazioni presenti.