L’obiettivo del corso è quello di fornire agli studenti le conoscenze fondamentali per comprendere le esigenze delle organizzazioni e di rispondervi attraverso la produzione di informazione di supporto alle decisioni ottenute attraverso l’analisi delle grandi quantità e varietà di dati accumulati nel tempo.
ll corso offre un’introduzione ai concetti fondamentali di data mining e data management, illustrando i principali scenari applicativi e le fasi che caratterizzano il processo di scoperta della conoscenza dai dati. Vengono approfonditi i concetti di data warehousing, evidenziando le differenze rispetto ai tradizionali sistemi di basi di dati, e analizzandone l’architettura e le modalità di gestione delle informazioni. Una parte significativa del programma è dedicata alle tecniche di apprendimento supervisionato, con particolare riferimento alla classificazione mediante alberi decisionali, classificatori bayesiani e support vector machine. A seguire, si affrontano i metodi di apprendimento non supervisionato, tra cui il clustering, la generazione di regole associative e la rilevazione di outlier. Il modulo sul text mining introduce le principali metodologie di analisi automatica dei testi, presentando gli algoritmi e gli strumenti utilizzati per l’elaborazione del linguaggio naturale. Viene inoltre affrontato il tema dell’intelligenza artificiale, con un focus sui modelli di deep learning e sulle modalità di utilizzo pratico di tali modelli nei diversi contesti applicativi. Il corso si completa con un’introduzione ai big data, analizzandone la definizione, le caratteristiche principali e gli strumenti più diffusi per la loro gestio