
SHORT MASTER BIG DATA ANALYTICS PER DATI TABELLARI E TESTUALI – CORSO TEORICO PRATICO
Il concetto di Big Data si riferisce all’insieme di tecnologie e pratiche utilizzate per raccogliere, archiviare, analizzare e interpretare grandi volumi di dati, che sono troppo complessi o troppo vasti per essere gestiti con strumenti tradizionali. Questi dati possono provenire da diverse fonti, come social media, sensori IoT, transazioni online, e sono caratterizzati dalle cosiddette “3V” (Volume, Varietà, Velocità), a cui spesso se ne aggiungono altre come Veridicità e Valore. Con il concetto Big Data Analytics ci si riferisce al processo tramite cui si esaminano e analizzano grandi volumi di dati per scoprire pattern nascosti, correlazioni sconosciute, tendenze di mercato, preferenze dei clienti e altre informazioni utili che possono aiutare le organizzazioni a prendere decisioni informate. Questa disciplina combina tecniche avanzate di analisi con l’uso di tecnologie di elaborazione dei dati di ultima generazione per estrarre valore da dati complessi e di grandi dimensioni. In sintesi, Big Data Analytics è una disciplina essenziale per sfruttare al massimo il potenziale dei dati che vengono raccolti. L’uso efficace di queste tecniche può portare a una migliore comprensione del mercato, innovazione e competitività, ma richiede anche l’adozione di tecnologie avanzate e la gestione delle sfide legate alla sicurezza e alla qualità dei dati.
Con queste premesse, Fondazione Democenter in collaborazione con l’Università di Modena e Reggio Emilia, ripropone il corso Big Data Analytics per dati tabellari e testuali in una nuova versione arricchita e rivista di 21 ore totali in presenza, con l’obiettivo di fornire una panoramica tecnica sulle principali metodologie di data mining e machine learning per l’analisi e l’estrazione di conoscenza da dati strutturati tabellari e non strutturati testuali. Il corso si concentra sull’analisi dei dati strutturati (per esempio le tipiche tabelle numeriche con dati transazionali o rilevazione di sensori), utilizzando algoritmi classici di data mining e machine learning con l’ausilio di librerie Python come scikit-learn, pandas e numpy. Il corso approfondisce inoltre l’analisi dei dati testuali (per esempio commenti e descrizione di prodotti), introducendo embeddings per la rappresentazione numerica del testo e tecniche di NLP per l’integrazione dei dati testuali nei modelli di machine learning, sfruttando librerie dell’ecosistema Hugging Face che implementano architetture basate su transformers. La terza giornata invece consisterà in un approfondimento verticale sul machine learning in produzione. I partecipanti acquisiranno competenze teoriche e pratiche fondamentali per l’applicazione di tecniche di machine learning e data mining a problemi reali di analisi dati in ambito aziendale.