“La professione più sexy del 21esimo secolo”. Così, già qualche anno fa, definiva il data scientist un articolo della Harvard Business Review, intendendo per “sexy” l’avere qualità rare e sempre più richieste: esattamente come i data scientist, costosi da assumere e difficili da trattenere. Una figura che, continuava l’articolo, è come “un ibrido tra un hacker di dati, un analista, un comunicatore e un consulente fidato. Una combinazione estremamente potente e rara.”
Con una definizione così, si capisce perché quella dell’“esperto di dati” sia una tra le professioni informatiche più ambite. Ma che cosa sono esattamente i big data e che cosa vuol dire fare il data scientist?
Che cosa sono i big data e a che cosa servono
“Big data”, ovvero “grandi dati”, informazioni in grande quantità.
Viviamo in un modo pieno di dati che noi stessi produciamo, come sottolinea “Data Never Sleeps 6.0”, il rapporto annuale che mostra, con un’efficace infografica, quante informazioni vengono generate su Internet ogni minuto: per esempio, quasi 13 milioni di messaggi testuali inviati, più di 49 mila foto postate su Instagram, 3 milioni e 800 mila ricerche su Google e 1111 pacchi spediti da Amazon.
Una mole enorme e crescente di dati, che rappresentano una grande ricchezza per le aziende, perché, se adeguatamente raccolti e analizzati, permettono di ricavare modelli di comportamento e di definire e applicare strategie aziendali.
Per capire a che cosa servono i big data, è utile la descrizione di Bigdata4innovation del percorso data driven, ovvero delle diverse fasi di analisi dei dati:
– l’analisi descrittiva, che rappresenta, anche graficamente, una realtà (per esempio un processo aziendale);
– l’analisi predittiva, che esamina i dati attraverso appositi modelli matematici per tracciare i possibili sviluppi futuri della realtà analizzata;
– l’analisi prescrittiva, che, basandosi sulle due fasi precedenti, utilizza strumenti specifici per fornire indicazioni strategiche e soluzioni operative utili per gestire processi decisionali;
– l’analisi automatizzata, che, sempre sulla base delle analisi precedenti, attiva azioni definite da precise regole.
Attraverso le diverse modalità di analisi, le aziende possono dunque ottenere dai big data indicazioni preziose per esaminare i propri processi, per individuarne le criticità e per attuare soluzioni migliorative, per prevedere le prestazioni di un prodotto o servizio o i comportamenti dei consumatori.
Il data scientist: chi è e che cosa fa
Per raccogliere e analizzare i big data e per sapere che cosa farne ci vuole un o una data scientist, una figura che, come dicevamo, non è facilmente definibile, perché riassume in sé molte competenze diverse.
Un articolo di CIO.com, un sito di informazione dedicato ai Chief Information Officer, elenca le abilità essenziali per svolgere il lavoro di data scientist:
- è capace di pensiero critico
- sa programmare in diversi linguaggi
- eccelle in matematica e statistica
- conosce l’intelligenza artificiale, il machine learning e il deep learning
- possiede capacità comunicative e di storytelling (per raccontare che cosa mostrano i dati)
- sa realizzare architetture di dati
- conosce l’ingegneria dei sistemi, l’analisi dei rischi, la gestione dei processi
- ha doti di problem solving e di intuizione
Un mix di competenze non facile da conquistare, ma di sicuro interesse sul mercato del lavoro.
Dove studiare data science in Italia
Il percorso per diventare data scientist inizia all’università, con una laurea triennale in materie scientifiche (generalmente in informatica, matematica o ingegneria), perché i corsi in data science sono quasi tutti magistrali. Esiste per il momento un’unica laurea triennale in Data Science, inaugurata nel 2018, all’Università della Campania di Caserta.
Per le lauree di secondo livello, invece, c’è ampia scelta tra i corsi attivati dagli atenei di tutta Italia.
Offrono una laurea magistrale in Data Science le università di Milano Bicocca, Padova, Trento, Roma La Sapienza; il corso di Milano è in italiano con alcuni insegnamenti in inglese, tutti gli altri invece sono interamente in lingua inglese.
Altre lauree magistrali sono mirate a precisi ambiti di applicazione della scienza dei dati, come l’economia: Data Science and Economics alla Statale di Milano, Data Science and Business Analytics alla Bocconi, Data Science and Business Informatics a Pisa, Data Science, Business Analytics e Innovazione a Cagliari. Tranne quest’ultimo, tutti i corsi sono in inglese.
Hanno invece un taglio più statistico e informatico le lauree magistrali Stochastics and Data Science a Torino e Data Science and Scientific Computing a Trieste (entrambe in inglese) e Informatica Applicata (Machine Learning e Big Data) a Napoli Parthenope (in italiano). Dal 2018 anche l’Università dell’Aquila ha attivato il corso di Data Science Applicata (in inglese).
Infine, ci sono anche due master universitari in Data Science, entrambi in italiano: uno di primo livello a Roma Tor Vergata, l’altro di secondo livello a Bari.
Naturalmente i corsi di laurea, anche magistrale, non sono un punto di arrivo, ma solo di partenza: chi vuole diventare data scientist sa che la formazione e l’aggiornamento continui saranno sempre parte integrante di questa professione.
La Redazione