Shuyi Yang

Sono laureato in matematica e sono un data scientist del Big Data Lab (Direzione Data Office) di Intesa Sanpaolo.

Che cosa vuol dire essere un data scientist? In generale, uno scienziato dei dati cerca di estrarre il valore dalle grosse quantità di dati (big data) attraverso l'uso di tecniche statistiche e algoritmi di machine learning. Questi ultimi non sono però sufficienti, ci vogliono, infatti, anche le persone in grado di gestire le infrastrutture tecnologiche adatte alla raccolta e all'elaborazione dei dati, gli sviluppatori in grado di trasformare algoritmi in codici in maniera efficiente e stabile, gli esperti di dominio che abbiano una conoscenza profonda del problema sotto esame e che sappiano tradurre il problema del mondo reale in termini quantitativi, e infine, ma non meno importanti, i comunicatori che sappiano spiegare al grande pubblico l'essenza dei risultati in modo conciso ed efficace. Questo è il motivo per cui preferisco definirmi un "aspirante data scientist", in quanto non si smette davvero mai di imparare in questo ambito

Tornando al mio lavoro, il nostro compito è di migliorare i processi interni della banca attraverso tecniche di analisi statistiche e algoritmi di machine learning. L'ambiente di lavoro è molto giovane (l'età media è sotto i 30 anni) e dinamico (i miei colleghi provengono da diversi ambiti di studio: matematica, fisica, informatica, ingegneria, economia, ecc.). Si lavora in team su progetti che durano in media 4 mesi, chiamati use case. Ogni use case è formato da diverse fasi (non per forza sequenziali) che vanno dalla comprensione dei processi esistenti alla formulazione del problema in termini quantitativi, dalla raccolta e analisi dei dati alla costruzione di modelli predittivi, dal test delle performance alla messa in produzione del progetto. Alla fine di ogni use case si cambia team e si cambia anche l'ambito della banca in cui fare il progetto: da un giorno all'altro, per esempio, si può passare dalla costruzione di un algoritmo che ottimizza il lavoro dei gestori dei crediti deteriorati (fornendo una stima della probabilità di recupero delle pratiche) all'implementazione di un sistema di raccomandazione dei prodotti per i clienti della banca (simile a quello usato da Amazon per suggerire nuovi prodotti ai suoi utenti). Data l'estrema varietà degli use case, ogni giorno si imparano nozioni nuove, si incontrano problemi inattesi ma stimolanti, e si lavora in squadra per trovare la migliore soluzione nel minor tempo possibile. Tutto ciò rende il mio lavoro fantastico!

Torniamo, però, un attimo indietro nel tempo: come sono arrivato a fare il data scientist?

Mi è sempre piaciuta la matematica fin da quando ero piccolo ma ho cominciato ad amarla durante gli anni liceali quando partecipai per la prima volta alle Olimpiadi della Matematica. Rimasi folgorato da quanto la matematica che va oltre al solito programma scolastico possa essere divertente e profonda.

Nel settembre del 2011, superato l'Esame di Stato, mi iscrissi, senza troppi ripensamenti, al corso di Laurea in Matematica dell'Università di Torino. Nello stesso anno vinsi una borsa di studio triennale dell'Istituto Nazionale di Alta Matematica e iniziai anche a lavorare come allenatore del corso di preparazione alle Olimpiadi della Matematica del mio ex liceo, G. Bruno.

Gli anni universitari passarono veramente in fretta. Scelsi l'orientamento teorico alla triennale. Sono sempre stato convinto che la matematica, ancora prima di essere una materia di studio, sia una forma d'arte. Negli ultimi anni dell'università, però, crebbe in me l'idea che l'arte non debba per forza essere solo contemplativa ma anche utile e concreta, così optai per la specializzazione in probabilità e statistica alla magistrale e, durante gli stessi anni, fui ammesso anche al "Allievi Honors Program" del centro di ricerca "Collegio Carlo Alberto" (un programma di studio universitario e parallelo, incentrato su economia e statistica). Guardando indietro, definirei questi anni "intensi" sia dal punto di vista della formazione (i corsi del collegio completavano quelli dell'università) sia dal punto di vista della crescita personale (ho imparato a conoscere i miei limiti e a gestire lo stress).

Nell'ottobre del 2015, su segnalazione del dipartimento di matematica, fui ammesso a un progetto di ricerca interdisciplinare fra Università di Torino e Intesa Sanpaolo, venni a contatto in modo pratico con le tematiche legate al big data e realizzai che molti argomenti trattati nelle aule universitarie potevano essere applicati nel mondo reale: è l'inizio della mia carriera da data scientist. La dea bendata però mi aveva riservato un'altra sorpresa. Qualche mese più tardi, nel febbraio del 2016, grazie al Collegio Carlo Alberto, venni a conoscenza del fatto che l'istituto IGIER dell'Università Bocconi stava cercando candidati per un progetto sempre con Intesa Sanpaolo: l'implementazione di un sistema di early warning basato sull'analisi delle reti delle aziende corporate. Partecipai al colloquio senza troppe aspettative ma, inaspettatamente, venni assunto come research assistant e chiamato a lavorare, come esterno, nel Big Data Lab. Qui conobbi il mio attuale capo che qualche mese più tardi mi avrebbe proposto di lavorare direttamente per Intesa Sanpaolo. Nell'estate dello stesso anno, completai il mio percorso di studi universitari con una tesi sui grafi aleatori, sia all'Università di Torino che al Collegio Carlo Alberto (ricevendo da quest'ultimo anche un Master in Economics) e iniziai subito a lavorare nel Big Data Lab.

Ammetto di aver avuto un pizzico di fortuna nel mio percorso ma sono certo che un qualunque laureato in matematica possa cavarsela altrettanto bene nel mondo del lavoro perché la predisposizione al problem solving, l'attenzione ai dettagli e la capacità di astrazione sono armi formidabili contro le sfide di questo secolo.