TERZO SETTORE / Fondazioni
La Data Science al servizio delle Fondazioni di origine bancaria
Business intelligence e machine learning possono ricoprire un ruolo centrale anche nelle scelte strategiche delle FOB. Per questo la Fondazione CRC ha avviato una sperimentazione sui temi dello sviluppo sostenibile.
12 giugno 2020

La sera del 7 marzo 2020 la Protezione Civile pubblicava per la prima volta la mappa sul contagio del Covid-19 in Italia e metteva a disposizione su GitHub un repository in cui, da quel momento in avanti, avrebbe aggiornato quotidianamente i dati dell’emergenza sanitaria in corso, dando la possibilità agli utenti di scaricare in formato aperto i datiLa necessità di poter avere dati sempre più aggiornati e precisi, d’altronde, è divenuta una costante presenza nella nostra quotidianità

Le profonde trasformazioni sociali e digitali in atto interrogano anche le fondazioni di origine bancaria, attori nevralgici all’interno del tessuto sociale e territoriale di appartenenza, sulla loro mission e sulle modalità di intervento, spingendole verso un approccio di intervento il più possibile agile, snello e proattivo. Ha senso riflettere, in questo particolare momento, sull’adozione di un approccio data-driven1 per svolgere con più efficacia la propria azione?

Benché ci siano sicuramente situazioni eterogenee tra le varie fondazioni di origine bancaria, la percezione che il patrimonio di dati prodotto all’interno della fisiologica attività istituzionale rimanga in larga parte sedimentato a livello subcosciente appare ancora palpabile. Si parla di dark data, riferendosi a tutti quei dati collezionati, processati e immagazzinati nella attività di business, ma non “capitalizzati” e pertanto impossibilitati a produrre insight utili nei processi di decision making.

Queste considerazioni ci spingono a domandarci se gli approcci, le metodologie e le architetture caratterizzanti la business intelligence e la data science, grazie ai quali i dati aziendali vengono trasformati in patrimonio informativo utile per il proprio business, possano ricoprire anche all’interno dell’attività filantropica delle fondazioni un ruolo nevralgico nelle scelte strategiche e operative, ma anche nei processi di accountability e advocacy.

Partendo da questo presupposto, nell’autunno del 2019, grazie alla collaborazione con la Fondazione CRC, è stato realizzato un primo tentativo in tal senso, esplorando il collegamento tra i progetti presentati dagli Stakeholder della Fondazione e i 17 Obiettivi di Sviluppo Sostenibile (Sustainable Development Goals - SDGs). Fin dall’entrata in vigore dei SDGs era chiaro che la filantropia, istituzionale e non, avrebbe giocato un ruolo chiave nell’implementazione di progettualità orientate ai temi dello sviluppo sostenibile. Pur toccando molte delle tematiche dell’Agenda 2030, la Fondazione non richiamava esplicitamente il framework all’interno del suo piano strategico pluriennale. Per questa ragione, la prima parte dello studio ha avuto una natura prettamente esplorativa2: ai progetti veniva assegnato un punteggio tramite la ricerca di specifiche parole chiave che catturavano complessivamente i singoli obiettivi di sviluppo. Per ogni obiettivo veniva in seguito calcolato un valore soglia: se il progetto oltrepassava questo valore era considerato rilevante per l’obiettivo in questione. Un primo gruppo di progetti potenzialmente rilevanti per i temi dell’Agenda 2030 è stato così individuato, permettendoci di fare una prima analisi esplorativa sulla loro distribuzione. Le aree potenzialmente più interessate dai progetti presentati dalla Fondazione coinvolgono principalmente l’area Persone (424 progetti) e Prosperità (643 progetti) dell’Agenda, con particolare riferimento agli obiettivi 4 (Istruzione di qualità), 8 (Lavoro dignitoso e crescita economica), 10 (Ridurre le diseguaglianze) e 11 (Città e comunità sostenibili). Complessivamente 1154 progetti (un progetto su sei) è risultato rilevante per almeno un obiettivo dell’Agenda 2030. Tra il 2016 e il 2018 il numero di progetti potenzialmente rilevanti raddoppia, segno di un’accresciuta sensibilità verso i temi dello sviluppo sostenibile.

Questa prima fase del lavoro ha avuto il merito di permettere una prima esplorazione dei progetti ma presentava alcune criticità: una soluzione più efficace è stata individuata nel definire il problema in termini di categorizzazione testuale utilizzando una strategia basata sull’elaborazione del linguaggio naturale (Natural Language Processing). Da qui, l’idea di realizzare uno studio pilota per la creazione di un modello che, dato un progetto (documento) e 17 SDGs (classi), permettesse di determinare quali di questi fossero rilevanti per il progetto in input, in maniera molto simile a quanto accade con la nostra posta elettronica (spam/no spam)3.  Per ogni obiettivo è stata quindi stilata una linea guida utile a classificare manualmente un gruppo di progetti-campione come rilevanti o non rilevanti. Tale processo si definisce annotazione ed è stato eseguito per tutti i progetti campionati in riferimento a ognuno dei 17 SDGs: una parte di queste richieste costituirà la base di addestramento su cui il modello cercherà di apprendere delle regole di classificazione (nella fattispecie 17 classificatori), mentre la restante verrà utilizzata per testare le regole apprese. La soluzione adottata, basata su architettura neurale, si è dimostrata adatta per il task di classificazione considerato, anche se è necessario sottolineare che per prestazioni ottimali e applicabili in maniera sistemica occorre disporre di quantità di progetti annotati ben superiori rispetto a quelli utilizzati (almeno di un ordine di grandezza, circa 1000). 

Sarebbe quindi interessante da un lato estendere la sperimentazione in sinergia con altre fondazioni di origine bancaria e organizzazioni sensibili all’Agenda 2030, dall’altro andare oltre il task specifico considerato in questa sede. La sperimentazione accennata in questo articolo ha rappresentato la punta di un iceberg in larga parte inesplorato. Il ricorso alla scienza dei dati potrebbe coadiuvare lo spostamento di focus dai progetti alle organizzazioni, attraverso una segmentazione degli stakeholder delle Fondazioni, al fine di elaborare prodotti e modalità di azione diversificate per le molteplici realtà che popolano il Terzo Settore. Grazie alla condivisione dei dati tra le Fondazioni si potrebbe ricostruire attraverso gli strumenti della network science le relazioni tra gli Enti del Terzo Settore a differenti livelli di granularità (provinciale, regionale, nazionale). Potrebbe inoltre fornire metodi di rappresentazione della conoscenza dei dati testuali in possesso, aumentando il patrimonio informativo delle Fondazioni. Gli stessi processi di monitoraggio e valutazione, in riferimento al protocollo Acri-Mef del 2015, potrebbero contare su strumenti e tools consolidati provenienti da altri ambiti conoscitivi e disciplinari.

Un passaggio di questo tipo presuppone l’adozione di un mindset diverso: Alessando Baricco lo racchiude nel passaggio da una razionalità di tipo novecentesco a una razionalità improntata sulla rivoluzione digitale, caratterizzata da ibridazione dei saperi, visione sistemica e intelligenza collettiva per gestire una realtà fluida e dinamica. Come sappiamo il tempo è sempre poco, i processi da gestire sempre più complessi e la domanda a questo punto non sembra essere tanto se o quando le Fondazioni accoglieranno al loro interno un approccio data-driven, quanto piuttosto come vorranno farlo. Adottarlo in maniera sporadica o integrato sistematicamente? Procedendo da soli e a macchia di leopardo o valutando processi e percorsi strategici condivisi, anche in collaborazione con altri attori pubblici e privati?


Note

Un approccio che Carl Anderson sintetizza in tre caratteristiche principali: “la costruzione di tools, abilità e, soprattutto, di una cultura che agisce basandosi sui dati”.

2 Per questa prima fase esplorativa si è preso spunto dal lavoro di Candela F., Demarie M., Mulassano P., How Foundations Contribute to SDGs: Exploring the Compagnia di San Paolo Initiatives Related to SDGs Through Text Analysis, 2019.

Si ringrazia per la collaborazione Daniele Paolo Radicioni e Davide Colla dell’università degli Studi di Torino. Per una spiegazione dettagliata dell’architettura neurale utilizzata si rimanda a Mensa E., Colla D., Dalmasso M., Giustini M., Mamo C., Pitidis A., Radicioni D. P, ER documents categorization and explanation, 2020.

 


European Social Innovation Academy: quale futuro per l'innovazione sociale in Europa?

Compagnia di San Paolo, la “rivoluzione gentile” verso lo sviluppo sostenibile

Giuseppe Bruno: innovazione dell'offerta e digitalizzazione, la proposta di CGM per far ripartire l'imprenditoria sociale

Dall’innovazione al cambiamento: una nuova sfida per le Fondazioni di origine bancaria

La natura, bene di mercato. Come preservare il Pianeta con i Pagamenti per i servizi ecosistemici

Coronavirus: a Matera nasce una piattaforma digitale per i servizi educativi 0-13