Studiare la corruzione con un approccio data driven

Nell’articolato processo di un’analisi dati, una delle sfide più importanti riguarda l’identificazione dei fenomeni da misurare. Non basta avere i dati e la tecnologia per processarli. Prima del “come” dunque, è fondamentale chiedersi il “cosa”. Non tutti i fenomeni sono facilmente misurabili, ma non per questo meno interessanti da indagare. Il concetto di corruzione è senz’altro un ottimo esempio di un fenomeno che interessa e riguarda moltissimi attori (sia pubblici che privati), la cui indagine però si configura come una sfida complessa. 

Formalizzare il concetto di corruzione è condizione necessaria se l’intento è quello di manipolarlo con tecniche di data analysis, consapevoli del fatto che non esiste ad oggi una formula che definisce l’atto illecito in maniera univoca.

Proprio per questo, la sfida si configura come particolarmente impegnativa, anche perché il “fenomeno corruzione” è difficile da osservare, dal momento che entrambi gli attori coinvolti ottengono dei vantaggi dall’atto illecito, non avendo così alcun incentivo a portare alla luce l’accordo. 

I metodi classici per misurare la corruzione si basano su indicatori soggettivi o oggettivi; entrambi però presentano alcuni limiti che riducono la loro applicabilità. 

La svolta potrebbe arrivare dal considerare l’enorme patrimonio informativo pubblico che istituzioni come l’Autorità Nazionale Anticorruzione (ANAC) mettono a disposizione dei cittadini, delle imprese e dei centri di ricerca. I dati diventano quindi alleati in questa sfida, stimolando e supportando nuovi metodi di misurazione della corruzione. 

Su queste basi, in collaborazione con Simone Del Sarto, ricercatore post-doc al Dipartimento di Statistica, Informatica, Applicazioni “Giuseppe Parenti” dell’Università di Firenze, la Prof.ssa di Statistica Applicata Michela Gnaldi del Dipartimento di Scienze Politiche dell’Università di Perugia e il Prof. di Informatica Paolo Coppola del Dipartimento di Informatica dell’Università di Udine, abbiamo scritto un paper e sviluppato del codice in cui viene proposto l’utilizzo di una serie di indicatori “red flag”: indicatori in grado di “alzare una bandierina rossa” tutte le volte che un appalto pubblico viene identificato come potenzialmente a rischio di corruzione. In questo modo, grazie all’analisi dati, il sistema viene allertato ogni qualvolta si verificano determinate condizioni ritenute negative.

Gli indicatori sfruttano i dati della Banca Dati Nazionale dei Contratti Pubblici (BDNCP) italiana. Tra gli intenti del lavoro vi è quello di mostrare alle organizzazioni come si possa studiare la corruzione con un approccio data driven, inedito per la letteratura accademica, che ad oggi è costituita in larga misura da contributi di carattere economico-giuridico più che tecnologico. 

L’obbiettivo finale non vuole essere quello di costruire una black box deterministica in grado di stabilire se una data pubblica amministrazione sia corrotta o meno, ma realizzare viceversa uno strumento trasparente, di supporto al processo di decision making di dirigenti, istituzioni pubbliche e organizzazioni private.

A partire da questo lavoro si intravedono diversi possibili sviluppi. Tra tutti ne segnaliamo due: da un lato vi è un’enorme necessità di lavorare sulla data quality e sulla data governance dei dati contenuti nella BDNCP, dall’altro vi è la possibilità di utilizzare tecniche più avanzate di analisi, come ad esempio l’anomaly detection.

Il contributo fin qui realizzato è stato apprezzato sia a livello nazionale sia a livello internazionale. Verrà infatti presentato alla 50esima edizione della conferenza organizzata dalla Società Italiana di Statistica (SIS 2021 – Pisa, 21-25 giugno 2021) e all’interno di un ciclo di webinar organizzato dal “Competence Center on Composite Indicators and Scoreboards” della Commissione Europea (Webinar 20 maggio 2021).

La lotta alla corruzione passa sempre di più per l’utilizzo intelligente della scienza dei dati.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *