#datiBeneComune: una campagna social per rendere i dati COVID-19 accessibili, aperti e interoperabili
Ad un anno dall’inizio della pandemia ancora non risulta garantita dalle istituzioni italiane la massima trasparenza dei dati riguardanti la situazione epidemiologica nazionale. L’accesso al database della sorveglianza integrata (epidemiologica, microbiologica e clinica) è riservato ai soli utenti autorizzati e i dati non sono pubblici, ad eccezione di alcuni resi recentemente accessibili dall’Istituto Superiore di Sanità. La popolazione non può essere chiamata a sottostare passivamente a continue nuove restrizioni, che rendono incerta la quotidianità e alimentano preoccupazioni sul futuro, senza essere correttamente informata sui dati su cui si basano le decisioni, visti anche i sempre più frequenti contrasti e ricorsi tra Governo e Regioni.
Nella società contemporanea avere un’esatta conoscenza e percezione dei dati che ci vengono forniti, permette ad ogni individuo di affrontare in modo adeguato e con responsabilità i problemi che possono affliggere la nostra società. È da questa consapevolezza che nasce la campagna social #datiBeneComune, un’iniziativa per la trasparenza dei dati sull’emergenza sanitaria che, in poco tempo, ha raccolto il sostegno di oltre 160 organizzazioni civiche, aziende, testate giornalistiche e più di 40.000 firmatari per chiedere al Governo di saperne di più sull’evoluzione e la gestione della pandemia che sta ancora duramente colpendo l’Italia. La campagna #datiBeneComune, lanciata il 6 novembre scorso con l’obiettivo di chiedere una maggiore apertura dei dati relativi al COVID-19, è riuscita a coinvolgere un gran numero di cittadini e organizzazioni, perché il tema interessa tante persone e tocca tanti settori diversi.
Le richieste avanzate dai promotori ruotano intorno alla maggiore trasparenza e apertura dei dati comunicati dalle Regioni al Governo dall’inizio dell’epidemia per monitorare e classificare il rischio epidemico; dei dati che alimentano i bollettini con dettaglio regionale, provinciale e comunale, della cosiddetta Sorveglianza integrata COVID-19 dell’Istituto Superiore di Sanità e dei dati relativi ai contagi all’interno dei sistemi, in particolar modo scolastici. Tra le richieste anche quella di rendere pubbliche le evidenze scientifiche, le formule e gli algoritmi, che mettono in correlazione la valutazione del rischio, le misure restrittive e l’impatto epidemiologico ad esso correlato, al fine di informare in maniera trasparente i cittadini e renderli consapevoli delle motivazioni che hanno guidato e stanno continuando a guidare le scelte del Governo.
L’Istituto Superiore di Sanità (ISS) attraverso il Sistema di Sorveglianza Epidemiologica del SARS-CoV-2 predispone e gestisce una specifica piattaforma di raccolta dati che Regioni e Province autonome sono tenute ad alimentare comunicando i propri dati. La responsabilità della Sorveglianza Microbiologica è affidata sempre all’ISS. All’Istituto Spallanzani di Roma è assegnata la sorveglianza delle caratteristiche cliniche dei casi nazionali attraverso apposito database connesso con la piattaforma ISS. La libera condivisione dei dati viene garantita quindi solo attraverso i database dell’Organizzazione Mondiale della Sanità e dello European Center for Disease Prevention and Control. Di conseguenza, i dati della Sorveglianza Integrata non sono resi pubblici completamente, ad eccezione di alcuni resi consultabili recentemente dall’ISS. L’andamento dell’epidemia viene dunque rilevato dal report settimanale dell’ISS che restituisce i dati soltanto in forma aggregata. Dal novembre scorso l’ISS carica quotidianamente un file Excel con alcuni dati, ma l’archivio storico non è mai stato reso disponibile.
In sintesi, gli unici open data consultabili dai ricercatori indipendenti sono quelli del bollettino giornaliero del Ministero della Salute. Questi dati presentano molti limiti. Per ogni Provincia è disponibile il solo numero totale dei casi. I dati riguardanti lo stato clinico e il decorso sono quantizzati solo a livello regionale. Per questa ragione non è possibile effettuare analisi a livello provinciale e comunale relative a nuovi casi, persone in isolamento, guariti, deceduti, tamponi, casi testati, ospedalizzati con sintomi, terapie intensive. Solo dallo scorso dicembre è stato inserito anche il dato riguardante il numero di ingressi giornalieri in terapia intensiva. Risulta così difficile ricostruire i flussi relativi all’evoluzione clinica dei soggetti positivi, conoscendo solo i numeri di posti letto occupati, senza nessuna informazione che riporti il miglioramento o peggioramento dei pazienti. Inoltre, in relazione ai decessi, non viene fornito nessun dato riguardante il luogo e i dati anagrafici dei pazienti, rendendo impossibile qualsiasi analisi sul tasso di mortalità in Italia, tra i più elevati del mondo.
Altra criticità da non sottovalutare è che i dati della pandemia sono forniti dal Ministero della Salute con licenza Creative Commons 2.5, che permette di citarli e riprodurli, salvo che a fini commerciali, ma non consente il loro utilizzo per opere derivate. Questo rende ancora più difficile la gestione dei dati, che andrebbero invece diffusi con altre tipologie di licenze open data, eliminando il divieto di distribuzione di opere derivate. Tutto ciò documenta l’estrema arretratezza e mancanza di cultura del dato aperto nel nostro paese. La pandemia ha messo in evidenza enormi criticità nel sistema di raccolta e accesso ai dati. In questo momento storico una corretta comunicazione, basata sull’evidenza dei dati, che devono essere resi pubblicamente accessibili in formato aperto, ben descritti e interoperabili, risulta fondamentale per comprendere appieno le scelte istituzionali che hanno profonde conseguenze sulla vita dei/delle cittadini/e.