Se i big data non mantengono le promesse di arginare il Covid-19
Alle battute iniziali della pandemia, era convinzione diffusa che, prima o poi, i dati sulla posizione degli smartphone condivisi dalle aziende di tecnologia si sarebbero combinati in modo da fornire una riposta e una soluzione alle problematiche più stringenti, contribuendo in modo concreto a tenere sotto controllo i contagi.
Andrew Schroeder, co-leader del Covid-19 Mobility Data Network, ente senza scopo di lucro costituito da un team di ricercatori e accademici che si è occupato di raccogliere e organizzare i dati sulla mobilità nel periodo pandemico, così commenta: «Nei primi mesi del 2020, le aziende di tecnologia hanno fatto la loro parte, mettendo a disposizione i dati sensibili in loro possesso e lasciando che i ricercatori della salute pubblica li analizzassero per trovare indizi su come tenere sotto controllo il Covid-19. Dopo due anni, è chiaro che i big data non sono la panacea che speravano».
Ciò è dovuto in parte ai tempi della pandemia, protrattasi molto più a lungo del previsto, ma anche al fatto che gli obiettivi di salute pubblica sono andati a collidere con gli interessi commerciali delle aziende fornitrici di dati, tra cui figurano Facebook e altre aziende ad-tech che collegano i clic ai dati sulla posizione.
Nishant Kishore, ricercatore presso il Dipartimento di epidemiologia di Harvard, ha preso parte alla ricerca del Covid-19 Mobility Data Network, lavorando a stretto contatto con le autorità sanitarie pubbliche sui dati ed evidenziandone i limiti dall’interno: «Il contesto è quello di un ecosistema immensamente grande -e opaco- di aziende che generano, acquistano, vendono e modificano set di dati e, sebbene sia utile per i ricercatori avere a disposizione tali dati, purtroppo i criteri di raccolta vengono decisi a monte e sono distanti da quelli della salute pubblica generale».
Ad esempio, la decisione di Facebook di condividere solo metriche di mobilità precalcolate, come la variazione percentuale degli spostamenti e la percentuale di utenti che rimangono a casa, per preservare la privacy, ha reso di fatto impossibile calcolare alcune misure della mobilità, che all’inizio della pandemia i ricercatori pensavano potessero fungere da proxy o input per calcolare i tassi di contatto.
Queste sfide sono ulteriormente complicate dal fatto che ogni azienda tecnologica che ha offerto volontariamente i propri dati, lo ha fatto in un modo diverso, creando a volte metriche di mobilità contrastanti. I dati sulla mobilità sembrano inoltre essere più affidabili e più informativi nelle aree urbane rispetto alle aree rurali, e i ricercatori ritengono che i dati siano distorti anche dall’età e dallo stato socioeconomico. «Facebook ha svolto alcune ricerche, perché dispone di informazioni sull’età, il sesso ecc., per sviluppare un migliore indice di rappresentatività», ha affermato Kishore. «Ma quelle variabili rimarranno nascoste fintanto che i ricercatori potranno consultare solo dati di seconda mano».
Queste limitazioni non hanno comunque impedito a Schroeder e ai suoi colleghi di portare avanti la loro ricerca, utilizzando gli strumenti immediatamente disponibili. La Covid-19 Mobility Data Network si è evoluta in un progetto più ampio chiamato Crisis Ready, finalizzato a sviluppare accordi proattivi di condivisione dei dati con le aziende che acconsentono a raccogliere pipeline di dati che verranno consultati solo se strettamente necessario, come nel caso di una crisi, riducendo di fatto al minimo i rischi per la privacy.
In parallelo, per preservare meglio la privacy durante la condivisione dei dati, sono in fase di test sistemi che aggiungono rumore ai set di dati, in modo da rendere più difficile l’identificazione dei singoli. Cuebiq, società di tecnologia pubblicitaria, sta sviluppando una piattaforma che consente ai ricercatori di analizzare i suoi dati senza fornire loro un accesso diretto. «Quello che è fondamentale, è ricercare il compromesso tra protezione della privacy e potenziali benefici per la salute», ha sottolineato Kishore.
Schroeder è convinto che gli accademici e i funzionari della sanità pubblica non debbano fermarsi davanti al muro che li separa da una potenziale miniera d’oro di informazioni epidemiologiche, ma possano agire proattivamente e impegnarsi a formare e istruire gli organismi sanitari globali in modo che questi ultimi riescano a trarre vantaggio dai dati in espansione, al di fuori dell’angusto ambito della ricerca. E conclude: «Non risponderemo solo con dashboard: in questo ambito necessitiamo di uno sforzo più concertato, finalizzato a creare un livello fondamentale di traduttori di dati in tutto il mondo».
Indietro