ISS
L'epidemiologia per la sanità pubblica
Istituto Superiore di Sanità
Epidemiologia per la sanità pubblica - ISS

Indice: Boll Epidemiol Naz 2021;2(2)

Una piattaforma europea per il monitoraggio delle conversazioni sui vaccini su web e social network

Caterina Rizzoa , Francesco Gesualdoa, Barbara Lanfranchia, Roberto Armenia, Maria Cristina Rotab, Antonietta Filiab

 

 
aOspedale Pediatrico Bambino Gesù, IRCCS, Roma
b Dipartimento di Malattie Infettive, Istituto Superiore di Sanità, Roma

 

Citare come segue: Rizzo C, Gesualdo F, Lanfranchi B, Armeni R, Rota MC, Filia A. Una piattaforma europea per il monitoraggio delle conversazioni sui vaccini su web e social network. Boll Epidemiol Naz 2021; 2(2):7-15. DOI: https://doi.org/10.53225/BEN_014

 

 

A European dashboard for monitoring vaccine conversations on the web and social networks

Introduction

The European Joint Action on Vaccination (EU‐JAV) is a European project that aims at spurring long‐lasting European cooperation against vaccine‐preventable diseases. In the context of the EU-JAV’s Work Package 8, the Italian National Institute of Health, in collaboration with the Bambino Gesù Children’s Hospital (Rome, Italy), developed a web platform designed to monitor vaccination discourse on the web and on social media.

 

Materials and methods

We collected data on vaccine-related content from Twitter, Reddit, Wikipedia and Google Trends, through validated keyword filters, in Italian, French and Spanish. The platform’s analysis layer included two machine learning-based algorithms: the influencer analysis, aimed at identifying the most influential users involved in the vaccine discourse; and the early-signal detection, used to identify new hashtags emerging in the conversation.

 

Results

The web and social media monitoring platform has been online for the EU-JAV members since July 2020, and displays trends of vaccine-related tweets, most used hashtags, influencer maps, clicks on Wikipedia vaccine pages and Google searches on the vaccine topic. From November 19th, 2019 to April 30th, 2021, we downloaded a total of 6,963,162 tweets. The number of vaccine conversations increased dramatically with the beginning of the pandemic (from 300 to around 3,000 daily tweets) and continued to increase, reaching its peak around the European Vaccine Day in December, 2020 (95K tweets) and during European Medicine Agency assessment process of the trombosis cases after receiving Vaxzevria.

 

Conclusions

The EU-JAV’s web and social media monitoring platform represents a model tool that could be used to integrate traditional systems for surveillance of vaccine coverages and the evaluation of vaccination programmes in Europe.

 

Key words: vaccine-preventable diseases; social media monitoring; vaccine stance

 

 

Introduzione

La European Joint Action on Vaccination (EUJAV) è un progetto europeo, finanziato dallo European Union’s Health Programme, che mira a promuovere una stretta collaborazione a livello europeo per combattere le malattie prevenibili con i vaccini (1). La EU-JAV mette insieme molte istituzioni che si occupano di servizi per la salute e politiche di vaccinazione, quali la Commissione Europea, ministeri della salute, organizzazioni internazionali, università e istituti di 20 Paesi diversi e vari stakeholder, inclusi società civile e rappresentanti dell'industria.

 

Il progetto è organizzato in 8 work package (WP) con diversi obiettivi: l’analisi dei fattori che portano all’esitazione vaccinale, la condivisone delle migliori pratiche per migliorare l’adesione alle vaccinazioni in Europa, il miglioramento delle attività di sorveglianza delle coperture vaccinali, il design di un data warehouse concept europeo per la condivisione di dati su fabbisogno e distribuzione dei vaccini all’identificazione delle priorità della ricerca sui vaccini.

 

Il WP8, coordinato dall’Istituto Superiore di Sanità (ISS) e dall’Istituto Finlandese per la Salute e il Welfare (THL) si focalizza sul miglioramento dell’accettazione dei vaccini nella popolazione, con tre principali obiettivi:

  • eseguire una mappatura degli strumenti utilizzati da Stati membri, stakeholder e comunità scientifica per identificare i determinanti di alte o basse coperture vaccinali;
  • sviluppare dei meccanismi di divulgazione di best practice e di conoscenza scientifica negli Stati membri;
  • monitorare la fiducia nei confronti dei vaccini su web e social media.

L’esitazione vaccinale viene definita dall’Organizzazione Mondiale della Sanità (OMS) come “ritardo o rifiuto della vaccinazione, nonostante la disponibilità di servizi vaccinali” (2) ed è considerata dall’OMS una minaccia per la salute globale (3). Negli ultimi anni la sovrabbondanza di informazioni presenti online sui vaccini, accompagnata spesso alla condivisione di dubbi, paure e fake news, ha avuto un ruolo importante nella riduzione della fiducia della popolazione nei confronti dei vaccini (4). Per questa ragione, il monitoraggio delle ricerche sul web e delle conversazioni sui social media riguardanti i vaccini rappresenta una importantissima fonte di informazioni che dovrebbe integrare la tradizionale sorveglianza delle coperture vaccinali e le tecniche di valutazione dei programmi vaccinali a livello locale ed europeo.

 

La mappatura della conversazione online sui vaccini, sia da un punto di vista quantitativo che qualitativo, è uno strumento imprescindibile per comprendere la posizione degli utenti riguardo i vaccini, studiare le comunità coinvolte nel discorso e intercettare precocemente la diffusione di fake news, con l’obiettivo di controllare e contrastare la loro diffusione (5).

 

L’ISS, in collaborazione con l’Ospedale Pediatrico Bambino Gesù di Roma, ha sviluppato, per il WP8 dell’EU-JAV, una piattaforma online per la raccolta e la visualizzazione in tempo reale di dati da alcuni social network, motori di ricerca, pagine web, con lo scopo di tracciare la conversazione online sulle vaccinazioni, mappare le comunità coinvolte, identificare temi emergenti, intercettare i contenuti più condivisi e le richieste informative degli utenti. In questo articolo verrà descritta la metodologia seguita per lo sviluppo della piattaforma europea e verranno presentati i dati relativi all'Italia.

 

Materiali e metodi

La piattaforma EU-JAV per il monitoraggio del web e dei social media sui vaccini è stata finanziata con il grant n. 801495 della Consumer, Health, Agriculture and Food Executive Agency (CHAFEA).

 

Fonti di dati

Sono stati utilizzati dati disponibili online, in base alla disponibilità e alle normative relative alla privacy (Tabella 1). In particolare, sono state prese in considerazione diverse fonti di dati: Twitter, che è il social media con la politica di fruizione dei dati più aperta; Reddit, una piattaforma sociale ancora poco usata in Italia ma molto popolare in altri Paesi, in particolare Regno Unito e Stati Uniti; Wikipedia, popolare enciclopedia collaborativa del web, sempre ai primi posti sulle pagine dei risultati di Google; Google Trends, che riporta il volume delle ricerche degli utenti sul popolare motore di ricerca, quindi un proxy attendibile dei loro interessi.

 

 

Design della piattaforma e analisi dei dati

La piattaforma di monitoraggio delle conversazioni sui vaccini è stata, in questa fase iniziale del progetto, sviluppata in tre lingue: italiano, francese e spagnolo.

 

La piattaforma, accessibile tramite credenziali, monitora i flussi di informazione da Twitter, Reddit, Wikipedia e Google Trends in tempo reale. La piattaforma permette la raccolta, l’analisi, l’aggregazione e la visualizzazione dei dati estratti dalle diverse fonti. Questo è possibile grazie alla costruzione della piattaforma su tre diversi livelli (layer): il Data layer, l’Analysis layer e il Visualization layer.

 

Il Data layer raccoglie costantemente dati grezzi dal web e dai social media, li pre-processa tramite uno screening iniziale e una prima pulizia del dato grezzo, ottenuto tramite le relative Application Programmer Interface, API: Twitter API, Reddit API, Google Trends API. Per la raccolta dei dati sono stati utilizzati dei filtri di parole chiave creati e validati tramite un framework strutturato, sulla base di criteri di ricorrenza e pertinenza (6).

 

L’Analysis layer ha la funzione di analizzare il dato processato e pulito tramite la generazione di grafici, rendendo quindi comprensibili i dati estratti e mettendoli in relazione tra loro. Su questo layer hanno luogo i processi che permettono di geolocalizzare i tweet, e due processi basati su algoritmi di machine learning: l’Influencer analysis e la Early-signal detection:

  • l’Influencer analysis permette di individuare gli utenti più influenti e più attivi nella conversazione sui vaccini su Twitter, con lo scopo di monitorare i “nodi” cruciali delle comunità coinvolte, sia nelle comunità favorevoli ai vaccini, sia nella comunità dei no vax;
  • l’Early-signal detection permette l’intercettazione di utenti che usano nuovi hashtag, quindi utenti nuovi al tema dei vaccini. L’hashtag (che si crea inserendo il tasto # davanti alla parola o frase desiderata, ad esempio, #vaccini oppure #iononmivaccino) è uno strumento che serve come aggregatore tematico su alcuni social network ed è stato introdotto da Twitter come segnale di parole chiave e per richiamare l’attenzione degli utenti su alcune parole o temi particolari.

Il Visualization layer infine permette la visualizzazione dei risultati, rende le informazioni estrapolate comprensibili e le comunica in maniera semplice ma rappresentativa, in modo da poter comprendere più facilmente i dati visualizzati.

 

I risultati descritti di seguito si riferiscono esclusivamente alla sezione della piattaforma relativa all’Italia.

 

Risultati

La piattaforma EU-JAV per il monitoraggio della conversazione sui vaccini su web e social media è attiva dalla fine del 2019 e disponibile ai membri della EU-JAV da luglio 2020. La piattaforma è articolata nelle seguenti sezioni:

  1. la barra selezione dati: in questa sezione è possibile selezionare la nazione di provenienza dei tweet (tra Italia, Francia o Spagna) e il periodo di riferimento (di default vengono mostrati i dati relativi all’ultimo mese);
  2. il trend dei tweet: in questa sezione viene mostrato un grafico a barre relativo al periodo di riferimento, nel quale ogni barra corrisponde ai tweet giornalieri. Viene calcolata automaticamente la mediana del numero di tweet pubblicati nel periodo selezionato, visualizzata con una linea nera. Muovendo il cursore sopra ogni barra viene visualizzata una lista dei 10 hashtag più utilizzati nel giorno specifico, con relativa frequenza di ognuno (Materiale Aggiuntivo - Figura 1);
  3. i 5 tweet più retwittati nel periodo selezionato (funzione disponibile dal 30 marzo 2021);
  4. i 10 utenti più attivi, in termini di numero di tweet originali e numero di retweet;
  5. una word cloud con gli hashtag più utilizzati;
  6. i maggiori influencer nella conversazione sui vaccini;
  7. il trend del numero di click relativi all’argomento vaccini, sulle pagine Wikipedia (Materiale Aggiuntivo - Figura 2);
  8. il trend dei volumi relativi normalizzati delle ricerche su Google sull’argomento “vaccino” e una heat-map con i dati regionali (Figura 1);
  9. le parole chiave più utilizzate su Google Search per ricerche relative all’argomento “vaccino” (Figura 1);
  10. i post su Reddit con il maggior numero di commenti positivi nel periodo selezionato.

 

Per scaricare i dati è stato messo a punto un filtro di ricerca che includeva le seguenti parole chiave: vaccino, vaccini, vaccinazione, vaccinazioni, vaccinato, vaccinata, vaccinati, vaccinate, immunizzazione, immunizzato, immunizzata, immunizzati, immunizzate, no vax, anti vax. Ciascuna delle parole chiave sopra riportate aveva una frequenza mensile superiore alle 100 ricorrenze e permetteva di intercettare più dell’85% di tweet pertinenti. La piattaforma ha permesso di scaricare, dall’inizio dell’attività, circa 15 milioni di tweet postati da utenti italiani, francesi e spagnoli. I tweet italiani scaricati nello stesso periodo sono stati 6.963.162.

La Figura 2 riporta il trend dei tweet mensili, suddivisi in 4 diversi periodi:

  • prima fase pre pandemia: dal 19 novembre al 30 gennaio 2020 (data in cui l'OMS ha dichiarato l’epidemia da coronavirus "Public Health Emergency of International Concern");
  • seconda fase: prima ondata di COVID-19 (31 gennaio-13 settembre 2020);
  • terza fase: seconda ondata fino all’esecuzione del primo vaccino (14 settembre-26 dicembre 2020);
  • quarta fase: dal primo vaccino (27 dicembre 2020-30 aprile 2020).

 

Nella prima fase, sono stati scaricati 33.994 tweet, con una media giornaliera di 309 (DS 285,7); nella seconda fase i tweet scaricati sono stati 1.056.236 (media giornaliera 4.612,4; DS 3.248,7); nella terza fase 973.269 (media giornaliera 9.358,4; DS 7.209,8); nella quarta fase 5.596.427 tweet (media giornaliera 38.331,7; DS 19.263,6).

 

Nei primi mesi di monitoraggio, tra novembre 2019 e gennaio 2020, la conversazione sui vaccini si è mantenuta su una media giornaliera di circa 300 tweet al giorno, per poi aumentare sensibilmente con l’inizio e con l’evolversi della pandemia, con un volume di tweet giornalieri più che decuplicato durante il lockdown nazionale, rispetto al periodo precedente. La conversazione si è mantenuta su questi livelli fino a ottobre 2020, quando è iniziato un progressivo incremento dei tweet sui vaccini per arrivare a un primo picco il 27 dicembre, con il Vaccine Day europeo (intorno ai 95K tweet giornalieri) e successivamente il 16 marzo 2021, durante la valutazione, da parte della European Medicine Agency (EMA), dei sospetti casi di trombosi insorti dopo la somministrazione del vaccino Vaxzevria di Astrazeneca.

 

La Tabella 2 riporta i 20 hashtag più frequentemente riportati nei tweet italiani, nei 4 periodi sopra riportati. La Figura 3 mostra il trend dei principali hashtag nell’intero periodo di studio.

 

 

 

Gli hashtag più utilizzati sono stati #vaccino e #vaccini (essendo in effetti anche due delle parole chiave utilizzate nel filtro di ricerca). Nella prima fase emergono hashtag relativi ad alcune patologie prevenibili con la vaccinazione che destavano maggiore interesse prima della pandemia da COVID-19: meningite (senza specifiche rispetto all’agente eziologico), Ebola, influenza, HPV (con un hashtag relativo a uno dei brand vaccinali). Già a gennaio 2020 si registra la comparsa dell’hashtag #coronavirus, presente, nella prima fase, nello 0,7% dei tweet scaricati. Gli hashtag relativi alla pandemia (in particolare #coronavirus e #covid19) aumentano progressivamente da febbraio 2020. Da settembre 2020 iniziano a comparire hashtag relativi alle diverse marche di vaccino contro il COVID-19, in particolare #pfizer nella terza fase (1,89% dei tweet scaricati) e #astrazeneca nella fase dopo il Vaccine Day del 27 dicembre 2020 (1,91%), seguito da #pfizer (0,5%) e #johnsonandjohnson (0,1%). Tra gli hashtag più utilizzati nelle diverse fasi anche i nomi di personalità politiche coinvolte nella gestione della pandemia e dei vaccini a livello italiano e globale: #billgates, #putin, #conte, #trump, #draghi, #figliuolo, #arcuri.

 

La Tabella 3 riporta i 5 tweet più retwittati tra il 30 marzo (data in cui è stata attivata questa funzione sulla piattaforma) e il 30 aprile 2021. Quattro dei 5 tweet riportati esprimono chiare posizioni esitanti nei confronti delle vaccinazioni.

 

 

Discussioni

La piattaforma sviluppata nell’ambito dell’EUJAV per il monitoraggio delle ricerche e delle conversazioni sui vaccini su web e social media ha l’obiettivo di misurare e seguire in tempo reale diversi aspetti relativi all’interesse del pubblico di internet nei confronti dei vaccini. È da sottolineare la natura sperimentale della piattaforma finora sviluppata, che costituisce una sorta di “pilota”, potenzialmente arricchibile con ulteriori funzionalità che potrebbero migliorarne la capacità di fornire dati d’interesse (come, ad esempio, la posizione degli utenti nei confronti dei vaccini).

 

Una piattaforma come questa può avere diversi tipi di impatto sulle attività di sorveglianza dei programmi vaccinali, e in particolare sulle attività di comunicazione istituzionale con il pubblico.

 

L’analisi quantitativa dei dati di Twitter permette di intercettare precocemente oscillazioni del volume delle conversazioni sui vaccini. La sorveglianza degli hashtag, che prevede di verificare l’emergere di nuovi hashtag e l’analisi delle loro variazioni giornaliere, consente di avere un’idea immediata degli argomenti principali presenti nelle conversazioni sul social media. Sulla base dell’analisi dei metadati ottenuti tramite l’API di Twitter è stato inoltre possibile sviluppare un algoritmo che identifica i nodi principali delle comunità che su internet si interessano di vaccini. Si tratta di influencer, molto seguiti e molto retwittati, che promuovono i vaccini oppure che, al contrario, ne scoraggiano l’uso, spesso diffondendo sistematicamente paure e fake news.

 

In un precedente studio sulle conversazioni sui vaccini su Twitter in Italia, prima della pandemia, è stata evidenziata una struttura fortemente polarizzata delle comunità coinvolte (7).

 

I dati di Twitter possono acquisire un valore ancora più informativo se combinati con i dati ottenuti tramite Google Trends, che permette di analizzare il volume di ricerche su Google Search e di visualizzare tutte le parole chiave utilizzate dagli utenti per cercare informazioni sulle vaccinazioni (8).

 

Una funzionalità aggiuntiva della piattaforma, che al momento è in corso di sviluppo, è relativa all’utilizzo di tecniche di intelligenza artificiale, basate su metodiche avanzate di analisi del linguaggio naturale, per la classificazione automatica della posizione nei confronti dei vaccini espressa nei tweet. La classificazione si baserà sulle categorie individuate dal gruppo del Vaccine Confidence Project in un recente studio sulla stance vaccinale, ovvero sulla posizione che l'utente assume nei confronti dei vaccini durante la gravidanza (9). L’algoritmo, che è in corso di addestramento, permetterà di classificare in tempo reale i tweet pubblicati dagli utenti in quattro categorie: una posizione promozionale, scoraggiante, neutra o ambigua nei confronti delle vaccinazioni. Questo consentirà di avere una stima immediata dell’orientamento dei contenuti, al quale il pubblico del web e dei social media è esposto quotidianamente, fornendo un “termometro” della fiducia nei confronti dei vaccini espressa su Twitter e, potenzialmente, nell’ambito di altri contenuti testuali presenti sul web.

 

Il complesso di dati finora menzionati, soprattutto se integrati con delle attività di analisi qualitativa (10) dei contenuti su campioni di post o articoli, costituisce una base informativa ricca e articolata sulla quale è possibile strutturare attività di comunicazione efficace sui vaccini, in particolare:

  • intercettazione precoce degli argomenti di interesse;
  • intercettazione precoce di paure;
  • intercettazione precoce delle fake news;
  • sorveglianza degli utenti più coinvolti nella diffusione di disinformazione;
  • identificazione degli utenti in grado di diffondere più efficientemente messaggi di promozione delle vaccinazioni;
  • misurazione in tempo reale della portata e dell’efficacia di eventuali campagne di comunicazione.

Conclusione

La piattaforma per il monitoraggio dei contenuti sui vaccini su web e social network della EU-JAV rappresenta uno strumento aggiuntivo per la valutazione della posizione nei confronti dei vaccini nella popolazione europea. La piattaforma ha permesso di seguire le conversazioni sui vaccini durante la pandemia da SARS-CoV-2, e di misurare costantemente l’interesse degli utenti, i contenuti più condivisi e le personalità più influenti.

 

La presenza di un sistema in grado di eseguire un monitoraggio in tempo reale delle conversazioni online sui vaccini permette di integrare i sistemi di sorveglianza tradizionale, consentendo di individuare rapidamente le tematiche più rilevanti sollevate dagli utenti, per costruire degli interventi di comunicazione basati sui dati, mirati e tempestivi. La piattaforma ha inoltre la potenzialità di valutare anche l’efficacia degli interventi di comunicazione per la promozione delle vaccinazioni.

 

 

Conflitti di interesse dichiarati: nessuno
Finanziamenti: Grant n. 801495 della Consumer, Health, Agriculture and Food Executive Agency (CHAFEA).
Authorship: tutti gli autori hanno contribuito in modo signifi cativo alla realizzazione di questo studio nella forma sottomessa.
Riferimenti bibliografici
  1. European Joint Action on Vaccination. https://eujav.com/ ; ultimo accesso 6/7/2021.
  2. MacDonald NE, SAGE Working Group on Vaccine Hesitancy. Vaccine hesitancy: Definition, scope and determinants. Vaccine. 2015 Aug 14;33(34):4161-4. doi: 10.1016/j.vaccine.2015.04.036. Epub 2015 Apr 17.
  3. World Health Organization. Ten Threats to Global Health in 2019; ultimo accesso 6/7/2021.
  4. Loomba S, de Figueiredo A, Piatek SJ, de Graaf K, Larson HJ. Measuring the impact of COVID-19 vaccine misinformation on vaccination intent in the UK and USA. Nat Hum Behav 2021 Mar;5(3):337-48. doi: 10.1038/s41562-021-01056-1. Epub 2021 Feb
  5. Erratum in: Nat Hum Behav 2021 Mar 8; PMID: 33547453. 5. Karafillakis E, Martin S, Simas C, Olsson K, Takacs J, Dada S, et al. Methods for Social Media Monitoring Related to Vaccination: Systematic Scoping Review. JMIR Public Health Surveill 2021 Feb 8;7(2):e17149. doi: 10.2196/17149
  6. Kim Y, Huang J, Emery S. Garbage in, Garbage Out: Data Collection, Quality Assessment and Reporting Standards for Social Media Data Use in Health Research, Infodemiology and Digital Disease Detection. J Med Internet Res 2016 Feb 26;18(2):e41. doi: 10.2196/jmir.4738
  7. Cossard A, Morales GDF, Kalimeri K, Mejova Y, Paolotti D, Starnini M. Falling into the echo chamber: the Italian vaccination debate on Twitter. In: Proceedings of the International AAAI Conference on Web and Social Media 2020;14(1):130-40.
  8. Pullan S, Dey M. Vaccine hesitancy and antivaccination in the time of COVID-19: A Google Trends analysis. Vaccine 2021 Apr 1;39(14):1877- 81. doi: 10.1016/j.vaccine.2021.03.019
  9. Martin S, Kilich E, Dada S, Kummervold PE, Denny C, Paterson P, Larson HJ. "Vaccines for pregnant women…?! Absurd" - Mapping maternal vaccination discourse and stance on social media over six months. Vaccine 2020 Sep 29;38(42):6627- 37. doi: 10.1016/j.vaccine.2020.07.072
  10. Liu S, Liu J. Understanding Behavioral Intentions Toward COVID-19 Vaccines: Theory-Based Content Analysis of Tweets. J Med Internet Res 2021;23(5):e28118. doi: 10.2196/28118