English - Home page

ISS
Istituto Superiore di Sanità
EpiCentro - L'epidemiologia per la sanità pubblica
Istituto Superiore di Sanità - EpiCentro


L’integrazione di archivi elettronici per l’epidemiologia e la sanità pubblica: finalità e metodi

Si è tenuto a Roma, il 17 e 18 maggio 2007, il convegno di primavera dell’Associazione italiana di epidemiologia (Aie). L’incontro, ospitato dall’Istituto superiore di sanità (Iss), è stato organizzato insieme al Centro nazionale di epidemiologia, sorveglianza e promozione della salute (Cnesps), con la partecipazione della Società italiana di statistica medica ed epidemiologia clinica (Sismec).

 

Obiettivo del convegno è stata la discussione degli aspetti metodologici e applicativi dell’integrazione di archivi elettronici per uso epidemiologico. In particolare: la qualità degli archivi per il record-linkage (confronto di dati provenienti da diversi archivi) e il problema di doverlo conciliare con la necessaria privacy personale. Da anni, infatti, la sanità pubblica ha cominciato a usare database computerizzati per registrare eventi individuali di diverso interesse. Per ogni persona si possono avere informazioni con cui si può ricostruire la storia individuale dalla nascita fino alla morte. Assistenza al parto, anagrafe, anagrafe sanitaria, prescrizioni di farmaci, ricoveri ospedalieri, malattie infettive, militare, anagrafe tributaria, certificato di morte: tutti archivi separati che possono essere collegati a scopi epidemiologici.

 

EpiCentro propone una sintesi degli interventi della conferenza. Dal sito dell’Iss, scarica il rapporto completo (pdf 1,85 Mb).

 

Il convegno si è concluso con una tavola rotonda, incentrata soprattutto sulla questione della privacy. Su questo tema, e in generale sulle prospettive dell'epidemiologia, si sono espressi anche Stefania Salmaso, direttore del Cnesps, e Luigi Bisanti, presidente dell'Aie: leggi l'approfondimento.

 

 

17 maggio 2007

 

La qualità dei dati nel processo di integrazione di archivi elettronici

Moreno Demaria - Epidemiologia ambientale, Agenzia regionale per la protezione ambientale Piemonte, Grugliasco, Torino

 

La qualità dei dati è un presupposto fondamentale nel processo di integrazione di archivi elettronici, sia dal punto di vista dei singoli database sia da quello delle tecniche di interconnessione. Tra gli attributi di qualità da considerare ci sono: l’affidabilità, l’accuratezza, la completezza, la correttezza formale, la trasparenza, la tempestività e, in misura secondaria, la rilevanza e la pertinenza, l’accessibilità e la plausibilità.

È necessario discutere i livelli di qualità conseguenti ad operazioni di record-linkage e l’influenza che informazioni mislinked possono avere sugli indici calcolati.

Gli scopi dell’integrazione di archivi elettronici in sanità pubblica e nella ricerca

epidemiologica hanno finalità simili ma specificità e criticità proprie. Per entrambe, l’integrazione dei dati sanitari con archivi “master”, ovvero con dati certificati nella loro qualità, può permettere la misura della validità del dato e produrne una “bonifica esterna”, arricchendo al contempo la base informativa. È quindi necessario procedere verso la standardizzazione e l’integrazione dei sistemi informativi.

 

Performance delle procedure di record-linkage tra archivi per l’epidemiologia

Carla Fornari - Università degli Studi Bicocca, Milano

 

Nella ricerca epidemiologica e in sanità pubblica, l’uso integrato di archivi elettronici è sempre più importante. In tale contesto la scelta della tecnica di record-linkage risulta estremamente delicata. Il metodo deterministico comporta che due record si riferiscono allo stesso individuo se tutti i campi identificativi coincidono perfettamente. Sebbene le procedure deterministiche siano intuitive e per questo ampiamente utilizzate, errori di trascrizione nei codici identificativi generano un’incertezza sistematica. Le procedure di linkage probabilistico consistono, invece, nella definizione a priori di un criterio di decisione basato sulla capacità discriminante e attendibilità dei singoli campi identificativi. Il vantaggio di tali tecniche è che l’entità degli errori di linkage è noto ma il loro utilizzo richiede una mole di risorse di calcolo non sempre disponibile. Nello studio presentato sono state valutate le caratteristiche operative di una procedura probabilistica appositamente messa a punto per verificarne l’utilizzabilità in base alla dotazione tecnologica mediamente disponibile in un servizio di epidemiologia. Gli archivi considerati sono: l’anagrafica assistiti al 31 dicembre 2003 e le schede di dimissione ospedaliera (Sdo) dell’anno 2004 di competenza di quattro servizi, localizzati in diverse regioni italiane.

 

Percorsi diagnostico-terapeutici e valutazione della continuità assistenziale: esperienze e prospettive

Pier Giorgio Duca - Università degli Studi, Milano

Pietro Barbieri - Azienda Ospedaliera di Melegnano, Milano

 

Ad un aumento di disponibilità di trattamenti di provata efficacia per singoli episodi di cura non necessariamente corrisponde un miglioramento della condizione clinica dei pazienti, soprattutto quando si considerino condizioni croniche in cui insieme all’efficacia della cura risulta determinante un’assistenza appropriata e continua. La continuità assistenziale si esprime nelle tre dimensioni di: relazione interpersonale, flusso informativo e gestione integrata.

Come in altri ambiti anche nel caso della continuità assistenziale si tratta di definire indicatori specifici, di dimostrata utilità pratica, che per essere sostenibili e facilmente generalizzabili devono basarsi, il più possibile, sull’uso di dati estratti da database amministrativi. Per esemplificare lo stato della ricerca e delle applicazioni in atto si è considerato il caso della schizofrenia e della cardiopatia ischemica (Regione Lombardia) e quello dello scompenso cardiaco e del paziente oncologico (livello nazionale e internazionale).

 

 

L’integrazione di flussi informativi sanitari per la valutazione del rischio nell’ambito dei farmaci

Roberto Raschetti - Centro nazionale di epidemiologia, sorveglianza e promozione della salute, Istituto superiore di sanità, Roma

 

Nel campo sanitario la gestione e il controllo della salute sono basati sull’uso, la trasmissione e il confronto di una grande quantità di dati eterogenei. Per questo, sono evidenti i vantaggi gestionali derivanti dalla sistematica applicazione della tecnologia informatica. L’interesse è però rivolto alla utilizzabilità dei depositi organizzati e sistematici di dati che vengono generati automaticamente da queste procedure per finalità di ricerca sanitaria. A fronte delle grandi potenzialità applicative, infatti, è necessario sottolineare i problemi che si possono incontrare nell’utilizzo per finalità epidemiologiche dei database, che riguardano essenzialmente i livelli di copertura e la qualità dei dati. Tutto ciò nella chiara consapevolezza dei limiti non solo tecnico scientifici ma anche di quelli etici relativi soprattutto ai meccanismi di tutela della privacy dei soggetti. La navigabilità in insiemi eterogenei di dati sanitari personali deve essere regolata da precisi protocolli di studio.

 

I sistemi informativi per la valutazione comparativa degli esiti: il programma Mattoni - outcome

Paola D'Errigo - Centro nazionale di epidemiologia, sorveglianza e promozione della salute, Istituto superiore di sanità, Roma

Danilo Fusco - Dipartimento di epidemiologia, Asl RM E, Roma

 

Il ministero della Salute, nell’ambito del programma "Mattoni del Servizio sanitario nazionale (Ssn)", ha avviato il progetto "Misura dell’outcome" con lo scopo di

introdurre nel Ssn, attraverso il Nuovo sistema informativo sanitario (Nsis), procedure e metodi di misura sistematica dell’outcome di servizi sanitari, a livello di popolazione e di strutture, nonché di individuare strategie per la comunicazione dei risultati in rapporto alle diverse finalità e ai diversi possibili destinatari ed utilizzatori dell’informazione prodotta. Le Schede di dimissione ospedaliera nazionali del 2001-2004 hanno costituito la base di dati su cui elaborare gli indicatori di esito selezionati. L’esperienza ha evidenziato scarsa disponibilità di informazioni individuali a livello nazionale e mancanza di integrazione tra sistemi informativi diversi. Le principali raccomandazioni prodotte sono state: considerare il sistema informativo di mortalità una priorità del Nsis, rendere sistematico a livello regionale il linkage Sdo-sistema informativo di mortalità, promuovere programmi che assicurino livelli uniformi di qualità dei sistemi informativi, introdurre campi aggiuntivi nella Sdo per variabili cliniche di dimostrato interesse, rendere possibile il linkage tra diversi sistemi informativi.

 

Evoluzione dell’uso degli archivi elettronici per la registrazione dei tumori

Antonio Russo - Asl Città di Milano, Servizio di epidemiologia, Registro tumori, Milano

 

All’Associazione italiana registri tumori (AIRTum) sono attualmente accreditati 23 registri tumori generali che coprono il 28% della popolazione e 5 registri specializzati. Nel corso del tempo è profondamente cambiata la modalità con cui viene effettuata la registrazione dei tumori passando dalla consultazione manuale delle cartelle cliniche a un’utilizzazione sempre più estensiva dei flussi informativi che con il tempo si sono resi disponibili. Questo ha determinato anche una variazione della tipologia e della specializzazione del personale addetto alla registrazione con una presenza sempre maggiore di informatici e statistici. Negli ultimi 10 anni è stato sviluppato un nuovo approccio alla registrazione dei tumori chiamato “registrazione automatica” che prevede lo sviluppo di un algoritmo decisionale che confronta le fonti informative che concorrono a definire l’incidenza e accetta un caso in incidenza se le fonti sono concordanti o lo rigetta in presenza di discordanze rimandando la revisione a un operatore di registro. Questo modello rappresenta il maggiore investimento in termini di sistema informativo ed è possibile solo in aree in cui i flussi che vanno a comporre l’incidenza presentano livelli di completezza e di integrazione molto elevati. I registri tumori rappresentano un importante laboratorio in cui vengono sviluppate applicazioni basate sulla integrazione dei flussi sanitari al fine di supportare i piani oncologici nazionali e lo sviluppo delle reti oncologiche regionali.

 

 

Distribuzione spaziale di indicatori di esposizione ambientale e sua integrazione con gli archivi elettronici di interesse epidemiologico

Pietro Comba - Dipartimento di ambiente e connessa prevenzione primaria, Istituto superiore di sanità, Roma

 

L’avanzamento delle conoscenze nel settore ambiente e salute, l’evoluzione delle tecnologie utilizzate nella gestione di vari tipi di flussi informativi territoriali, la diffusione dei sistemi informativi geografici, hanno fornito maggiori opportunità di utilizzo di indicatori di esposizione ambientale a quanti effettuano studi epidemiologici centrati sulla distribuzione spaziale di determinate patologie.

Particolare interesse hanno le situazioni nelle quali sia possibile mettere direttamente in relazione un archivio di dati sanitari e anagrafici già validato per finalità di indagine epidemiologica con una fonte indipendente che consenta di stimare il livello di una determinata esposizione a un livello di disaggregazione spaziale coerente con quello dell’archivio dei dati sanitari. Un’opportunità di sperimentare questo tipo di linkage è resa possibile dalla messa a punto in alcune regioni, di catasti delle linee ad alta tensione disponibili su cartografia informatizzata, e della presenza di archivi di dati epidemiologici disaggregati a livello di numero civico. L’esperienza pilota effettuata a Pisa ha consentito di valutare positivamente la potenzialità di questo approccio.

 

Un modello di integrazione sistematica degli archivi per la sorveglianza delle malattie

Roberta Tessari, Cristina Canova - Università degli Studi, Padova

 

Dal 2002 è operativo presso l’Asl 12 Veneziana un Sistema epidemiologico integrato (Sei): un archivio permanente e continuamente aggiornato che integra le diverse fonti informative attraverso operazioni di record-linkage, utilizza l’Anagrafe sanitaria come matrice, e applica algoritmi di definizione della casistica. Nel periodo 1998-2003, i record utilizzati sono stati 11.139.058 per una popolazione annuale media di assistibili di circa 320.000. Sono state selezionate 50 patologie o aggregazioni di patologie per le quali sono stati calcolati tassi grezzi e standardizzati di incidenza nei due sessi, nei diversi periodi di tempo, e nelle due diverse agglomerazioni urbane: Venezia insulare e storica, e Mestre. Attraverso la georeferenziazione degli assistibili è stato possibile mappare le diverse patologie secondo i 17 quartieri/sestieri/aree in cui è suddivisa la popolazione oppure secondo l’individuazione di aree a diversa esposizione ambientale come la situazione in esame.

Sono state anche condotte un’indagine epidemiologica sui rischi ambientali per i sarcomi dei tessuti molli in rapporto all’esposizione diossine e un’indagine epidemiologica sui potenziali effetti nocivi dell’inquinamento atmosferico sui bambini affetti da asma. Anche se il modello richiederà sicuramente aggiornamenti e revisioni, ha comunque dimostrato la possibilità di costruire, utilizzando i dati sanitari correnti, sistemi di sorveglianza dell’intera popolazione degli assistiti.

 

 

18 maggio 2007

 

L’uso integrato a livello individuale delle fonti Inail e Inps per la sorveglianza degli effetti del lavoro sulla salute

Roberto Leombruni - Laboratorio Revelli, Università degli Studi, Torino

Antonella Bena - Servizio di epidemiologia, Asl 5 Grugliasco, Torino

Paolo Crosignani - Registro tumori, Varese

 

In Italia non è disponibile una fonte informativa in grado di descrivere gli effetti sulla salute del lavoro e delle sue trasformazioni. Per risolvere questo problema si sta costruendo un sistema di indagine integrato sulla storia lavorativa dei soggetti e sui loro problemi di salute e di sicurezza, a partire da precedenti esperienze di linkage tra gli archivi Inps e altri fonti informative correnti (studio Occam, lavori usuranti, ecc). È stato estratto dagli archivi Inps, sulla base di quattro date di nascita, un campione dell’1% dei lavoratori iscritti. Per ogni soggetto è stata ricostruita la carriera lavorativa dal 1984 al 2003. Dagli archivi Inail sono stati estratti gli infortuni e le malattie professionali accaduti tra il 1994 e il 2003 a lavoratori nati nelle stesse quattro date. Le informazioni sono state collegate tramite linkage su base individuale (mediante il codice fiscale criptato). Sono stati linkati il 96% degli infortuni estratti. La percentuale di concordanza tra Inps e Inail sulle variabili comuni è maggiore del 95%. Il data base è rappresentativo della

popolazione italiana iscritta all’Inps e permette di analizzare correttamente il rischio

infortunistico soprattutto nel comparto manifatturiero e in quello delle costruzioni. È in corso di valutazione la fattibilità di estendere il linkage ai dati di mortalità (fonte Istat) e ai dati riguardanti le dimissioni ospedaliere, in possesso del ministero della Salute.

 

L’uso integrato a livello individuale delle indagini Istat con le fonti sanitarie correnti

Gabriella Sebastiani - Istituto nazionale di statistica, Roma

Marilena Pappagallo - Istituto nazionale di statistica, Roma

Lucia Lispi - Direzione generale della programmazione sanitaria, ministero della Salute, Roma

Nicola Caranci - Asl Grugliasco, Torino

Arduino Verdecchia - Centro nazionale di epidemiologia, sorveglianza e promozione della salute, Istituto superiore di sanità, Roma

 

L’indagine campionaria condotta dall’Istituto nazionale di statistica sulle condizioni di salute e il ricorso ai servizi sanitari 1999-2000 è alla base di una sperimentazione per la costruzione di un sistema longitudinale, rappresentativo di tutta l’Italia, che consenta di osservare come gli individui partecipanti all’indagine subiscono gli esiti registrati con flussi di dati correnti. Il metodo utilizzato è stato un follow-up di ospedalizzazione e di mortalità del campione nazionale dell’indagine, costruito tramite tecniche di record-linkage deterministico tra l’archivio dell’indagine e l’archivio nazionale di mortalità dell’Istat e archivi di schede di dimissione ospedaliera. Sono stati acquisiti i dati nominativi degli individui intervistati tramite gli Stati di Famiglia conservati in un archivio

cartaceo indipendente. L’immissione su supporto informatico ha riguardato i dati

nominativi dei 140.011 soggetti del campione e ha permesso di ricostruire la chiave univoca per l’integrazione delle banche dati: il codice fiscale.

Risultati: la procedura di attribuzione dei dati nominativi e la relativa ricostruzione del codice fiscale ha permesso di costruire il “sotto-campione” dei soggetti che è possibile seguire nel tempo per una quota pari al 92,1% degli intervistati nell’indagine. Si può concludere che il sistema longitudinale ha un adeguato livello di completezza, soprattutto per l’identificazione di decessi, e consente di studiare molteplici esiti di salute rispetto a vari indicatori di stili di vita, condizioni ambientali e socio-economiche.

 

L’uso integrato a livello individuale delle fonti informative sanitarie con le fonti statistiche per gli scopi di programmazione sanitaria regionale

Carlo Zocchetti - Regione Lombardia, Milano

 

Dalla seconda metà degli anni ’90 si sono sviluppati prima a livello regionale e, successivamente a livello nazionale, importanti sistemi informativi sanitari dedicati ai principali livelli di assistenza. L’epidemiologia in quegli anni ha fatto un utilizzo intensivo di alcuni di questi flussi. Più recentemente sono iniziati progetti di valorizzazione integrata di queste fonti informative sanitarie, insieme a quelle della mortalità, per scopi di programmazione sanitaria. La relazione esamina criticamente gli obiettivi, i metodi, e i risultati di queste esperienze per identificare le nuove sfide che le potenzialità di integrazione tra i sistemi informativi sanitari relativi ad ogni singolo livello di assistenza consentono per gli scopi della programmazione sanitaria. Gli stessi problemi possono essere affrontati dal punto di vista dell’analisi della dimensione geografica. Infine bisogna considerare che queste sfide avvengono in un contesto nel quale gli attori in gioco ridefiniscono i loro ruoli. Questi aspetti di contesto richiedono all’epidemiologia di personalizzare più efficacemente gli investimenti di sviluppo per consentire alle migliori pratiche di diffondersi con maggiore tempestività.