La grande disponibilità di dati sia sull'
inquinamento atmosferico che sulla diffusione di
COVID-19, e la semplicità di
correlazioni geografiche tra di essi, ha portato a una proliferazione di
studi ecologici che mettono in relazione i livelli di inquinamento nelle aree amministrative con i tassi di incidenza, mortalità o letalità del COVID-19.
Tuttavia, il principale svantaggio di questi studi è l'
errore ecologico che può portare ad associazioni spurie.
In questo quadro, una crescente attenzione è stata rivolta al possibile ruolo di
variabili contestuali quali le
caratteristiche dei comuni (compresi gli ambienti urbani, rurali, semirurale), quelle delle
comunità residenti, la rete delle
relazioni sociali, la
mobilità delle persone e la
reattività del Servizio sanitario nazionale, per chiarire meglio le dinamiche del fenomeno.
L'obiettivo di un
articolo pubblicato dal gruppo di studio EpiCovAir, è stato identificare e raccogliere i
fattori contestuali dei comuni e della comunità e sintetizzarne il contenuto informativo; questo ha permesso di produrre indicatori adeguati negli studi epidemiologici ambientali nazionali, con particolare attenzione alla valutazione del possibile ruolo dell'inquinamento atmosferico sull'incidenza e sulla gravità della malattia COVID-19.
Un primo passo è stato sintetizzare il contenuto dell'
informazione territoriale, disponibile a livello comunale, in un insieme più ristretto di “
indici di sintesi” che possono essere più facilmente visualizzati e analizzati.
Per i
7903 comuni italiani (1 gennaio 2020- Istat) sono state identificate, raccolte e raggruppate in cinque dimensioni informative definite a priori:
- le caratteristiche geografiche del comune
- le caratteristiche demografiche e antropiche
- la mobilità
- l'area socio-economica-sanitaria
- l'offerta sanitaria (fonte: ISTAT, EUROSTAT o Ministero della salute e ulteriori elaborazioni ad hoc ad es. OpenStreetMaps).
Per le
cinque dimensioni individuate è stata effettuata l'
analisi delle componenti principali (principal component analysis - PCA), con l'obiettivo di
ridurre l'elevato numero di variabili iniziali in un numero minore di componenti, limitando il più possibile la perdita di contenuto informativo (variabilità).
Nell'analisi sono stati inclusi anche i
valori di esposizione ponderata della popolazione (population weighted exposure - PWE) di
PM2,5,
PM10 e
NO2 ottenuti utilizzando un
approccio a quattro fasi basato sul metodo di
apprendimento automatico, “random forest”, che utilizza predittori spazio-temporali, dati satellitari e dati di monitoraggio della qualità dell'aria stimati a livello nazionale.
Complessivamente, l'analisi delle componenti principali ha consentito di estrarre
dodici componenti:
- tre per la dimensione delle caratteristiche territoriali del comune (varianza spiegata 72%)
- due per la dimensione delle caratteristiche demografiche e antropiche (varianza spiegata 62%)
- tre per la dimensione della mobilità (varianza spiega 83%)
- due per il settore socio-economico-sanitario (varianza spiegata 58%)
- due per la dimensione dell'offerta sanitaria (varianza spiegata 72%).
Riportiamo solo
una delle molte rappresentazioni grafiche e tavole presenti nel testo dello studio.
Figure 3. La matrice di correlazione tra le componenti risultata dall'analisi PCA.

Tutti i
componenti delle diverse dimensioni sono solo marginalmente correlati tra loro, dimostrando la loro potenziale capacità di cogliere
diversi aspetti della distribuzione spaziale della patologia COVID-19.
Il lavoro fornisce un archivio di
variabili contestuali a livello comunale scomposte in
12 fattori informativi idonei ad essere utilizzati negli studi sull'associazione tra
esposizione cronica all'inquinamento atmosferico e patologia da COVID-19, nonché per indagini sul ruolo dell'inquinamento atmosferico sulla salute della popolazione italiana.
Per saperne di più:
Per approfondire, leggi: