Morti per Covid: indifferenza collettiva ai dati anagrafici

Il vero problema è che governo, giornalisti, accademici sono stati indifferenti alle questioni delle statistiche vitali prima del Covid, in gran parte perché queste statistiche riguardavano le fasce più deboli della società

Covid-19La difficoltà con l'utilizzo dei dati CPHS nella quantificazione dell'eccesso di mortalità è ben articolata in un recente rapporto del Center for Global Development ('Troppe persone sono morte', IE, 20 luglio) sulla stima della mortalità in eccesso per tutte le cause in India durante il Covid 19 pandemia. (Foto express di Tashi Tobgyal)

La quantificazione dei decessi in eccesso dovuti al Covid ha acquisito un fascino appassionato. L'unica realtà oggettiva è che l'architettura dei dati esistente, che si tratti del Civil Registry System (CRS) o del Consumer Pyramid Household Survey (CPHS), non è adatta per il compito.

La sfida con l'utilizzo dei dati CRS è documentata nel mio articolo dell'Hindustan Times pubblicato la scorsa settimana. Questa è una delle principali preoccupazioni che abbiamo evidenziato anche in passato. Tuttavia, la difficoltà con l'utilizzo dei dati CPHS nella quantificazione dell'eccesso di mortalità è ben articolata in un recente rapporto del Center for Global Development ('Troppe persone sono morte', IE, 20 luglio) sulla stima della mortalità in eccesso per tutte le cause in India durante la pandemia di Covid19. La chiave - e forse l'unica conclusione utile - di questo documento relativo alle stime di mortalità CPHS è la seguente: l'importante avvertimento sulle stime di morte del CPHS è che la sua mortalità pre-Covid non segue da vicino le stime di altre fonti ufficiali. Forse ancora più importante è che il CPHS mostri un grande e inspiegabile picco di mortalità nel 2019 prima di Covid. Se alcuni degli errori di misurazione del CPHS pre-Covid si trasferiscono al periodo Covid, l'affidabilità delle stime dei decessi in eccesso non è assicurata.

Sarebbe stato saggio e prudente per i ricercatori enfatizzare questa conclusione piuttosto che produrre numeri basati su dati non adatti al compito.

In questo saggio, desidero evidenziare differenze significative tra il Sample Registration System (SRS), che è la base delle stime ufficiali del tasso di natalità e mortalità in India, e i dati CPHS, che è progettato per fornire stime sui consumi e sulla partecipazione alla forza lavoro . Ciò metterebbe in prospettiva il motivo per cui i dati ufficiali sulla mortalità da SRS differiscono significativamente dal CPHS anche prima di Covid. Innanzitutto, l'SRS e il CPHS sono condotti per scopi diversi; l'SRS fornisce stime affidabili a livello nazionale e statale per statistiche vitali come la nascita, la morte e il tasso di mortalità infantile. CPHS fornisce stime a livello nazionale e statale per il consumo e la partecipazione alla forza lavoro. Dato che gli obiettivi delle indagini sono diversi e che i decessi sono un evento raro, la metodologia di campionamento di SRS e CPHS è molto diversa, il che forse spiega perché CPHS e le stime ufficiali di mortalità SRS non corrispondessero nemmeno prima della pandemia.

Nell'SRS, l'ultima unità di campionamento in un'area rurale è un villaggio o una parte di esso se la popolazione del villaggio supera i 2.000 abitanti. Nelle aree urbane, l'unità di campionamento è il blocco di censimento (CEB) con una popolazione compresa tra 750 e 1.000. Ciò implica che tutte le famiglie nel villaggio (o segmento)/CEB inclusi nel campione siano coperte. Inoltre, l'SRS segue un sistema a doppia registrazione, in cui l'investigatore part-time residente o l'enumeratore registra continuamente le nascite e le morti di tutte le famiglie nell'unità campionata. Questi dati vengono confrontati con un'indagine retrospettiva indipendente da un supervisore a tempo pieno dopo sei mesi. Gli eventi non corrispondenti e parzialmente abbinati vengono nuovamente verificati per arrivare al numero corretto di eventi. Gli enumeratori dovrebbero registrare tutte le nascite e le morti nell'unità di campionamento. Sono inoltre tenuti a registrare tutti gli eventi per i residenti abituali, che si verificano al di fuori dell'unità di campionamento. Pertanto, gli eventi registrati sono quelli associati a residenti abituali all'interno dell'unità di campionamento, residenti abituali al di fuori dell'unità di campionamento, immigrati presenti o assenti e visitatori all'interno dell'unità di campionamento. Per garantire una copertura completa degli eventi, gli enumeratori si avvalgono dell'aiuto di sacerdoti del villaggio, capi, barbieri, ostetriche e altri per raccogliere informazioni su nascite e morti. Ciò evidenzia la natura complessa della raccolta di dati accurati di nascita e morte. Complessivamente, 4.961 villaggi o segmenti con circa 5,9 milioni di persone e 3.886 CEB in aree urbane con una popolazione di circa 2,2 milioni di persone sono coperti per produrre stime a livello nazionale e statale.

Al contrario, per il CPHS, l'unità di campionamento finale è una famiglia all'interno di un villaggio nelle aree rurali o un blocco di censimento (CEB) nelle aree urbane. Ad esempio, da un tipico villaggio con 300 famiglie o da un CEB, vengono selezionate casualmente 16 famiglie per l'indagine. Pertanto, la dimensione del campione del CPHS rispetto a quella dell'SRS è una frazione (circa un decimo). Inoltre, i dati CPHS non adottano tutte le misure necessarie in quanto l'SRS registra rigorosamente tutte le nascite e le morti. È importante sottolineare nuovamente che la metodologia di campionamento del CPHS non è progettata per fornire stime di eventi vitali come nascita, morte e/o mortalità infantile. Se dovessimo utilizzare inavvertitamente i dati CPHS per stimare eventi vitali (nascite e decessi), incontreremmo errori di non campionamento (copertura e misurazione) che non vengono corretti dalla dimensione del campione. Gli errori non di campionamento sono molto difficili da misurare e i loro effetti sulle stime (bias e varianza) sono in gran parte sconosciuti. In questa fase, i dati CPHS non forniscono alcuna certezza che questi errori siano ridotti al minimo. La realtà della quantificazione dei decessi in eccesso, sia utilizzando il CRS che i dati CPHS, è irta di problemi che rendono difficile dargli un numero. Il problema fondamentale non è che le morti in eccesso non siano avvenute ma quantificarlo scientificamente e oggettivamente rimane impegnativo.

Usando numeri speculativi, molti giornalisti e accademici hanno accusato il governo di nascondere il numero effettivo dei morti. Penso che ci sia una spiegazione molto più semplice: il governo non lo sa. Anche prima del Covid, l'India non aveva l'architettura dei dati per stimare le statistiche vitali, come nascite e morti a livello di distretto. Abbiamo seguito un sistema arcaico di stime basate su sondaggi a livello nazionale e statale che non è cambiato negli ultimi 50 anni. Potrebbe essere una sorpresa per molti, ma la dimensione del campione di queste indagini rende difficile confrontare i tassi di mortalità da un anno all'altro. Il vero problema, a mio avviso, è che il governo, i giornalisti, gli accademici (con poche eccezioni) sono stati indifferenti alle questioni delle statistiche vitali prima del Covid, soprattutto perché queste statistiche riguardavano le fasce più deboli della società (donne e bambini) e la politica intorno non era divertente. Ora che ci troviamo di fronte a una tragedia, chiediamo risposte a un sistema che non conosce. La vera tragedia qui è che a causa della nostra indifferenza collettiva alle statistiche vitali, forse non avremo mai un resoconto onesto dei morti.

L'autore è Senior Fellow non residente, Brookings Institution