Pool testing

Il pool testing è la strategia di testing che consente alla Cina di condurre milioni di test Covid-19 in poche ore.
Si tratta di una tecnica nota e ben descritta in letteratura ed è anche di semplice divulgazione. Metterla in campo è oggettivamente un altro paio di maniche, richiede un’organizzazione operativa e una disciplina del pubblico, che sono entrambe sconosciute in Occidente.
Un esempio recente di applicazione è stato il test effettuato nella città di Kashgar, nello Xinjiang (articoli qui e qui).
Il test è partito nella giornata di domenica,  poche ore dopo che era stato segnalato il caso di positività di una lavoratrice in un’azienda di abbigliamento. In tre giorni, domenica, lunedì e martedì, sono state testate 4.750.000 persone.

Come è stato possibile raggiungere questo risultato?


Cos’è il pool testing

L’approccio statistico alla base del pool testing è abbastanza semplice da descrivere.
Si supponga di dover testare la presenza di un virus in un numero molto grande di persone, diciamo un milione, con l’aspettativa di trovare pochi casi positivi, assumiamo un centinaio.
L’approccio naturale è quello di effettuare per ciascuna persona un prelievo da analizzare, per poi memorizzarne il risultato per la gestione del caso.

Tenendo conto del basso numero di risultati positivi attesi, si può anche raggruppare un piccolo numero di prelievi, diciamo 5, ed esaminarli come se fossero un unico prelievo.
Se l’analisi dà un risultato negativo, si può allora assumere che tutti e 5 i prelievi fossero negativi. In caso di risultato positivo, invece, si ripete prelievo e test per ciascuno delle 5 persone coinvolte.

Come cambiano le numeriche del test

Il numero di prelievi aumenta, rispetto all’approccio naturale: ogni persona sarà sottoposta a un prelievo, mentre alcuni ne subiranno un secondo. Se il numero di casi positivi è basso, però, questo aumento sarà molto contenuto, numericamente trascurabile. Certamente complicherà un po’ il processo operativo: occorrerà richiamare le persone coinvolte, organizzare per loro una coda separata e più snella ed effettuare un’analisi a testa.

Diminuisce invece, e di molto, il numero di analisi effettuate. Nel nostro esempio, in assenza di positivi, invece di 1.000.000 di analisi se ne effettueranno solo 1.000.000 / 5 = 200.000.
Se, invece, per esempio ci fossero 10.000 positivi (1%), nel caso peggiore di avere un solo positivo per gruppo di 5 prelievi, si avrebbero 50.000 secondi prelievi e test, per un totale di 250.000 analisi. Comunque un bel risparmio di tempo e costi, sia materiali che umani.

Pool testing: quando funziona

L’efficacia dell’approccio descritto migliora se si raggruppa un numero maggiore di prelievi in un unico test. C’è però da tener conto che, così facendo, si diluisce la positività dell’eventuale campione positivo nella negatività dei rimanenti. C’è quindi un limite pratico, che, nei test di laboratorio per il Covid-19, è pari a 5.

L’altro aspetto da considerare è il tasso di positività atteso. Se questo tasso è molto alto, vedremo tra poco che il 15% ad esempio lo è, la riduzione delle analisi effettuate è bassa e non giustifica la messa in campo di un processo più complicato del semplice prelievo – test – risultato.

Un po’ di statistica

Supponiamo che i campioni positivi siano uniformemente distribuiti tra i prelievi effettuati, e poniamo pari a p la probabilità di positività di un singolo campione. La probabilità che il campione sia negativo è pari quindi a (1 – p).
Sia ancora N il numero di campioni totali da analizzare e n il numero di campioni raggruppati ed esaminati insieme. Le analisi effettuate in prima battuta saranno quindi N / n.

La probabilità che un gruppo di n campioni risulti negativo è pari alla probabilità che ogni singolo campione componente il gruppo sia negativo, quindi è pari a (1 – p)n.
A questo punto è semplice ricavare la probabilità che un gruppo di n campioni risulti positivo, perché sarà pari a  1 – (1 – p)n.

Il numero di analisi da effettuare sarà quindi pari a N / n, per il primo giro, a cui va aggiunto un secondo giro di n test per ogni gruppo risultato positivo. Quindi vanno aggiunti n * (1 – (1 – p)n) * N / n.

E qui ci vuole un foglio di calcolo

Sì, perché dobbiamo scoprire come si modifica l’efficacia dell’approccio del pool testing, al variare del numero di campioni per gruppo (n) e della percentuale di positivi sulla popolazione in esame (p).

Sull’asse delle x è riportato n, cioè il numero di campioni raggruppati in un’unica analisi. Nel caso citato della città cinese di Kashgar, n = 5.

Le varie curve si riferiscono invece a differenti percentuali di positività, nell’ipotesi di una popolazione da testare di 1.000.000 di persone.
Si osserva che, per basse percentuali di positività, l’efficienza del pool testing è limitata solo dalla sensibilità del test. Fosse possibile raggruppare 10 o anche 15 campioni, si ridurrebbero il numero di analisi da effettuare.

Già per un tasso di positività pari al 2%, si vede che la curva raggiunge un punto di minimo e poi cresce. Comunque, per n = 5 si avrebbe un numero di analisi pari a 300.000, decisamente minore di 1.000.000 di analisi del metodo tradizionale.

Per un tasso del 15% (più o meno quello raggiunto oggi in Italia), l’approccio non sarebbe più praticamente applicabile.


Prima di criticare la Cina

Fin dalle prime settimane della pandemia di Covid-19, sono state rivolte alla Cina una serie di accuse. Dalle abitudini alimentari che avrebbero consentito il salto di specie del virus e, da lì, la sua diffusione in pandemia, ai sospetti della creazione del virus in laboratorio. Per non tacere poi della reticenza iniziale del governo cinese, che ha tenuto nascosta al mondo occidentale per settimane (o forse mesi) l’esistenza della minaccia del virus. Ultimamente è sotto osservazione anche la ripresa rapida dell’economia cinese, con la quasi totale scomparsa del virus, a fronte della grave crisi economica in cui è immerso l’Occidente.

Qui una buona sintesi delle critiche alla Cina.

Nel mentre che si critica la Cina, però, sarebbe utile guardarsi in casa e chiedersi se sono state messe in campo tutte le iniziative di raccolta e gestione dati che un approccio scientifico alla pandemia richiederebbe. Iniziative raccomandate dagli esperti già nei primi mesi, ma in larga misura disattese.
Qui un’ottima e recente sintesi sul tema dei dati. 

Immagine di apertura di Mohamed Hassan da Pixabay.

Scritto da:

Pasquale

Mi chiamo Pasquale Petrosino, radici campane, da alcuni anni sulle rive del lago di Lecco, dopo aver lungamente vissuto a Ivrea.
Ho attraversato 40 anni di tecnologia informatica, da quando progettavo hardware maneggiando i primi microprocessori, la memoria si misurava in kByte, e Ethernet era una novità fresca fresca, fino alla comparsa ed esplosione di Internet.
Tre passioni: la Tecnologia, la Matematica per diletto e le mie tre donne: la piccola Luna, Orsella e Valentina.
Potete contattarmi scrivendo a: p.petrosino@inchiostrovirtuale.it