Dall'Università di Glasgow, un algoritmo di machine learning prevede la probabilità che, a partire da sequenze genomiche virali, qualsiasi virus biologicamente rilevante possa passare da un animale infetto all’essere umano. L’obiettivo è arrivare, nel tempo, a identificare quei virus da tenere sotto stretto monitoraggio e prioritari per lo sviluppo di vaccini.
TAKEAWAY
- La maggior parte delle malattie infettive che colpiscono l’essere umano vengono trasmesse in modo diretto – o indiretto – tra gli animali e l’uomo. Riuscire a rilevarle per tempo, rappresenta una sfida importante per la comunità scientifica mondiale.
- Tuttavia, solo una piccola percentuale degli 1,67 milioni di virus animali è in grado di infettare l’uomo. Questo è lo scoglio che incontra la ricerca.
- Un recente studio ha testato la validità di un algoritmo di machine learning nel prevedere la probabilità che, a partire da sequenze genomiche virali, un virus possa passare da un animale infetto a un soggetto umano.
Oggi, in fase di ripresa dopo l’emergenza pandemica, parlare di intelligenza artificiale e infezioni virali assume un significato profondo, in quanto rimanda alla possibilità, avvalendosi delle tecniche che fanno capo all’ambito di studi dell’intelligenza artificiale, di identificare – prima che possano divenire emergenza – quei virus potenzialmente infettanti e pericolosi per l’uomo. Ma facciamo un passo indietro.
La maggior parte delle malattie infettive che colpiscono l’essere umano (come, appunto, lo stesso Covid-19) sono zoonotiche, ossia vengono trasmesse in modo diretto – o indiretto – tra gli animali e l’uomo. Riuscire a rilevarle per tempo, rappresenta una sfida importante per la comunità scientifica mondiale.
Tuttavia, solo una piccola percentuale degli 1,67 milioni di virus animali è in grado di infettare l’uomo, spiegano i ricercatori Nardus Mollentze, Simon Babayan e Daniel Streicker dell’Università di Glasgow, nel Regno Unito. E qui sta il nodo cruciale.
Per scioglierlo, il team citato ha condotto uno studio – i cui risultati sono stati pubblicati il 28 settembre 2021 su PLOS Biology – volto a testare la validità di un algoritmo di machine learning nel prevedere la probabilità che, a partire da sequenze genomiche virali, qualsiasi virus biologicamente rilevante possa passare da un animale infetto a un soggetto umano. Vediamo, nel dettaglio, di che cosa si tratta.
Identificare i virus da tenere sotto stretto monitoraggio e prioritari per lo sviluppo di vaccini
La prima parte del lavoro in tema di intelligenza artificiale e infezioni virali ha riguardato lo sviluppo dell’algoritmo di apprendimento automatico sulla base di una serie di sequenze note di genomi virali.
I ricercatori, in particolare, hanno definito un set di dati composto da 861 specie di virus provenienti da 36 famiglie, per mezzo del quale allenare l’algoritmo. Il compito assegnato a quest’ultimo era quello di assegnare una probabilità di infezione umana in base ai genomi dei virus. Osserva Simon Babayan:
“La sequenza genomica è, in genere, la prima, e spesso unica, informazione che abbiamo a proposito dei virus appena scoperti. E più informazioni possiamo estrarne, prima siamo in grado di identificare le origini del virus e il rischio zoonotico che può comportare. Man mano che vengono caratterizzati più virus, più efficace diventerà il nostro algoritmo di apprendimento automatico nell’identificare quelli particolarmente rari e pericolosi, che dovrebbero essere strettamente monitorati e considerati prioritari per lo sviluppo di vaccini“
I risultati ottenuti dal team di studio in tema di intelligenza artificiale e infezioni virali mostrano che il potenziale zoonotico dei virus può essere dedotto in misura davvero ampia dalla loro sequenza genomica.
Inoltre, evidenziando i virus con il maggior potenziale di diventare zoonotici, la classificazione basata sul genoma consente di mirare in modo più efficace a un’ulteriore caratterizzazione ecologica e virologica. Naturalmente, questo è solo un passaggio preliminare nell’identificare i virus zoonotici potenzialmente infettanti.
I virus segnalati dall’algoritmo di machine learning – specifica Nardus Mollentze – richiederanno test di laboratorio di conferma. Anche perché la capacità di infettare è solo una parte del più ampio rischio zoonotico, influenzato dalla virulenza del virus negli esseri umani, dalla capacità di trasmissione tra gli esseri umani e dalle condizioni ecologiche relative dell’esposizione umana.
Intelligenza artificiale e infezioni virali: i primi esiti dello studio dell’Università di Glasgow
In tema di intelligenza artificiale e infezioni virali, le previsioni fatte dall’algoritmo di apprendimento automatico durante il test hanno suggerito l’esistenza di caratteristiche generalizzabili dei genomi virali, che sono indipendenti dalle relazioni tassonomiche dei virus e che possono preadattare i virus a infettare gli esseri umani.
Dopo il test con i genomi virali utilizzati per l’addestramento – si legge nel documento pubblicato PLOS Biology – il sistema AI è stato in grado di ridurre una seconda serie di 645 virus associati agli animali a 272 zoonosi ad alto rischio e 41 ad altissimo rischio e ha mostrato un rischio zoonotico previsto significativamente elevato nei virus di primati non umani, ma non in altri gruppi ospiti di mammiferi o di uccelli.
Una seconda applicazione – fa notare il gruppo di studio – ha mostrato che l’algoritmo avrebbe potuto identificare la sindrome respiratoria acuta grave SARS-CoV-2 come un ceppo di coronavirus ad alto rischio e che questa previsione non richiedeva alcuna conoscenza preliminare della sindrome respiratoria acuta grave zoonotica (SARS) correlata al coronavirus.
Come accennato all’inizio, in materia di intelligenza artificiale e infezioni virali è stata raccolta una singola sequenza rappresentativa del genoma da 861 specie di virus a RNA e DNA che abbracciano 36 famiglie virali e che contengono specie che infettano gli animali.
Ogni virus è stato etichettato dall’algoritmo AI come in grado di infettare gli esseri umani oppure no. E queste classificazioni dell’infettività umana sono state ottenute unendo tre set di dati precedentemente pubblicati, che riportavano informazioni a livello di specie virali e che, quindi, non consideravano il potenziale di variazione della gamma di ospiti all’interno delle specie virali.
È importante sottolineare – concludono i ricercatori – che, data la probabilità che non tutti i virus in grado di infezione umana abbiano avuto l’opportunità di emergere ed essere rilevati, i virus non segnalati dall’algoritmo possono rappresentare specie non documentate oppure non zoonotiche.
Tuttavia, al di là di questi limiti di tipo metodologico, si tratta di una ricerca che apre a prospettive dalla portata rilevante, che potrebbero, in futuro, condurre alla messa a punto di strumenti di concreta prevenzione contro virus particolarmente aggressivi e dannosi per la salute umana e scongiurare emergenze pandemiche come quella vissuta di recente.