Il lavoro di revisione critica di tre Atenei cinesi sull’impiego dell’AI in alcuni compiti di analisi dell’imaging cellulare, sottolinea il gap tra le prestazioni degli algoritmi in sede di ricerca e sviluppo e le loro applicazioni pratiche nei laboratori di biologia.

L’adozione delle tecniche di intelligenza artificiale nella ricerca in ambito biomedico, per l’analisi delle immagini di cellule, è divenuta, nell’ultimo decennio, strategica nel supportare l’elaborazione di quei dati video atti a ricostruire in che modo un sistema di vita (vegetale, animale o umano) reagisce a una serie di stimoli e interagisce con i cambiamenti ambientali. 

Si pensi – ad esempio – ai suoi impieghi nella scoperta di nuovi farmaci, in cui l’intelligenza artificiale interviene a sostegno dello screening dei potenziali farmaci candidati, nonché dello studio delle risposte delle cellule di interi organismi a specifiche sostanze chimiche.

È, in particolare, il deep learning – appartenente al campo di studi del machine learning – la tecnica AI più ampiamente impiegata per tali applicazioni, specie in riferimento a due compiti cruciali nell’analisi delle immagini delle cellule, ossia la segmentazione e il tracciamento.

«Il deep learning ha mostrato una potente capacità di estrarre informazioni utili da input grezzi, tuttavia è fortemente influenzato dalla qualità del set di dati di addestramento. Un tipico metodo di deep learning è costituito da un modulo di inferenza e da un modulo di riqualificazione. Quando l’ambiente di test cambia, se il modulo di inferenza non raggiunge prestazioni di generalizzazione soddisfacenti, la rete neurale profonda deve essere riaddestrata per adattarsi al nuovo dominio di dati»

osserva il team composto dai ricercatori di tre Atenei cinesi – lo Shenzhen Institute of Advanced Technology presso l’University of Chinese Academy of Sciences, l’University of Hong Kong e la Zhejiang University – autori dello studio descritto nel documento “Deep Learning in Cell Image Analysis”, in cui si fa il punto sugli attuali metodi computazionali nell’analisi delle immagini di cellule, evidenziandone luci e ombre e annunciandone le future sfide. Diamo uno sguardo a che cosa è emerso.

Intelligenza artificiale per l’analisi delle immagini di cellule: le attuali tecniche per la segmentazione

In materia di intelligenza artificiale per l’elaborazione delle immagini di cellule, sono tre i compiti cruciali sui quali si è focalizzato il team nel considerare i passi avanti compiuti fino ad oggi dai metodi che vedono l’applicazione del deep learning.

Il primo di questi concerne la segmentazione cellulare, i cui metodi più popolari oggi esistenti possono essere suddivisi tra quelli basati sulla tecnica di “ancoraggio” e quelli basati sulla “regione”.

Nei primi – illustrano i ricercatori – ogni pixel dell’immagine cellulare viene assegnato a più ancore (ossia a più segmenti), «consentendo il rilevamento simultaneo di cellule multiple e persino sovrapposte [si veda l’immagine riportata in fondo al paragrafo – ndr]. Dopo che la rete neurale ha fatto un’analisi predittiva circa la probabilità che una cellula sia presente in ciascun ancoraggio, viene effettuata una post-elaborazione dell’immagine per selezionare gli ancoraggi con il punteggio più alto».

metodi basati sulla regione adottano, invece, una rete neurale convoluzionale profonda come “estrattore” di caratteristiche dalle immagini delle cellule e classificano ogni ancoraggio predefinito attraverso le immagini di input.

Di recente – fanno notare gli autori – i metodi AI di segmentazione basati sulla “regione” hanno guadagnato un’attenzione crescente a causa dei loro schemi semplici, end-to-end, «in grado di trasformare ogni pixel dell’immagine cellulare nella rappresentazione desiderata, dalla quale gli algoritmi successivi possono recuperare le singole celle».

Immagine che illustra il confronto tra le due più diffuse tecniche di deep learning applicate alla segmentazione delle immagini cellulari, basate, rispettivamente, sull’ “ancoraggio” (a) e sulla “regione” (b): le prime segmentano l’immagine a partire da ancore predefinite, le seconde le segmentano a partire da etichette ausiliarie (Fonte: “Deep Learning in Cell Image Analysis” - Shenzhen Institute of Advanced Technology presso l’University of Chinese Academy of Sciences).
Confronto tra le due più diffuse tecniche di deep learning applicate alla segmentazione delle immagini di cellule, basate, rispettivamente, sull’ “ancoraggio” (a) e sulla “regione” (b): le prime segmentano l’immagine a partire da ancore predefinite, le seconde le segmentano a partire da etichette ausiliarie (Fonte: “Deep Learning in Cell Image Analysis” – Shenzhen Institute of Advanced Technology presso l’University of Chinese Academy of Sciences).

Tecniche di deep learning per il tracciamento cellulare: limiti e nuove soluzioni

In tema di intelligenza artificiale per il tracciamento delle immagini di cellule, la maggior parte dei metodi basati sul deep learning continuano ad essere semplici schemi di “tracciamento per rilevamento”. La criticità – rimarcano i ricercatori – è che tali tecniche AI non sfruttano «le ricche informazioni dei segnali spazio-temporali» contenute nei dati video tratti e decisive nello studio delle dinamiche cellulari.

Per il rilevamento delle cellule e il monitoraggio delle loro dinamiche, sono stati proposti nuovi metodi AI, tra cui una rete neurale artificiale ricorrente – con neuroni collegati tra loro in un ciclo – «che ha avuto il merito di ottimizzare la rete con una serie di etichette di segmentazione e di informazioni di tracciamento» spiega il gruppo di ricerca.

Tuttavia, questo metodo può gestire solo le immagini cellulari caratterizzate da un ingrandimento e da un frame rate elevati, il che ne limita l’applicazione.

Un’altra recente proposta (tuttora in fase di test) per cogliere i dati spazio-temporali a partire dall’analisi delle immagini di cellule prevede una “mappa di campo vettoriale” – «messa a punto per codificare simultaneamente la posizione e il movimento delle cellule» – che tratta gli oggetti all’interno delle immagini come se fossero punti.

Adottando due immagini successive come input, produce un numero di vettori la cui forma indica i “centri cellulari” e la cui direzione indica “la posizione formale delle cellule”. «Tuttavia – fanno sapere i ricercatori – la mappa di campo vettoriale, al momento, è stata testata solo su una piccola frazione di tracce su un set di dati su larga scala, a causa della mancanza di etichettature delle immagini. Pertanto, le sue prestazioni pratiche devono ancora essere dimostrate».

Intelligenza artificiale per le immagini di cellule: l’AI applicata alla classificazione

Iniziamo col dire che l’operazione di classificazione delle immagini di cellule spesso funge da compito di analisi a valle per lo screening fenotipico delle cellule (ossia delle loro caratteristiche) nell’ambito dello studio di nuovi farmaci.

Prima dell’impiego delle tecniche di intelligenza artificiale per l’elaborazione delle immagini di cellule, il flusso del lavoro classico del biologo nel classificare i dati video a sua disposizione, includeva innanzitutto il controllo della qualità – col fine di rimuovere eventuali campioni anomali – la selezione di quelle caratteristiche utili all’analisi, eliminando caratteristiche non necessarie o ridondanti, e infine la scelta di un algoritmo di classificazione.

Con l’adozione delle reti neurali artificiali profonde, l’onerosa e complessa pipeline è stata abolita. Ma esiste, anche in questo caso, una criticità, data dal fatto che l’intervento dell’intelligenza artificiale si traduce – per quanto riguarda la classificazione delle cellule – in uno schema in cui ogni immagine (senza etichetta) può arrivare a contenere fino a centinaia di cellule con fenotipi diversi e spesso con valori anomali.

Per dedurre quale sia il fenotipo coretto, in relazione – ad esempio – a determinate risposte delle cellule a specifiche sostanze chimiche testate per la ricerca di nuovi farmaci, è stata introdotta una particolare tecnica di machine learning – denominata “multiple instance learning” – «per addestrare una rete neurale artificiale integrale a segmentare le cellule e, congiuntamente, a prevedere l’etichetta da assegnare a ogni immagine, filtrando così i valori anomali» spiegano gli autori.

Un’altra soluzione vede, invece, il ricorso a un’architettura di rete neurale multi-scala «per eliminare ulteriormente la fase di segmentazione e classificare i fenotipi in quelli coesi, il che riduce ulteriormente lo sforzo di etichettatura».

In questo caso, però, i classificatori della rete devono poter essere addestrati sotto la supervisione di etichette significative per poter apprendere caratteristiche utili. Ma tali etichette, relativamente alle immagini cellulari, non sono sempre facili da ottenere. Dunque, la questione rimane aperta.

Le sfide aperte in tema di dati di addestramento

In materia di intelligenza artificiale per le immagini di cellule, ciò su cui gli autori dello studio puntano il dito è il divario tra le prestazioni degli algoritmi di deep learning in sede di ricerca e sviluppo e le loro applicazioni pratiche nei laboratori di biologia.

Abbiamo accennato ad alcuni limiti e criticità delle tecniche AI nel supportare quelli che sono i tre compiti cruciali nell’analisi dell’imaging cellulare, ossia la segmentazione, il tracciamento e la classificazione.

Su tutti – aggiunge il team di studio – prevale il problema dei dati di addestramento, che devono essere sufficienti, accurati ed etichettati, al fine di garantire la generalizzazione dei modelli AI messi a punto.

In ambito scientifico – compresa la biologia – non è, però, inusuale trovarsi di fronte a mole di dati privi di ordine e di annotazioni esaustive, col rischio che dataset di immagini cellulari contenenti informazioni inesatte o distorte possano degradare le prestazioni degli algoritmi.

In particolare, per migliorare l’analisi delle immagini di cellule per mezzo delle tecniche di deep learning, si deve intervenire su tre aspetti dei set di dati di addestramento: la quantità, la loro qualità e l’affidabilità. Il primo di tali aspetti è quello più macroscopico, dal quale poi derivano gli altri, come notano i ricercatori:

«Attualmente, sebbene le immagini di cellule possano essere raccolte utilizzando la microscopia e le fotocamere, la costruzione di un set di dati di immagini di cellule su larga scala rimane un compito faticoso. Questo perché, rispetto alle immagini comuni, quelle delle cellule richiedono biologici esperti per assegnare etichette, immagine per immagine».

Il lavoro dei tre Atenei cinesi, facendo il punto sugli attuali metodi computazionali di cui si avvale la ricerca biomedica, mettendone in luce la non piena maturità, lancia spunti interessanti, sia alla comunità scientifica che a coloro che si occupano dello studio e dello sviluppo di algoritmi di intelligenza artificiale, affinché, in futuro, si giunga ad applicazioni più performanti dell’AI nelle Life Science.

Scritto da: