Le riflessioni di un gruppo di dermatologi e di un team di health data science sull’adozione dei sistemi di intelligenza artificiale nella diagnostica, riferita - nello specifico - alle malattie della pelle, è occasione per ricordare i limiti (forse invalicabili?) della macchina nel contemplare la complessa realtà del mondo clinico, con problematiche ed esigenze annesse e connesse.

L’impiego delle tecniche di intelligenza artificiale nella diagnosi clinica, per mezzo dell’analisi e dell’incrocio dei dati video derivati dall’imaging medicale, è una pratica sviluppatasi piuttosto rapidamente durante gli ultimi cinque anni.

Tra le aree di elezione, la dermatologia è quella più promettente, in quanto la diagnosi delle malattie della pelle si fonda prevalentemente sull’osservazione e lo studio della morfologia di porzioni di tessuto circoscritte, all’interno delle quali il focus è rappresentato dalla presenza di lesioni cutanee di differente natura, dove il “sintomo” è dato dal “segno” sulla pelle del paziente. Dunque, un campo di azione limitato e ben preciso, le cui informazioni si prestano agilmente all’esame da parte di algoritmi AI.

Nel 2017 – viene ricordato in un articolo apparso su Health Data Science, dal titolo “Artificial Intelligence in Skin Diseases: Fulfilling its Potentials to Meet the Real Needs in Dermatology Practice”, a cura del Dipartimento di dermatologia presso l’ospedale universitario di Pechino e del National Institute of Health Data Science dello stesso Ateneo cinese – un team di ricercatori della Stanford University, in uno scritto pubblicato su Nature che ha fatto storia in ambito medico, avanzò la tesi in base alla quale, nell’individuare e classificare il cancro della pelle, le prestazioni di sistemi AI dotati di reti neurali convoluzionali addestrate su quasi 130.000 immagini cliniche, sono paragonabili a quelle dei dermatologi.

Da allora – fa notare il gruppo di studio cinese – in molti paesi sono stati sviluppati prodotti simili (alcuni dei quali approvati dalla Food and Drug Administration statunitense), con l’obiettivo di sostituire, nella fase puramente diagnostica, la figura dello specialista in dermatologia.

È il caso delle app per smartphone a pagamento, tra cui – solo per citare qualche esempio – SkinVision e SkinScan, attualmente disponibili in Europa, veri e propri servizi medici in grado di valutare rapidamente le alterazioni cutanee sospette, a partire da una fotografia scattata direttamente dal paziente col proprio telefono cellulare.

«L’intelligenza artificiale in sostituzione dei dermatologi sembra essere una realtà del prossimo futuro. Tuttavia, il punto di vista dei medici specialisti della materia – per i quali l’applicazione dell’AI nella diagnostica è ben lungi dal raggiungere il suo scopo – è diverso. Lo sviluppo di strumenti di artificial intelligence efficaci e validi in dermatologia non può, infatti, prescindere dalla conoscenza, da parte della macchina, di quelle che sono, nella realtà, le problematiche e le esigenze concrete del mondo clinico» si legge nel documento. Ma andiamo in profondità.

Intelligenza artificiale nella diagnosi clinica: le criticità legate ai dati di addestramento degli algoritmi

Nel loro documento in tema di intelligenza artificiale applicata alla diagnosi clinica in dermatologia, il primo scenario sul quale i ricercatori dell’Università di Pechino richiamano l’attenzione riguarda lo screening iniziale delle dermatosi infiammatorie gravi da parte del medico generico, «non pienamente competente nell’identificare con prontezza i “casi sospetti”, come lo sono le neoplasie cutanee, che devono essere immediatamente sottoposti all’attenzione dello specialista».

Questo è un esempio – sottolineano gli autori – in cui si rendono necessari strumenti di assistenza diagnostica specialistici a supporto dei medici di famiglia. Ma, in tale situazione, un sistema dotato di tecniche AI potrebbe davvero essere utile?

Per esserlo – spiega il team di studio – gli sviluppatori dovrebbero lavorare sulla sensibilità dell’algoritmo di intelligenza artificiale che, a sua volta, è correlata all’utilizzo non solo di set di dati di addestramento assai ampi, ma anche altamente generalizzabili, ossia contenenti uno spettro completo di casi di dermatosi, riferite a pazienti di ambo i sessi, appartenenti a diversi gruppi di età e di etnie. Questa è la prima richiesta esplicitata nel documento.

Mancanza di specificità e di interpretabilità: altri punti deboli dell’AI in ambito diagnostico

In tema di intelligenza artificiale applicata alla diagnosi clinica in dermatologia, passiamo ora a un caso opposto che, dai dataset generalizzabili, ci conduce all’esigenza di dati di addestramento dall’elevata specificità.

Accade in ambito ospedaliero, dove i dermatologi necessitano di strumenti diagnostici in grado di aiutarli a riconoscere tempestivamente quelle malattie della pelle non visibili con chiarezza nelle loro fasi iniziali, perché legate a lesioni cutanee non specifiche, spesso causa di diagnosi errate:

«In questa circostanza, l’elevata specificità dei dati di allenamento dell’algoritmo AI è la richiesta prioritaria da parte del medico specialista»

E in questo, «le attuali reti neurali convoluzionali (CNN o ConvNet, dall’inglese Convolutional Neural Network) – rimarcano gli autori – presentano alcune limitazioniIn primo luogo, perché lo sviluppo di strumenti di diagnostica dermatologica dall’elevata specificità richiede numerosi casi sui quali “formarli”, spesso limitati dalla bassa incidenza di specifiche malattie della pelle. Ad esempio, sebbene il melanoma maligno sia, in sede diagnostica, già da tempo oggetto di applicazioni di intelligenza artificiale, nel caso specifico della Cina non è sempre facile raccogliere un numero sufficiente di casi». Qui, infatti, ogni anno, a livello nazionale, vengono diagnosticati meno di 20000 nuovi casi di melanoma maligno: «un numero al di sotto rispetto a quello richiesto, affinché l’algoritmo di intelligenza artificiale raggiunga una specificità soddisfacente».

Un altro aspetto critico sul quale gli autori si sono soffermati ha, invece, a che vedere con la mancanza di interpretabilità imputata alle macchine dotate di intelligenza artificiale, rea di condizionare negativamente la fiducia di medici e pazienti nei confronti dei dati di output emessi, ovvero delle diagnosi formulate analizzando le immagini delle lesioni cutanee.

In particolare, viene ancora una volta posto in evidenza il divario tra le potenzialità delle tecniche di intelligenza artificiale e le aspettative, in termini di affidabilità e di sicurezza, da parte di coloro che le adottano, «derivate dal principio “primo, non nuocere”».

Per colmare questo divario, occorrono gli sforzi congiunti di dermatologi, da un lato, e di sviluppatori, ingegneri e tecnici dell’AI dall’altro, «punto di partenza per tradurre il potenziale di cambiamento prospettato dall’assistenza sanitaria supportata dall’intelligenza artificiale in reali benefici per i pazienti».

Intelligenza artificiale nella diagnosi clinica: come migliorare le prestazioni dell’AI

In tema di intelligenza artificiale applicata alla diagnosi clinica, il team di ricercatori suggerisce alcune azioni da compiere per migliorare le prestazioni dei sistemi supportati dall’AI, non necessariamente riferite alla dermatologia, ma aperte a qualsiasi campo medico. Di seguito, elenchiamo quelle ritenute più urgenti.

1. Intervenire sui dataset di addestramento

Dal punto di vista dei dati che andranno ad allenare gli algoritmi – osserva il gruppo di studio – è necessario costruire un set multidimensionale e standardizzato, comprendente i dati sanitari dei pazienti, le informazioni cliniche che li riguardano, le immagini delle lesioni, gli esiti di esami diagnostici quali dermatoscopia e microscopia confocale, relativi a donne e uomini, a diverse fasce di età e a diverse etnie.

«Il set di dati dovrebbe essere il più possibile completo, poiché funge da base allo sviluppo e alla convalida del modello di intelligenza artificiale. E la sua messa a punto richiede una comunicazione transdisciplinare tra medici – in questo specifico caso dermatologi – ed esperti AI».

2. Includere anche il sapere medico nello sviluppo degli algoritmi

In secondo luogo, gli algoritmi di intelligenza artificiale sviluppati per l’impiego nella diagnosi clinica, dovrebbero potersi adattare a diversi dataset del mondo reale, comprendenti, ad esempio, i dati relativi all’anamnesi dei pazienti. E una potenziale direzione per tale adattamento è data «dall’includere, nello sviluppo degli stessi algoritmi, la conoscenza, il sapere di esperti della materia, ovvero di medici specialisti in dermatologia, al fine di migliorare le prestazioni della macchina».

3. Bilanciare il rapporto medico-macchina

Un’ultima azione riguarda la progettazione di una strategia per fare in modo che – in sede diagnostica – vi sia una cooperazione tra essere umano (il medico) e macchina (sistema diagnostico AI), «stando attenti, per quanto riguarda la seconda, a bilanciare la sensibilità e la specificità dell’algoritmo di intelligenza artificiale nel soddisfare le effettive esigenze dettate dalla gestione dell’intero ciclo di vita delle malattie della pelle».

Scritto da:

Paola Cozzi

Caporedattrice Leggi articoli Guarda il profilo Linkedin