L’intelligenza artificiale sta rivoluzionando il campo della logopedia, offrendo soluzioni innovative che migliorano l'accessibilità e l'efficacia delle terapie.

disturbi del linguaggio, come la disartria e l’afasia, rappresentano sfide significative per molte persone, compromettendo la loro capacità di comunicare in modo efficace e di esprimere pensieri, emozioni e bisogni.

Queste condizioni spesso derivano da danni neurologici causati da traumi come ictus, lesioni cerebrali o malattie degenerative, che influiscono sulle aree del cervello deputate alla produzione e alla comprensione del linguaggio.

La perdita parziale o totale della capacità di parlare non riguarda solo l’aspetto funzionale della comunicazione, ma colpisce anche la sfera psicologica e sociale della persona, che si trova improvvisamente isolata e frustrata dalla propria incapacità di esprimersi.

Tradizionalmente, le terapie logopediche intensive hanno cercato di ridurre l’impatto di questi disturbi, ma i progressi tecnologici, in particolare intelligenza artificiale e machine learning, stanno rivoluzionando il trattamento e la gestione di questi problemi.

Le tecniche AI sono in grado di riconoscere e interpretare il linguaggio poco chiaro o confuso,traducendolo in un discorso comprensibile per gli altri. Sistemi avanzati, sviluppati in laboratori di ricerca specializzati, possono facilitare la comunicazione, migliorando la qualità della vita dei pazienti e offrendo nuove soluzioni per chi ha difficoltà a interagire verbalmente.

Questo tipo di innovazione non solo permette di superare barriere linguistiche, ma offre anche una nuova speranza per chi, per anni, ha faticato a esprimersi a causa di disturbi del linguaggio.


L’intelligenza artificiale sta rivoluzionando il trattamento dei disturbi del linguaggio, come la disartria e l’afasia. Grazie a tecnologie avanzate, i computer sono in grado di interpretare il linguaggio poco chiaro dei pazienti e di trasformarlo in un discorso comprensibile, migliorando la comunicazione e la qualità della vita di chi ha difficoltà verbali.
Le tecnologie di Comunicazione Aumentativa e Alternativa (AAC) supportate dall’intelligenza artificiale stanno offrendo nuovi approcci per aiutare i bambini con disturbi fonologici. Dispositivi con sintesi vocale e strumenti visivi rafforzano la consapevolezza fonemica, mentre l’AI personalizza gli esercizi per migliorare la capacità comunicativa in modo efficace e coinvolgente.
La ricerca guidata da Helen Meng presso l’Università Cinese di Hong Kong utilizza l’AI per migliorare il riconoscimento del linguaggio disartrico e monitorare condizioni neurologiche come la demenza. Queste tecnologie non solo migliorano la comprensione del discorso, ma offrono anche un biomarcatore accessibile per diagnosticare e monitorare malattie neurologiche come l’Alzheimer.

Cosa sono e quali sono i disturbi del linguaggio

I disturbi del linguaggio sono condizioni che compromettono la capacità di una persona di esprimersi in modo corretto, spesso a causa di danni ai muscoli, ai nervi o alla struttura vocale stessa. Si tratta di disturbi complessi, che possono manifestarsi in diverse forme.

Ad esempio, la disartria è un disturbo motorio del linguaggio dovuto a problemi muscolari che influenzano la capacità di parlare, mentre l’afasia, causata solitamente da un trauma cerebrale, compromette la capacità di comprendere o produrre discorsi e di leggere o scrivere.

La disfonia è invece un altro disturbo, che altera il tono vocale, influenzando la qualità, il volume e lo sforzo della voce.

La malattia di Parkinson può provocare una particolare forma di disartria chiamata disartria ipocinetica, che si manifesta con voce monotona, bassa e con difficoltà nell’articolare le parole.

L’aprassia del linguaggio, invece, è un disturbo neurologico che impedisce ai pazienti di compiere movimenti necessari a produrre suoni, nonostante sappiano cosa dovrebbero fare.

Un altro disturbo del linguaggio comune è la balbuzie, caratterizzata da problemi di fluenza che causano ripetizioni o prolungamenti dei suoni. Infine, i disturbi fonologici, come il “sigmatismo” portano le persone ad avere difficoltà nel pronunciare alcuni suoni, anche se non c’è un motivo fisico apparente.

Questi disturbi possono influenzare significativamente la qualità della vita di chi ne soffre, rendendo fondamentale il ricorso a terapie specialistiche per migliorare le capacità comunicative.

Speechandlanguagedisabilities presenta un’interessante tassonomia, che aiuta a capire quali sono i disturbi ai quali facciamo riferimento in questo articolo e come si manifestano.

Schema che riporta una tassonomia per capire quali sono i disturbi del linguaggio e della parola e come si manifestano (fonte: “Speech and Language Disorders” - https://speechandlanguagedisabilities.weebly.com).
In letteratura, i “disturbi del linguaggio e della parola” rientrano nella categoria dei disturbi della comunicazione, insieme ai disturbi uditivi e alla sordità, nonché alle disabilità fisiche che influenzano il linguaggio (fonte: “Speech and Language Disorders” – https://speechandlanguagedisabilities.weebly.com).

Quale approccio ai disturbi del linguaggio

Il supporto ideale per pazienti affetti da disturbi del linguaggio è la logopedia, disciplina specializzata nell’aiutare le persone a superare disturbi del linguaggio e della comunicazione. Una disciplina nella quale l’interazione umana ha sempre giocato un ruolo chiave, non solo con l’obiettivo di correggere la pronuncia, ma anche e soprattutto di abilitare le persone a esprimersi, connettersi e partecipare pienamente alla società.

Con l’avanzare rapido della tecnologia, questo approccio viene affiancato da nuovi strumenti, che possono complementare la tradizionale logopedia, superandone alcuni limiti.

Non vi è dubbio che la logopedia rappresenti una risposta efficace, capace di apportare cambiamenti significativi nella vita delle persone, sia che si tratti di un bambino con difficoltà di articolazione, un adulto in fase di recupero da un ictus o qualcuno con un disturbo del linguaggio cronico.

Tuttavia, resta un approccio terapeutico dispendioso in termini di tempo – poiché richiede molte sessioni settimanali in presenza, un ostacolo per chi ha impegni o vive lontano dai terapisti – e costoso, soprattutto se non coperta dal servizio sanitario nazionale.

Dal punto di vista del paziente, poi, può non essere semplice trasferire le competenze acquisite nel percorso terapeutico alla vita quotidiana e, in generale, l’approccio tradizionale può risultare meno stimolante, riducendo la partecipazione attiva.

Dalla logopedia tradizionale alla terapia potenziata dalla tecnologia

Come già accennato, il percorso di logopedia può essere affrontato sia in modalità tradizionale, nella quale i terapisti lavorano direttamente con i pazienti usando esercizi personalizzati, sia scegliendo una terapia potenziata dalla tecnologia, che utilizza strumenti digitali e attività interattive.

In sintesi, il percorso di logopedia tradizionale si basa sull’interazione diretta tra pazienti e logopedisti, che offrono attenzione su misura, valutando le necessità individuali e fornendo guida mirata. Essi utilizzano strumenti fisici e tecniche tattili per migliorare articolazione, pronuncia e fluidità, propongono esercizi vocali e linguistici personalizzati per rafforzare le capacità comunicative del paziente e monitorano in tempo reale i progressi, apportando quelle modifiche immediate che migliorano l’efficacia della terapia.

La terapia logopedica potenziata dalla tecnologia rappresenta un cambiamento radicale, unendo i metodi tradizionali con tecnologie avanzate. Si tratta di un approccio potenziato, che dunque può sfruttare una serie di benefici che la tecnologia offre, a partire da una maggiore personalizzazione dell’intervento, grazie all’utilizzo di algoritmi di apprendimento automatico che analizzano dati per identificare problemi specifici di linguaggio e adattare gli esercizi.

Miglioramento dell’engagement del paziente, ubiquità e flessibilità, feedback istantanei, monitoraggio meticoloso dei progressi, che agevola la valutazione e l’adattamento degli obiettivi terapeutici, riduzione dei costi: sono questi alcuni dei benefici che la tecnologia può aggiungere alla logopedia tradizionale.

Tecnologie chiave nella logopedia

Cerchiamo, dunque, di capire quali sono le tecnologie che già stanno trasformando la logopedia, migliorando i risultati dei pazienti e la qualità complessiva dei servizi e quali sono le prospettive di sviluppo futuro

Tra le tecnologie più consolidate, il cui sviluppo risale ai primi anni Cinquanta per poi venire perfezionati negli anni Ottanta dello scorso secolo, abbiamo i software di riconoscimento vocale, che consentono ai pazienti di praticare esercizi di linguaggio con dispositivi come smartphone o computer, ricevendo feedback immediati.

Anche i progressi fatti in questi anni nella telemedicina hanno migliorato l’accessibilità e la fruibilità delle terapie logopediche anche a chi vive in zone remote o ha problemi di mobilità, introducendo maggiore flessibilità e adattando di conseguenza le sessioni ai bisogni dei pazienti, anche in un’ottica di maggiore continuità e regolarità delle cure.

In termini di engagement, un importante miglioramento è arrivato dalle App, in grado di trasformare la logopedia in un gioco divertente, in grado di indirizzare anche bisogni particolari, come la pronuncia di specifici suoni.

Un ulteriore importante supporto, negli ultimi anni, è arrivato anche dalle applicazioni di realtà virtuale, che offrono una esperienza immersiva e aiutano i pazienti a esercitarsi in ambienti simulati e controllati, con feedback in tempo reale.

Ma è dall’intelligenza artificiale e dall’analisi dei dati che si attendono i risultati più importanti, sia in termini personalizzazione dei percorsi e dei trattamenti, sia in termini di benefici tangibili per i pazienti, anche nella prima infanzia.

Il ruolo di AI e machine learning nel trattamento dei disturbi del linguaggio nei bambini

L’intelligenza artificiale (IA) offre nuove possibilità per trattare disturbi complessi, come il disturbo fonologico nei bambini (Speech and Sound Disorder – SSD). Tecnologie come la Comunicazione Aumentativa e Alternativa (AAC) hanno già mostrato risultati promettenti nell’aiutare persone con SSD, ma i metodi basati sull’AI potrebbero migliorare ulteriormente sia diagnosi sia terapia, consentendo ai professionisti sanitari di migliorare i risultati comunicativi per i bambini con disturbi del linguaggio, favorendo una diagnosi precoce e terapie personalizzate.

La sinergia tra AI, ML e AAC non solo apre nuove strade per la terapia del linguaggio, ma stimola anche il coinvolgimento dei genitori nel processo terapeutico.

La terapia del linguaggio, solitamente avviata tra i 2 e i 4 anni, sfrutta la capacità dei bambini di apprendere il linguaggio attraverso l’ascolto e l’interazione. In questo processo, i genitori svolgono un ruolo cruciale come primi educatori. Tuttavia, quando il supporto dei genitori non è sufficiente, si ricorre alla terapia del linguaggio convenzionale, che prevede esercizi personalizzati ideati dai terapisti.

Sebbene efficace, questo approccio richiede un’interazione individuale intensiva, rendendo difficile la sua applicazione su larga scala. È qui che l’AI può fare la differenza, offrendo interventi su misura per un numero maggiore di persone, senza sacrificare l’attenzione personalizzata.

Tra Comunicazione Aumentativa e Alternativa e AI

Già citata in questo articolo, l’Augmentative Alternative Communication (AAC) è, di fatto, il termine che comprende tutti i metodi di comunicazione non verbale, utili alle persone che affrontano difficoltà nel linguaggio o nella parola. Il termine “augmentative” si riferisce a strumenti che supportano la comunicazione verbale, mentre “alternative” indica metodi di comunicazione diversi dal linguaggio parlato.

L’AAC include, dunque, una vasta gamma di sistemi che facilitano la trasmissione e comprensione dei messaggi.

L’AAC comprende strumenti come lavagne di comunicazione con immagini, dispositivi che generano linguaggio, oggetti tangibili, espressioni facciali e l’uso delle dita per l’ortografia. Questi strumenti consentono agli individui di esprimere pensieri, bisogni, emozioni e opinioni in modo indipendente.

Le tecnologie AAC offrono nuove possibilità per affrontare le sfide comunicative, compensando difficoltà temporanee o permanenti.

Per i bambini con disturbo del suono della parola (SSD), gli avanzamenti nell’AAC stanno ampliando le opportunità terapeutiche. Dispositivi come quelli con sintesi vocale offrono un mezzo alternativo per chi ha difficoltà nel produrre un linguaggio chiaro. Inoltre, strumenti visivi come le lavagne di comunicazione con immagini rafforzano la consapevolezza fonemica, facilitando la produzione dei suoni. Tecnologie avanzate, che sfruttano l’intelligenza artificiale, trasformano i suoni indistinti in discorsi intelligibili e personalizzano gli esercizi per migliorare la comunicazione.

Di fatto, i dispositivi che integrano l’AI nelle loro funzionalità utilizzano algoritmi di elaborazione del linguaggio naturale per comprendere il parlato e fornire feedback in tempo reale, promuovendo un dialogo espressivo.

Inoltre, giochi interattivi basati sull’AI creano ambienti virtuali immersivi che stimolano l’interazione sociale e l’acquisizione del linguaggio, adattandosi alle preferenze terapeutiche di ciascun utente.

Grazie a strumenti di screening alimentati dall’AI, è possibile eseguire valutazioni rapide e precise delle capacità linguistiche, consentendo una diagnosi precoce e interventi tempestivi.

Queste tecnologie rappresentano un avanzamento rivoluzionario nella cura dei bambini con disturbi del linguaggio, migliorando lo sviluppo linguistico, le competenze sociali e il benessere complessivo.

Una nuova frontiera nella disartria

Sono molti gli ambiti nei quali l’AI può aiutare i pazienti affetti da disturbi del linguaggio. Uno studio recente ne dimostra l’efficacia anche con pazienti affetti da disartria, per i quali la capacità di comunicare può essere compromessa da danni neurali o muscolari, che rendono il linguaggio lento, distorto e difficile da comprendere.

«Con gli strumenti avanzati sviluppati nel nostro laboratorio di ricerca, i computer sono in grado di riconoscere il linguaggio non chiaro dei pazienti con disartria e di convertirlo in un linguaggio intelligibile, facilitando e migliorando la comunicazione», racconta Helen Meng, professoressa di ingegneria dei sistemi e gestione dell’ingegneria presso l’Università Cinese di Hong Kong.

In questo Ateneo, la docente ha fondato lo Human-Computer Communications Laboratory, focalizzato sull’elaborazione del linguaggio e della parola, che si è poi evoluto nel Centro per l’Intelligenza Percettiva e Interattiva (InnoHK Centre), di cui Meng è attualmente direttrice.

Uno dei progetti principali sui quali si concentra il gruppo di lavoro utilizza tecniche di apprendimento automatico per decodificare e ricostruire linguaggi parlati, concentrandosi in particolare sui linguaggi non inglesi, come il cinese, lingua tonale caratterizzata da diversi dialetti.

È questo un punto centrale per il team di ricerca: secondo Meng, è fondamentale sviluppare algoritmi robusti che si adattino a più lingue, per garantire che i progressi tecnologici siano accessibili a tutti.

Il team di Meng ha sviluppato una tecnologia avanzata di ricostruzione del linguaggio disartrico (Dysarthric Speech Reconstruction (DSR) technology) per parlanti sia di lingua inglese sia di lingua cantonese.

In questo sistema il linguaggio disartrico viene inserito in un “encoder” guidato dall’AI, che estrae caratteristiche dal discorso grezzo e le traduce in dati latenti. Questi vengono poi analizzati da ulteriori algoritmi per generare un discorso più chiaro attraverso un sintetizzatore.

Tra NED e GAN

Come già accennato, i sistemi di ricostruzione del linguaggio disartrico (DSR) hanno lo scopo di trasformare automaticamente il parlato di una persona con disartria in un parlato che suona normale, cioè più chiaro e comprensibile. Esistono diversi approcci tecnologici per farlo.

In passato, uno dei più usati era basato su GAN – Generative Adversarial Network, tuttavia sistemi più recenti, basati su NED – Neural Encoder-Decoder, hanno dimostrato di migliorare di molto la chiarezza del parlato ricostruito rispetto a quelli GAN.

Ma anche i sistemi NED hanno dei limiti: il processo di allenamento è inefficiente e complicato, poiché il sistema NED ha una pipeline complessa e include alcuni compiti extra, che possono ridurre la qualità della ricostruzione finale del parlato.

Per migliorare la situazione, viene dunque proposto un nuovo sistema chiamato “Unit-DSR“, che prende ispirazione da un metodo avanzato chiamato “apprendimento auto-supervisionato delle rappresentazioni del parlato” e utilizza “unità linguistiche discrete” (ovvero rappresentazioni semplificate e distinte del parlato) per rendere più semplice e preciso il ripristino del contenuto del parlato disartrico.

Il sistema Unit-DSR è molto più semplice rispetto ai sistemi NED. Ha solo due componenti principali: un normalizzatore di unità del linguaggio (che regola il modo in cui le parole vengono pronunciate) e un vocoder (uno strumento che trasforma queste rappresentazioni in suoni) chiamato “Unit HiFi-GAN“.

I test effettuati su un database di parlato disartrico (il corpus UASpeech) hanno mostrato che questo nuovo sistema è più efficace nel migliorare la qualità del parlato, riducendo del 28,2% gli errori nelle parole rispetto al parlato disartrico originale. Inoltre, il sistema si è dimostrato robusto, cioè funziona bene anche se la velocità del parlato cambia o se c’è rumore di fondo.

I risultati raggiunti e le opportunità oltre la disartria

Uno degli ostacoli principali che il team ha dovuto superare è stata proprio la mancanza di dati di linguaggio disartrico in lingue diverse dall’inglese. Per affrontare questa sfida, Meng sta creando il Corpus di Disartria dell’Università Cinese (CUDYS), una raccolta di dati vocali da parlanti cantonese affetti da disartria. Questo corpus sarà essenziale per addestrare i modelli AI per la ricostruzione del linguaggio cantonese.

In ogni caso, il sistema ha già ottenuto una significativa riduzione degli errori nel riconoscimento del linguaggio disartrico rispetto all’originale, migliorando così sia l’intelligibilità che la naturalezza del discorso ricostruito.

Per perfezionare ulteriormente il sistema, il team sta utilizzando tecniche di apprendimento auto-supervisionato e unità di linguaggio discrete, riducendo ulteriormente i tassi di errore.

Soprattutto, il team ha lavorato all’identificazione delle caratteristiche vocali distintive, come la ridotta capacità di controllo muscolare, che possono essere analizzate per migliorare i sistemi di riconoscimento del linguaggio e creare terapie più efficaci. Ma c’è di più.

Meng vede anche ulteriori utilizzi della tecnologia di analisi vocale sviluppata, ad esempio per monitorare problemi neurologici come la demenza.

«La voce è un biomarcatore economico e facilmente accessibile, che può essere usato per rilevare e monitorare malattie neurologiche» spiega la ricercatrice, che con il suo team sta sviluppando una piattaforma che utilizza l’AI per estrarre indicatori di malattie neurologiche, come l’Alzheimer, analizzando caratteristiche del discorso come mancanza di fluidità, esitazioni e pause di riempimento.

Glimpses of Futures

Ora, volgiamo lo sguardo alle prospettive future dell’intelligenza artificiale per i disturbi del linguaggio, utilizzando la matrice STEPS per esplorare i possibili scenari futuri di queste tecnologie.

S – SOCIAL: gli esseri umani sono creature sociali per natura, con un’inclinazione innata verso il coinvolgimento e l’interazione. In questo contesto, il linguaggio verbale è una caratteristica unica dell’uomo e svolge un ruolo fondamentale nella capacità di esprimere pensieri, preoccupazioni e punti di vista agli altri. Tuttavia, le persone con disturbi del linguaggio affrontano sfide significative in ambito accademico, psicologico e sociale nel cercare di interagire con la propria comunità. Il numero di persone con disabilità è in costante aumento: secondo l’Organizzazione Mondiale della Sanità, circa 1,3 miliardi di persone nel mondo necessitano di tecnologie assistive, una cifra che potrebbe salire a 2 miliardi entro il 2030. La Convenzione delle Nazioni Unite sui Diritti delle Persone con Disabilità (UNCRPD) ha confermato l’accesso alle tecnologie assistive come un diritto umano fondamentale.

T – TECHNOLOGICAL: il mercato del software per la logopedia ha registrato una crescita significativa negli ultimi anni, con prospettive promettenti per il futuro. Tra i settori che contribuiscono alla sua crescita, troviamo le istituzioni educative, segno del crescente riconoscimento e adozione dei software per la logopedia in questo ambito. Con il continuo sviluppo tecnologico, queste soluzioni sono destinate a svolgere un ruolo sempre più centrale nel supporto agli individui con difficoltà del linguaggio. Guardando al futuro, il mercato del software per la logopedia appare promettente, con il potenziale di trasformare ulteriormente il panorama del supporto alla comunicazione, alla terapia e agli interventi. Man mano che l’AI, il machine learning e altre tecnologie innovative avanzano, le capacità dei software di logopedia diventeranno più sofisticate, personalizzate ed efficaci, promettendo di migliorare la qualità della vita delle persone con disturbi del linguaggio e di rivoluzionare i metodi di terapia a supporto.

E – ECONOMIC: l’uso dell’intelligenza artificiale e delle tecnologie aumentative per la terapia dei disturbi del linguaggio offre un significativo valore economico, oltre che sociale. I dispositivi di generazione del parlato e le app educative per l’apprendimento linguistico, come gli strumenti di comunicazione aumentativa e alternativa (CAA), permettono alle persone con difficoltà di espressione di partecipare attivamente alla società, riducendo il loro isolamento e aumentando la loro produttività. L’integrazione di queste tecnologie nei programmi educativi e nella forza lavoro non solo migliora l’acquisizione delle competenze linguistiche, ma favorisce anche una maggiore diversificazione lavorativa, rendendo le aziende più competitive.

P – POLITICAL: le implicazioni politiche e normative legate all’uso dell’intelligenza artificiale nella comunicazione umana richiedono una particolare attenzione a diversi aspetti. In primo luogo, è necessario stabilire regolamenti che garantiscano la privacy e la sicurezza dei dati, poiché l’elaborazione del linguaggio richiede la raccolta di informazioni personali, come le registrazioni vocali. È fondamentale assicurare che questi dati siano protetti per prevenire abusi o violazioni. Inoltre, è cruciale definire norme etiche per contrastare l’uso improprio dell’IA, ad esempio nella creazione di contenuti falsi o manipolatori. Anche la capacità dell’IA di comprendere le sottigliezze linguistiche deve essere considerata, per evitare interpretazioni errate che potrebbero influenzare negativamente la comunicazione in ambito sanitario.

S – SUSTAINABILITY: le tecnologie applicate ai disturbi del linguaggio offrono notevoli benefici anche dal punto di vista della sostenibilità. L’impiego di intelligenza artificiale e tecnologie di Comunicazione Aumentativa e Alternativa (CAA) consente, in primis, di ridurre gli spostamenti necessari per accedere alle terapie, grazie alle piattaforme digitali e agli strumenti di telemedicina. Questo rende i trattamenti più accessibili anche alle persone che vivono in aree remote o hanno difficoltà in termini di mobilità. Inoltre, queste soluzioni favoriscono l’inclusione, permettendo a chi ha disturbi del linguaggio di partecipare più attivamente alla vita sociale e lavorativa. Infine, l’utilizzo di tecnologie avanzate riduce i costi delle terapie tradizionali, offrendo trattamenti personalizzati e continui, con un impatto positivo sia per i pazienti che per i sistemi sanitari.

Scritto da:

Maria Teresa Della Mura

Giornalista Leggi articoli Guarda il profilo Linkedin