Un affascinante studio sulle similitudini tra le prestazioni delle reti neurali artificiali e l’organizzazione e il funzionamento del cervello umano, conferma - per le macchine - la specializzazione in processi di elaborazione differenti dei diversi dati in ingresso.
TAKEAWAY
- Due reti neurali artificiali allenate per due compiti differenti: in che modo le funzionalità di una supportano l’altra nella decodifica di dati non compresi nei set di addestramento? A domandarselo, un recente studio del MIT, che confermal’ipotesi per cui le rappresentazioni apprese dalle reti nell’ambito di una specifica attività, a fatica si trasferiscono a un altro task.
- Una terza rete neurale addestrata, invece, a una doppia attività (riconoscimento di volti e categorizzazione di oggetti), si suddivide, al suo interno, in unità dedicate a entrambi i compiti, esattamente come accade al cervello biologico.
- Questo studio stimola ulteriori interrogativi, tra cui quello relativo alla comprensione delle dinamiche che portano il cervello della macchina a specializzarsi in compiti che comprendono, ad esempio, l’elaborazione del linguaggio naturale e l’organizzazione dello spazio, per applicazioni future di guida autonoma e di robotica industriale.
I recenti progressi ottenuti dalle reti neurali profonde nell’emulare prestazioni sempre più complesse del cervello umano, tra cui, ad esempio, il riconoscimento facciale e la comprensione del linguaggio scritto e parlato, ci riportano all’ambizioso progetto dell’Intelligenza Artificiale Generale (AGI), che mira – un giorno – a mettere a punto una macchina in grado di percepire, di pensare e di comportarsi proprio come l’essere umano.
E se quel giorno appare ancora lontano e il cammino da compiere è assai lungo, non mancano piccoli grandi traguardi che, da un lato, confermano ai neuroscienziati le loro ipotesi circa l’organizzazione e il funzionamento del cervello e, dall’altro, fanno progredire la ricerca in ambito AI. Come conferma uno studio a cura del Department of Brain and Cognitive Sciences del Massachusetts Institute of Technology (MIT), descritto nell’articolo dal titolo “Brain-like functional specialization emerges spontaneously in deep neural networks” – pubblicato il 16 marzo 2020 su Science Advances – il cui punto di partenza è la tesi in base alla quale «il cervello umano contiene più regioni con funzioni distinte (riconoscimento di oggetti, comprensione del linguaggio, riconoscimento dei volti e altre funzioni ancora) – attivate selettivamente da uno specifico compito percettivo o cognitivo – che, quando interrotte, producono un deterioramento selettivo di quello stesso compito».
Prendendo in esame la percezione e il riconoscimento dei volti per mezzo di reti neurali, lo studio si propone di riprodurre artificialmente la specializzazione funzionale del cervello umano in quello specifico compito, verificando se reti addestrate al riconoscimento degli oggetti registrino scarse performance nel riconoscimento dei volti e viceversa e «se i compiti di riconoscimento facciale e di classificazione degli oggetti richiedano necessariamente macchine proprie».
Reti neurali e cervello umano: identificazione di volti e categorizzazione di oggetti
In materia di reti neurali e cervello umano, il team di ricerca ha innanzitutto addestrato due reti neurali convoluzionali (dette anche Convolutional Neural Networks – CNN) distinte: una all’identificazione di volti umani (utilizzando un set di dati contenente 1714 volti di soggetti diversi) e l’altra alla categorizzazione di oggetti (impiegando un set di dati contenente 423 diversi tipi di oggetti, dagli elementi di arredo al cibo).
L’obiettivo, tuttavia, non era – per ognuna delle reti – la semplice esecuzione dei due compiti, bensì verificare in che modo le funzionalità di ciascuna rete – addestrate su un’attività specifica – avrebbero supportato l’altra rete nella decodifica di cento categorie di volti e di cento oggetti non inclusi nel dataset originario.
«Come previsto – spiegano gli autori – l’identità dei volti sconosciuti è stata decodificata accuratamente dalla rete addestrata al riconoscimento dei volti, con un’accuratezza media dell’82,2%. Mentre, oggetti sconosciuti sono stati decodificati dalla rete addestrata agli oggetti, con un’accuratezza media del 74,1%».
Che cosa è accaduto con l’inversione delle funzioni? Che la rete addestrata agli oggetti ha ottenuto risultati scadenti (accuratezza media del 29,3%) nei compiti di riconoscimento facciale rispetto alla rete addestrata al volto e viceversa per il riconoscimento degli oggetti, confermando l’ipotesi per cui le rappresentazioni apprese dalle reti neurali artificiali per un dato compito difficilmente si trasferiscono a un’altra attività. Si tratta di “rappresentazioni specializzate” proprie di ogni specifico task.
A quel punto, l’esperimento è proseguito seguendo il filo tracciato da un altro interrogativo, ovvero se l’addestramento di una singola rete neurale per eseguire entrambe le attività (identificazione di volti e categorizzazione di oggetti) è in grado di evidenziare «uno spazio di funzionalità comune».
L’organizzazione in processi di elaborazione differenti
La seconda fase dello studio in tema di reti neurali e cervello umano, ha visto – utilizzando lo stesso set di dati (1714 volti di soggetti e 423 tipi di oggetti) – l’addestramento di una terza rete neurale convoluzionale al riconoscimento di volti e alla categorizzazione di oggetti, senza alcuna indicazione né sui primi, né sui secondi.
Ciò che è stato osservato durante l’addestramento è che, man mano che la rete neurale artificiale apprendeva a discernere tra volti e oggetti, ad esempio tra il viso di un essere umano e un hamburger, iniziava a organizzarsi, a “specializzarsi”, in processi di elaborazione differenti delle informazioni, giungendo – senza input esterni da parte dei ricercatori – a suddividersi in sottosistemi distinti per il riconoscimento dei volti e degli oggetti e allo sviluppo di «unità specificamente dedicate al riconoscimento facciale e in unità specificamente dedicate alla categorizzazione di oggetti». Esattamente come accade nel cervello umano.
Il fatto che la rete neurale non sapesse nulla circa la distinzione tra la natura delle due categorie di immagini, è il punto focale di questa ricerca. Visi e oggetti le sono stati somministrati in modo non ordinato e del tutto casuale, entrambi come schemi visivi da classificare.
Il passaggio fondamentale, che avvicina il cervello artificiale – la macchina – al cervello biologico, è il fatto che le reti – in fase di apprendimento – abbiano colto quella che gli autori definiscono “dissociazione funzionale” tra volti e oggetti, ossia una diversità di fondo correlata a uno spazio rappresentativo differente tra i due gruppi.
Dissociazione funzionale che nulla ha a che vedere col “significato” dei volti, in quanto la rete neurale artificiale non possiede tale conoscenza. Certo, ha ricevuto un addestramento approfondito sui 1714 visi selezionati. Ma lo stesso addestramento lo ha ricevuto per quanto riguarda gli oggetti.
Si tratta, piuttosto, di una «capacità di percezione che deriva dalla struttura computazionale del compito stesso che dal significato dei volti», osservano i ricercatori. E questa terza rete neurale a doppia attività ha funzionato bene su entrambi i compiti, come se fosse stata addestrata per svolgere ciascuno di essi.
Reti neurali e cervello umano: nuovi interrogativi
Merito di questo studio, l’avere confermato – per quanto concerne due compiti specifici, ovvero il riconoscimento dei volti e la classificazione degli oggetti – che la specializzazione funzionale propria del cervello biologico è riproducibile anche nelle macchine.
In particolare, è emerso che – quando obbedisce a due compiti distinti – la rete neurale artificiale si organizza in un sottoinsieme di attività.
Le prossime domande ora vertono su altre tipologie di attività, tra cui, ad esempio, il calcolo delle distanze nello spazio (per applicazioni di guida autonoma o di robotica industriale) e, al contempo, l’elaborazione del linguaggio naturale.
Studiare e comprendere con quali dinamiche interne il cervello della macchina si specializza in questi due compiti distinti, costituirebbe un altro step verso il traguardo futuro dell’intelligenza artificiale sempre più simile all’intelligenza umana.
Oltre che sulla varietà dei task, inoltre, si lavorerà sulla loro quantità, esplorando la capacità – per un’unica rete neurale addestrata alla classificazione di oggetti, al calcolo della spazialità e all’elaborazione del linguaggio naturale – di specializzarsi in questi tre processi differenti.