Dallo studio congiunto di un Ateneo inglese e di un’Università australiana, il primo approccio basato su tecniche AI allo studio delle impronte fossili appartenute ad alcune specie di dinosauri, superando così i limiti dei tradizionali metodi statistici. Si tratta del primo passo verso una futura più ampia applicazione dell’intelligenza artificiale alla ricerca in paleobiologia, che vada oltre le semplici operazioni di classificazione.

TAKEAWAY

  • Un team congiunto della Liverpool John Moores University e dell’University of Queensland, in Australia, ha creato una rete neurale convoluzionale profonda per classificare le impronte fossili di dinosauri teropodi e ornitischi, addestrata sulla base di sagome in bianco e nero delle tracce fossili, ricavate dai disegni presenti in letteratura e finora impiegati nelle ricerche in materia.
  • I test per la convalida del modello hanno mostrato performance superiori se paragonate a quelle di un gruppo di scienziati esperti. Ma non solo: il sistema AI è stato capace di riconoscere e di classificare anche dati inediti, non presenti nel dataset di addestramento.
  • La direzione degli studi futuri prevede applicazioni che andranno oltre le semplici attività di classificazione illustrate dal gruppo di studio, arrivando a eseguire l’analisi della forma della traccia fossile dell’animale, del suo movimento e delle proprietà del sedimento. Inoltre, saranno i modelli tridimensionali delle impronte fossili ad allenare le future reti neurali artificiali.

Le tracce fossili costituiscono importanti fonti di dati paleobiologici. E quando parliamo di tecniche di intelligenza artificiale a supporto della paleobiologia, facciamo riferimento allo studio – attraverso l’analisi delle impronte fossili per mezzo dell’AI – delle condizioni di vita degli organismi vegetali e animali che si sono estinti milioni di anni fa.

Rientrano nella branca della paleobiologia anche la ricerca sulle tracce fossili di alcune specie di dinosauri, oggi sempre più complessa a causa di una serie di limiti dati dalla loro elevata variabilità e dalla perdita di informazioni inerenti i contorni precisi delle impronte stesse.

«Distinguere, ad esempio, tra le tracce fossili di dinosauri tridattili (cioè a tre dita), di dinosauri ornitischi erbivori e di dinosauri teropodi prevalentemente carnivori, è un problema complesso e di vecchia data» fanno notare gli autori dello studio descritto in “A machine learning approach for the discrimination of theropod and ornithischian dinosaur tracks”.

In particolare, il gruppo di ricercatori della School of Biological and Environmental Sciences della Liverpool John Moores University e della School of Chemistry and Molecular Biosciences dell’University of Queensland, in Australia, osserva:

«In generale, ci si aspetta che le orme dei dinosauri ornitischi siano più larghe e più simmetriche di quelle dei teropodi, con l’impronta del terzo dito meno sporgente e le impronte del secondo e del quarto dito più larghe, più divaricate e che terminano con segni di zoccoli smussati anziché segni di artigli taglienti. Tuttavia, ognuna di queste caratteristiche può essere trovata in entrambi i gruppi e quale sia la più importante dipende dal particolare tipo di traccia in questione»

Con l’obiettivo di superare i limiti dei precedenti approcci statistici, il team di studio ha messo a punto una rete neurale artificiale atta a classificare – distinguendole – le impronte fossili di dinosauri teropodi e ornitischi. Vediamo in che modo e con quali risultati.

Rete neurale convoluzionale profonda per la classificazione delle sagome delle impronte

Più nel dettaglio, il gruppo di ricerca in tema di intelligenza artificiale per le impronte fossili ha creato una rete neurale convoluzionale profonda (o Deep Convolutional Neural Network – DCNN) che fosse in grado di discernere sagome in bianco e nero delle impronte delle due tipologie di dinosauri considerati (teropodi e ornitischi). Sul perché del ricorso a sagome come dati di input del modello di rete neurale artificiale, i ricercatori spiegano:

«L’utilizzo di sagome evita la necessità di misurare particolari caratteristiche anatomiche, consentendo l’inclusione di qualsiasi forma di traccia fossile. Inoltre, le sagome possono catturare la maggior parte delle informazioni considerate rilevanti per l’identificazione delle impronte, comprese caratteristiche come le terminazioni delle dita e il numero e la forma dei cuscinetti falangei»

I disegni dei contorni delle tracce fossili (ad opera degli studiosi) presenti in letteratura – sui quali, ad oggi, ha poggiato la ricerca in materia – sono spesso complessi da interpretare, in quanto consistono in linee multiple e/o discontinue, linee tratteggiate, ombreggiature interne e altre caratteristiche.

Tale complessità, in molti casi, reca la firma del singolo scienziato. Facendo, invece, convergere tali disegni in più semplici sagome in bianco e nero, «si evitano dettagli irrilevanti che potrebbero deteriorare le prestazioni del modello. Le sagome possono essere rappresentate come un contorno continuo o come un insieme di contorni separati in grado di mostrare le singole impronte».

In particolare, il set di dati originale per l’addestramento includeva 677 esempi di dinosauri ornitischi e 959 esempi di teropodi. «Questo squilibrio tra le categorie è causato dall’abbondanza molto maggiore di tracce di teropodi nella documentazione fossile a disposizione» hanno precisato gli autori dello studio.

Per ottenere un set di dati di addestramento bilanciato, il team è intervenuto con il sottocampionamentorimuovendo casualmente gli esempi di teropodi, fino a quando il loro numero fosse uguale a quello degli esempi di ornitischi e cioè 677».

Intelligenza artificiale per le impronte fossili: le prestazioni del modello AI

In tema di intelligenza artificiale per la classificazione delle impronte fossili, dopo l’addestramento della rete neurale convoluzionale profonda, i ricercatori ne hanno testato le prestazioni su un set di test di 36 tracce fossili raccolte dalla letteratura, i cui disegni sono stati convertiti in più semplici sagome in bianco e nero.

Per ogni sagoma di impronta testata – specificano gli autori – la rete neurale messa a punto restituisce un valore numerico compreso tra 0 e 1, a indicare il livello di riconoscimento delle tracce appartenenti ai dinosauri ornitischi e teropodi.

Lo stesso dataset di test è stato somministrato a cinque scienziati esperti in tracce fossili di tali specie di dinosauri, chiedendo loro di identificare ogni impronta come propria degli ornitischi (punteggio 0), teropodi (punteggio 1) oppure ambigua (punteggio 0,5).

Gli esiti del test – riportati nella tabella sottostante – mostrano la superiorità, con un margine costante, del modello di intelligenza artificiale rispetto alle prestazioni dei cinque esperti in materia.

Tabella che illustra il dataset di sagome in bianco e nero delle impronte fossili di dinosauri teropodi e ornitischi utilizzato in fase di test per confrontare le prestazioni (indicate sotto ciascuna traccia) del modello di rete neurale artificiale sviluppato dal team di studio con quelle di cinque esperti umani (Fonte: “A machine learning approach for the discrimination of theropod and ornithischian dinosaur tracks” - The University of Queensland, Australia - https://royalsocietypublishing.org/doi/10.1098/rsif.2022.0588).
Dataset di sagome in bianco e nero delle impronte fossili di dinosauri teropodi e ornitischi utilizzato in fase di test per confrontare le prestazioni (indicate sotto ciascuna traccia) del modello di rete neurale artificiale sviluppato dal team di studio con quelle di cinque esperti umani (Fonte: “A machine learning approach for the discrimination of theropod and ornithischian dinosaur tracks” – The University of Queensland, Australia).

Ben l’86% delle sagome di impronte fossili è stato classificato correttamente dalla rete neurale, mentre il 14% è stato classificato in modo errato. Gli esperti umani, invece, in media, hanno classificato il 57% correttamente, il 20% in modo errato e il 24% come ambiguo.

«Questi risultati – commenta il team di studio – dimostrano la capacità dei sistemi di intelligenza artificiale addestrati su un campione sufficientemente ampio di dati di superare le performance umane nella classificazione di input esterni di questo tipo».

Inoltre, «la maggior parte degli esempi contenuti del dataset di test è significativamente diversa da quelli sui quali è stato addestrato il modello AI», a dimostrazione della sua capacità di riconoscere e di classificare dati inediti riferiti alle sagome in bianco e nero delle impronte delle due specie di dinosauri.

Alcune riflessioni sui limiti della ricerca

In tema di intelligenza artificiale per la classificazione delle impronte fossili, il punto sul quale insistono gli autori dello studio è che la rete neurale artificiale in questione è stata addestrata per classificare le tracce dei dinosauri teropodi e ornitischi senza alcuna informazione di contesto, tra cui le dimensioni della stessa traccia, la stratigrafia e la forma di altre tracce della stessa specie. I paleobiologi, invece, si avvalgono di tali informazioni, considerate importanti nel lavoro di analisi.

La scelta di non fornire alla rete neurale le informazioni di contesto rappresenta un suo limite. E il motivo di tale scelta – evidenzia il team – risiede nel rischio che «il modello AI si adatti eccessivamente a tali dati aggiuntivi, al punto da non riuscire a eseguire un’assegnazione corretta quando, ad esempio, l’impronta fossile in questione è stata trovata all’esterno del suo contesto atteso».

Sotto un altro punto di vista, tuttavia, «questo apparente limite della nostra rete neurale potrebbe rappresentare la sua più grande forza, ossia fornire valutazioni oggettive sull’impronta indipendentemente dal suo contesto».

È, successivamente, compito del paleobiologo combinare l’analisi compiuta della rete neurale artificiale con tutte le informazioni di contesto rilevanti, al fine di arrivare a un’interpretazione completa della traccia fossile.

Un’altra limitazione messa in luce dai ricercatori riguarda la dipendenza da precedenti identificazioni a priori di impronte fossili di dinosauri – riconosciute come “teropodi” o “ornitischi” – per addestrare i modelli, «col presupposto che la stragrande maggioranza di queste identificazioni sono probabilmente corrette anche quando le forme stesse sono ambigue, poiché il contesto di solito offre indizi preziosi. Tuttavia – sottolineano – non si possono escludere errori di identificazione soprattutto per le tracce più piccole che sono particolarmente ambigue».

Intelligenza artificiale per le impronte fossili: la direzione degli studi futuri

Questo lavoro in tema di intelligenza artificiale per la classificazione delle impronte fossili non ha pretese esaustive, ma rappresenta solo il primo approccio allo studio delle impronte fossili teso a scavalcare i limiti dei tradizionali metodi statistici finora seguiti dagli scienziati.

Si tratta del primo passo verso una futura e più ampia applicazione dell’intelligenza artificiale alla ricerca in paleobiologia. E i risultati lusinghieri ottenuti con questo primo studio – fanno sapere gli autori – non solo ci suggeriscono che le reti neurali artificiali sono capaci di adattarsi a vaste mole di dati assai complessi relativi alle tracce fossili di animali, ma che la loro applicazione, in futuro, potrà andare ben oltre le semplici attività di classificazione finora svolte:

«Imparando a distinguere le caratteristiche rilevanti delle impronte fossili da quelle irrilevanti, i sistemi AI potrebbero essere impiegati – ad esempio – per analizzare la specifica forma del piede dell’animale, il suo movimento e le proprietà del sedimento della roccia»

Ricordiamo, poi, che la branca della paleobiologia che studia le tracce fossili di animali estinti si è da sempre avvalsa di disegni e tracciati eseguiti da ricercatori esperti. In questa ricerca – come accennato – i disegni dei contorni delle tracce fossili dei dinosauri teropodi e ornitischi presenti in letteratura sono stati convertiti, da un programma di grafica computerizzata, in sagome in bianco e nero. Ma il lavoro futuro – annuncia il team – potrebbe focalizzarsi su modelli tridimensionali delle impronte, con cui poi addestrare future reti neurali artificiali. E questo – va rimarcato – richiederà una maggiore digitalizzazione delle Università e, più in generale, del mondo scolastico.

Scritto da:

Paola Cozzi

Caporedattrice Leggi articoli Guarda il profilo Linkedin