Un sistema di visione artificiale elabora le immagini tratte da diapositive di vetrini da microscopio e fogli di erbario, per estrarvi informazioni relative a vaste collezioni di esemplari museali finalizzate a progetti di digitalizzazione del patrimonio scientifico.
TAKEAWAY
- Uno studio dell’Università di Cardiff si focalizza sulle specifiche finalità che ispirano la digitalizzazione degli esemplari esposti nei musei di storia e scienze naturali e sui vantaggi che derivano dai metodi che vedono l’intervento dell’intelligenza artificiale.
- L’automatizzazione del processo di digitalizzazione consente, in primis, una rapida elaborazione delle immagini dei campioni scientifici, tramite il metodo della segmentazione semantica dei dati video grazie alle tecniche AI.
- La metodologia definita dai ricercatori inglesi ha il merito di poter essere integrata nei flussi di lavoro di differenti progetti di digitalizzazione dei musei scientifici, scavalcando, così, i limiti dell’applicazione della segmentazione semantica.
Nel nostro Paese, quello della digitalizzazione dei musei – e, più in particolare, dei musei scientifici – è un tema attorno al quale si dibatte da tempo, legato al progetto MuD Museo Digitale del Ministero dei Beni Culturali, avviato nel 2015 con l’obiettivo principe di dare vita a un network in grado di connettere gli oltre 4000 siti museali presenti nella penisola. Tuttavia, di questi, ad oggi, in base ai dati ISTAT, solo il 10,4% dispone di un proprio catalogo digitale, tra cui i musei di arte antica (23%) e quelli di storia naturale e di scienze naturali (16%), considerati tra i più digitalizzati sul territorio.
Preme, però, sottolineare che, rispetto ad altri settori, il processo di trasformazione digitale della macchina che governa il patrimonio museale segue un registro proprio, sganciato da logiche di tipo commerciale e da una competitività sempre più spinta. Per quanto riguarda, nello specifico, i musei scientifici, «a stimolare l’evoluzione di pratiche di digitalizzazione avanzate, è la necessità di aumentare l’accessibilità globale ai campioni della raccolta di storia naturale e ridurre la manipolazione e il deterioramento di esemplari preziosi e spesso fragili» si legge in uno studio di recente pubblicazione a cura della School of Computer Science and Informatics dell’Università inglese di Cardiff, dal titolo “Cross-validation of a semantic segmentation network for natural history collection specimens”, in cui si pongono in evidenza le finalità di carattere divulgativo, nonché legate a esigenze di conservazione e di protezione per le generazioni future – atte a ridurre la quantità di manipolazioni manuali dei campioni durante le raccolte fisiche – della digitalizzazione del materiale esposto all’interno dei musei di storia naturale e di scienze naturali e i vantaggi dei metodi supportati dalle tecniche di intelligenza artificiale.
Digitalizzazione dei musei scientifici: le attività che traggono maggiore vantaggio dall’automatizzazione dei processi
La digitalizzazione dei musei scientifici – osserva il team di ricercatori dell’Ateneo inglese – ha permesso (a livello globale) di passare, negli anni, dai primi database online che semplicemente registravano i dati del catalogo dei campioni scientifici custoditi nei musei, ai portali che consentono al pubblico di sfogliare campioni digitali che includono dati tassonomici, specifiche e immagini dettagliate dei campioni biologici e geologici, insieme a video, registrazioni audio, pubblicazioni e collegamenti a esemplari correlati.
«Le raccolte costituite da milioni di campioni diversi hanno facilitato l’emergere di flussi di lavoro di digitalizzazione ad alto rendimento, che hanno anche stimolato la ricerca su nuovi metodi di acquisizione, standardizzazione delle immagini, conservazione e pubblicazione. In alcune aree, ciò ha promosso la creazione di flussi di lavoro di elaborazione di successo, in grado di elaborare elevati volumi di campioni» si legge nello studio.
Ma se questo ha riguardato una parte dei musei scientifici a livello globale, esistono molte realtà (sono oltre 3 miliardi i campioni biologici e geologici conservati nei musei di scienze naturali di tutto il mondo) in cui le attività di digitalizzazione si basano ancora su processi manuali, limitando la velocità di elaborazione e di pubblicazione delle immagini e, conseguentemente, la divulgazione dei contenuti.
A poter trarre vantaggio dall’automatizzazione dei processi sono, innanzitutto – spiega il team di studio – l’elaborazione delle immagini relative ai campioni scientifici e l’estrazione di informazioni dalle loro etichette. E, in questo contesto, è il metodo di segmentazione semantica per l’analisi delle immagini dei campioni quello maggiormente in grado di coadiuvare l’automatizzazione, avvalendosi dell’impiego dell’intelligenza artificiale, in particolare, in alcune fasi dell’elaborazione dei flussi di lavoro dopo l’acquisizione delle immagini. Vediamo in che modo.
L’intelligenza artificiale a supporto dell’elaborazione delle immagini dei campioni museali
Lo studio inglese in tema di digitalizzazione dei musei scientifici è stato condotto lavorando con i musei di storia naturale e di scienze naturali di tutta Europa, incluso il Natural History Museum di Londra, da cui i ricercatori sono partiti alcuni anni fa, sviluppando un metodo di segmentazione semantica ad hoc per l’analisi di diapositive di vetrini da microscopio di entomologia.
Il metodo consiste nell’individuare in modo automatico, per mezzo di un sistema di computer vision, specifici segmenti – all’interno delle diapositive – in cui sono presenti una o più etichette dalle quali acquisire informazioni da digitalizzare (nomi, dati tassonomici dei campioni ecc.).
Ricordiamo che – nell’ambito della visione artificiale – la “segmentazione semantica” è quel processo che, nell’analizzare dati video, raggruppa i pixel in base alla categoria di appartenenza delle immagini: ad esempio, i pixel appartenenti alla categoria insetti vengono raggruppati separatamente rispetto ai pixel appartenenti alla categoria minerali. Nel dettaglio, per quanto concerne questo progetto, «la segmentazione semantica suddivide l’immagine in segmenti più piccoli, raggruppando i pixel in diverse classi predefinite per rappresentare i tipi di elemento di interesse. In una seconda fase, vengono identificate le istanze separate di ciascuna classe di elementi. Gli elementi presenti sono classificati in “esemplare” (al centro), “etichette”, “etichetta di tipo”, “etichetta codice a barre”, mentre il resto dell’immagine è classificato come “sfondo”». La suddivisione dell’immagine grande in regioni di interesse più piccole – precisa il team – è a tutto vantaggio dei processi di riconoscimento ottico dei caratteri.
Inizialmente – come accennato – tale metodo è stato reso pubblico e utilizzato per l’elaborazione di immagini tratte da diapositive di entomologia provenienti dal museo londinese, senza affrontare la questione relativa alla sua applicazione per l’analisi di altre tipologie di dati video afferenti ad altre raccolte, dello stesso museo o di altre Istituzioni.
Lo studio “Cross-validation of a semantic segmentation network for natural history collection specimens” è nato proprio con l’obiettivo di superare questo limite, eseguendo – attraverso una serie di test – la convalida incrociata dell’applicabilità del metodo, utilizzando dati provenienti da diversi musei e da due tipi di raccolte, ossia diapositive (di diverso genere) di vetrini da microscopio (da tre musei europei) e fogli di erbario (da sette musei europei). Il fine ultimo era «determinare se il modello di segmentazione fosse sufficientemente robusto per definire un metodo vero e proprio, da incorporare in flussi di lavoro automatizzati per l’elaborazione di tutte le immagini relative ai campioni scientifici museali e, quindi, per la loro digitalizzazione».
Digitalizzazione dei musei scientifici: focus sulla portabilità della segmentazione semantica
Lo studio in tema di digitalizzazione dei musei scientifici ha previsto l’addestramento del sistema di visione artificiale precedentemente sviluppato, utilizzando migliaia di immagini di vetrini da microscopio e fogli di erbario provenienti da diverse raccolte di storia naturale.
La fase di test ha confermato le attività di elaborazione delle immagini, tra cui l’identificazione degli elementi base dell’immagine stessa, i nomi dei campioni e l’identificazione delle etichette.
«Uno dei vantaggi del supporto delle tecniche AI nell’elaborazione delle immagini dei campioni museali è dato dalla messa a punto di servizi che possono essere integrati senza soluzione di continuità nei flussi di lavoro di grandi progetti di digitalizzazione. Affinché questo sia possibile è, però, necessario garantire che i metodi siano flessibili e adattabili per l’uso nei flussi di lavoro di imaging di diversi progetti, destinati a raccolte diverse e implementati da Istituzioni diverse. Questo obiettivo di portabilità è una delle aree inesplorate dell’applicazione della segmentazione semantica» puntualizza il gruppo di ricerca.
I risultati positivi ottenuti nella fase di test sono interpretabili come convalida della portabilità del metodo di segmentazione semantica a sostegno della digitalizzazione dei musei scientifici. Riguardo, nello specifico, alla fase di addestramento del sistema AI destinato alla segmentazione delle diapositive, un ulteriore esperimento per confrontare l’allenamento individuale con l’allenamento su un set di dati combinato (più grande), ha dimostrano che il metodo è adattabile a diverse collezioni.
Infine, «il metodo può essere riutilizzato per testare altri metodi di segmentazione per altri tipi di immagini, contribuendo al miglioramento dei flussi di lavoro per l’elaborazione delle immagini nel contesto della digitalizzazione delle raccolte di storia naturale».