Il lavoro congiunto di quattro Centri di ricerca USA ha portato alla creazione di una libreria di segnali di infrasuoni sintetici, appositamente pensata per addestrare algoritmi ML a rilevare le fonti di esplosioni.
TAKEAWAY
- Anziché affidarsi ai dati reali registrati dalle reti di sensori per infrasuoni presenti sul territorio, secondo un recente studio USA è possibile utilizzare segnali di infrasuoni sintetici, suoni artificiali di esplosioni ricreati al computer, con i quali allenare algoritmi di apprendimento automatico deputati alla loro classificazione.
- Testati sui dati del mondo reale, i modelli di machine learning addestrati sinteticamente hanno rilevato tutte le esplosioni registrate durante l’esperimento del 2012, in New Mexico, quando furono fatte esplodere sei cariche di trinitrotoluene.
- In futuro, il team di ricerca pensa a una rappresentazione più ampia dei processi esplosivi, creando dati sintetici relativi a fonti più complesse come eruzioni vulcaniche, getti supersonici, bolidi e terremoti, per lo sviluppo di ulteriori algoritmi di rilevamento.
L’impiego dell’intelligenza artificiale – e, più in particolare, delle tecniche di machine learning – per il rilevamento generalizzato delle esplosioni mediante l’analisi, il riconoscimento e la classificazione dei segnali di infrasuoni che ne derivano, è reso problematico dalla mancanza di dati reali per mezzo dei quali addestrare gli algoritmi.
Ogni esplosione produce onde acustiche a bassa frequenza – dette, appunto, infrasuoni – in grado di propagarsi a livello globale. Queste, però, oltre ad avere una frequenza troppo bassa per essere udite dagli esseri umani, a causa della variabilità dell’atmosfera danno origine a rilevamenti non generalizzabili, non validi, cioè, per altri luoghi rispetto a quello di origine. Questo è il nodo cruciale.
Le registrazioni di dati reali che si possiedono (ottenute mediante reti di sensori per infrasuoni distribuiti a livello globale) – tra cui quelle dell’International Monitoring System (IMS) dell’Organizzazione del “Trattato sulla messa al bando dei test nucleari” (Comprehensive Nuclear-Test-Ban Treaty – CTBT), voluto dall’Assemblea Generale ONU nel 1996 per vietare i test nucleari in qualsiasi ambiente – sono, in realtà, spesso inutilizzabili proprio a causa della modulazione variabile dell’atmosfera, che rende, di fatto, complesso costruire un set di dati di addestramento generalizzato, applicabile ovunque.
Per intenderci, un’esplosione nucleare avvenuta nel Nebraska, ad esempio, si caratterizza per segnali di infrasuoni propagatisi nell’atmosfera di quella specifica area della Terra, diversa da altre tipologie di atmosfere.
Ricordiamo che poter localizzare con esattezza, in ogni luogo della superficie terrestre, i segnali di eventi quali detonazioni nucleari ed esplosioni chimiche di grandi dimensioni, è fondamentale per arrestare questi fenomeni e i rischi per l’ambiente e l’essere umano ad essi correlati.
«Anziché fare affidamento su dati reali registrati, è possibile utilizzare segnali di infrasuoni sintetici, ossia suoni artificiali di esplosioni ricreati al computer, con i quali allenare algoritmi di apprendimento automatico»
si legge nell’inedito studio dal titolo “Detecting Large Explosions With Machine Learning Models Trained on Synthetic Infrasound Data”, a cura del Geophysical Institute dell’Università dell’Alaska-Fairbanks, dell’Air Force Technical Applications Center presso il Patrick Space For Base, in Florida, del National Center for Physical Acoustics dell’Università del Mississippi e del Los Alamos National Laboratory, nel New Mexico.
Vediamo insieme in che cosa consiste il nuovo metodo, volto a dare vita a una raccolta di eventi sintetici con i quali addestrare classificatori ML di esplosioni.
Machine learning e rilevamento esplosioni: il ruolo dell’AI nelle geoscienze
I progressi dell’apprendimento automatico nelle geoscienze – spiegano gli autori dello studio in tema di machine learning e rilevamento esplosioni – «sono prevalenti in quei segmenti in cui gli scienziati possono avvalersi di voluminosi set di dati etichettati, provenienti dal mondo reale oppure generati sinteticamente, su cui è possibile valutare le prestazioni dei modelli ML».
Ad esempio, i sismologi, da sempre, sfruttano ricchi archivi di dati per rilevare terremoti, eventi vulcanici ed esplosioni nelle cave. E un numero crescente di ricercatori nell’ambito dell’acustica utilizza tecniche di machine learning per classificare processi vulcanici, valanghe di neve e altri segnali naturali e antropogenici.
Come accennato, la comunità dei ricercatori che si occupano dello studio degli infrasuoni riferiti alle esplosioni, non dispone di ampi set di dati di formazione per costruire e testare modelli ML da implementare in contesti generalizzati.
Da tale mancanza ha origine il metodo messo a punto dal lavoro congiunto dei quattro Istituti di ricerca USA, il cui obiettivo è:
«… creare un catalogo composto da 28mila eventi sintetici e 28mila “non-eventi” fisicamente realistici, su cui addestrare un modello di machine learning. In particolare, i non eventi vengono generati scaricando onde di infrasuoni campionate casualmente dalle reti regionali in un determinato periodo di tempo e di estensione spaziale»
Due reti neurali artificiali per valutare la qualità degli infrasuoni sintetici
«La bontà di un sistema di intelligenza artificiale, il suo successo, sono in gran parte determinati dalla qualità del set di dati di addestramento, dal suo essere sufficientemente ampio e robusto» sottolinea il team di studio in tema di machine learning e rilevamento esplosioni.
Ecco allora che, allo scopo di valutare la qualità degli eventi sintetici raccolti, sono state sviluppate una rete neurale artificiale relativamente semplice e una rete convoluzionale temporale – detta anche Temporal Convolution Network (TCN) – una tipologia di rete neurale convoluzionale (CNN o ConvNet, dall’inglese Convolutional Neural Network) per applicazioni di modellazione di sequenze di dati, oltre che per altre funzioni. A tale riguardo, osservano i ricercatori:
«In entrambi i casi, le forme d’onda di ultrasuoni grezze vengono prima trasformate in un insieme di caratteristiche, che poi passano attraverso più strati di neuroni artificiali densamente collegati, dove lo strato finale emette una probabilità di classe, cioè “evento” o “non evento”»
La rete neurale artificiale semplice – opportunamente addestrata – discrimina correttamente tra eventi sintetici e non eventi con un’accuratezza di convalida complessiva del 90%. L’accuratezza complessiva della convalida della rete convoluzionale temporale è, invece, del 97%.
Inoltre, entrambe le reti identificano con successo la maggior parte dei segnali di esplosione del mondo reale registrati durante l’esperimento Humming Road Runner del 2012, al White Sands Missile Range, in New Mexico, dove sono state fatte esplodere sei cariche comprese tra 9 e 45 tonnellate equivalenti di trinitrotoluene.
I segnali di questa esplosione – fa notare il team – «sono stati impiegati per aiutare a modellare le funzioni temporali e le atmosfere sintetiche della sorgente di infrasuoni, nonché per testare l’accuratezza dei classificatori ML».
Machine learning e rilevamento esplosioni: i test di prova con i dati del mondo reale
In tema di machine learning e rilevamento esplosioni, quando sono stati implementati sui dati del mondo reale, i modelli ML addestrati sinteticamente dai ricercatori hanno rilevato tutte le esplosioni registrate durante l’esperimento Humming Road Runner.
Nel dettaglio, la precisione raggiunge il 76% ed entrambi i modelli di machine learning hanno identificato correttamente la maggior parte dei segnali di infrasuoni per ciascuna detonazione, «nonostante l’utilizzo di uno solo dei circa sei microfoni disponibili nell’area», precisa il gruppo di studio. «Sebbene, al di fuori dell’ambito di questo lavoro, prevediamo che la precisione migliorerebbe se implementassimo i modelli ML su tutti i microfoni disponibili».
Entrambi i modelli di machine learning hanno registrato i “veri negativi” con un’accuratezza più elevata rispetto ai “veri positivi”, indicando che le registrazioni campionate casualmente sono rappresentative di non eventi Humming Road Runner.
In particolare – spiega il team – le precisioni relative ai “veri positivi” sono inferiori a quelle dei “non eventi” a causa di una combinazione di più fattori: in primo luogo, «i modelli atmosferici probabilmente non catturano le vere condizioni osservate durante l’esperimento in New Mexico, che possono contenere perturbazioni della velocità dei segnali di infrasuoni dovute alle onde gravitazionali interne nella stratosfera e a strutture irrisolte su larga scala nella termosfera».
Prospettive future
In tema di machine learning e rilevamento esplosioni, il catalogo open source di eventi sintetici e di “non-eventi” offre un nuovo set di dati di riferimento per coloro i quali si occupano dello studio degli infrasuoni e delle dinamiche relative al rilevamento delle esplosioni.
«Sebbene i nostri risultati siano limitati ai dati reali registrati durante l’esperimento Humming Road Runner del 2012, il metodo che abbiamo testato è generale e può essere applicato a un’ampia gamma di contesti e campi di ricerca, con chiare applicazioni al monitoraggio delle esplosioni provocate dall’uomo» concludono i ricercatori.
In futuro – fanno sapere – si dovrà lavorare alla modellazione delle atmosfere riferite a luoghi e a tempi diversi, arrivando a costruire una “griglia di atmosfere” che copre una regione geografica più ampia, come accade ora con la rete dell’International Monitoring System.
Si dovrà anche pensare a rappresentare una più ampia varietà di processi esplosivi, creando dati sintetici relativi a fonti più complesse come eruzioni vulcaniche, getti supersonici, bolidi e terremoti, «che potrebbero essere inseriti direttamente nel software di modellazione per aiutare a costruire ulteriori algoritmi di rilevamento e a migliorare il monitoraggio dei rischi».