Un recente studio svedese dimostra il potenziale delle tecniche di intelligenza artificiale come il deep learning e le reti neurali transformer nell’innovare la previsione computazionale della tossicità chimica delle acque.

L’inquinamento che investe fiumi, laghi, mari e falde sotterranee è un fenomeno particolarmente complesso, poiché rimanda a una serie di cause concatenate e a impatti di varia natura sull’ecosistema e sulla biodiversità dell’intero pianeta.

L’Associazione ambientalista Legambiente, qualche anno fa, nel dossier “H₂O – la chimica che inquina l’acqua”, portò l’attenzione su una questione di antica data e, negli anni addietro, taciuta, relativa allo “stato chimico” delle acque, «da molti decenni utilizzate come discariche in cui smaltire, in maniera più o meno lecita, i reflui delle lavorazioni industriali».

E il Joint Research Centre (JRC) della Commissione europea, in un documento del 2020 sui parametri microbiologici dell’acqua potabile, definì l’inquinamento chimico delle acque «uno dei principali problemi ambientali a livello globale», con ricadute importanti sul mondo animale e vegetale, così come sulla salute umana e sui livelli di tossicità deiterreni in cui penetrano le acque interne inquinate.


Gli attuali metodi computazionali a supporto della previsione dei valori di tossicità chimica delle acque, tra cui il Quantitative Structure-Activity Relationship e le tecniche di machine learning, si fermano di fronte all’analisi di quelle sostanze chimiche appartenenti a più classi, per le quali servono domini di applicabilità ampi.
Risponde a questo limite, il lavoro di due Atenei in Svezia che, a partire dal modello di rete neurale transformer, hanno creato uno strumento in grado di fare previsioni per insiemi di sostanze chimiche estesi e diversificati, indipendentemente dai dati di addestramento acquisiti.
In futuro, l’evoluzione del modello predittivo transformer potrebbe velocizzare l’iter della valutazione tossicologica di quelle migliaia di agenti chimici utilizzati dalle industrie e scaricati in mare senza, tuttavia, essere mai stati analizzati, contribuendo, in questo modo, alla riduzione del carico chimico nelle acque.

Le sostanze chimiche che raggiungono i corsi d’acqua

Nell’arco di quattro anni dalle pubblicazioni citate, il quadro permane più o meno invariato. In generale, poco è stato fatto finora per arrivare al nocciolo del problema e cioè al fatto che «l’80% delle acque reflue mondiali di tutti i settori viene reimmesso nell’ambiente senza essere trattato». C’è stato, globalmente, fino ad oggi, uno scarso controllo sullo scarico dei prodotti chimici industriali e farmaceutici. Ed è questa la causa primaria del degrado delle acque. Qualcosa sembra si stia muovendo negli ultimi due anni, specie dall’inizio di questo 2024, ma molto tempo è andato perso [fonte: “Water quality and wastewater” – United Nations].

Per quanto riguarda, nello specifico, le industrie, tra gli agenti chimici più tossici rilasciati nei fiumi e nei laghi, vi sono i metalli pesanti (mercurio, nichel e piombo in primis), l’azoto e il fosforo che, se in quantitativi elevati, possono avere effetti cancerogeni.

A queste sostanze (normalmente presenti in natura a basse concentrazioni), vanno, poi, aggiunti i composti chimici artificiali, sviluppati a un ritmo talmente rapido da rendere ardua, alle Autorità preposte, l’individuazione di quali debbano essere limitati – e a quali livelli – a causa della loro tossicità [fonte: “What are the dangers of chemical pollution in European waters?”, European Environment Agency].

Del gruppo delle sostanze chimiche create in laboratorio, un posto a parte, per i loro effetti assai dannosi sulla salute umana e l’ambiente, spetta ai cosiddetti PFAS – acronimo inglese di “PerFluorinated Alkylated Substances” – sigla che raggruppa agenti come l’acido perfluoroottanoico (PFOA), l’acido perfluorottano solfonico (PFOS), l’acido perfluoroesano solfonico (PFHxS) e l’acido perfluorononanoico (PFNA), impiegati, fin dagli anni quaranta, nella fabbricazione di numerose tipologie di articoli, tra cui i più comuni sono le pentole antiaderenti, i tessuti antimacchia, le schiume antincendio e i prodotti resistenti a grasso, acqua e olio. Definiti “inquinanti eterni”, in quanto le loro molecole sono caratterizzate dal legame carbonio-fluoro, tra i più forti esistenti in chimica, i PFAS «non si degradano facilmente nell’ambiente» [fonte: National Institute of Environmental Health Sciences].

Inquinamento chimico delle acque: è allarme PFAS per quelle potabili

In molti Paesi del mondo, ormai, concentrazioni di PerFluorinated Alkylated Substances sono state riscontrate sia nelle acque sotterranee – col concreto rischio di ingresso nella catena alimentare, contaminando piante, prodotti agricoli e allevamento – che in quelle potabili.

In Italia, in molte regioni, tra cui VenetoLombardia e Toscana, le analisi delle acque destinate al consumo di diverse località hanno rilevato un inquinamento da PFAS. In particolare, dall’indagine condotta da Greenpeace Italy nelle dodici province lombarde, tra il 12 e il 18 maggio 2023, undici campioni di acqua potabile su trentuno (fatti analizzare da un laboratorio indipendente) sono risultati contaminati dagli “inquinanti eterni”.

Sempre Greenpeace Italy, a ottobre 2023, in un’operazione definita “di trasparenza”, ha divulgato – dopo regolare consenso all’accesso – gli esiti del monitoraggio degli acquedotti milanesi (mai resi pubblici in precedenza), a cura dell’ente gestore MM Spa e dell’ATS Città Metropolitana di Milano, effettuato nell’arco di tempo compreso tra il 2021, il 2022 e parte del 2023.

Ebbene, «su 462 campioni di acqua potabile analizzata – si legge nel report – è stata rilevata la presenza di PFAS in 132 campioni, pari a 1 su 4». E sebbene, il quantitativo chimico rilevato sia inferiore ai limiti fissati nel 2014 dalMinistero della Salute (pari a 300 nanogrammi per litro per i PFOS, a 500 per i PFOA e a 500 per tutti gli altri PFAS), «in oltre un caso su quattro, le concentrazioni risultano superiori ai valori più cautelativi per la salute umana, come quelli previsti dalle normative USA».

Inquinamento chimico delle acque potabili: le normative anti-PFAS

Nel 2019, la Danimarca è stato il primo Paese europeo ad affrontare concretamente la questione dell’inquinamento chimico delle acque potabilivietando l’uso delle sostanze PFAS nella produzione degli imballaggi alimentari e nel rivestimento delle padelle antiaderenti.

Per quanto riguarda, invece, il resto d’Europa, ad oggi, non esiste una normativa specifica per gli agenti chimici PFAS, ma ci si rifà alla più generica direttiva UE sulla qualità dell’acqua – aggiornata l’ultima volta nel 2020 – la quale, però, dal 12 gennaio 2026, fisserà un limite di 100 nanogrammi per litro per tutti le 24 singole sostanze PFAS presenti nelle acque da bere. Ma non è tutto.

Il 24 aprile 2024, mediante un accordo provvisorio con il Consiglio europeo, il Parlamento UE ha aperto a nuove norme in tema di imballaggi (in particolare, quelli di plastica), con l’obiettivo di ridurli del 5% entro il 2030, del 10% entro il 2035 e del 15% entro il 2040, vietando, al di sopra di certi limiti, anche l’impiego degli inquinanti PFAS negli imballaggi per alimenti.

Gli Stati Uniti, invece, hanno iniziato gradualmente a bandire dalla produzione e dall’utilizzo comune i composti chimici PFOA e PFOS a partire da gennaio 2023 e, recentemente – il 10 aprile 2024 – stupendo tutti, l’Environmental Protection Agency ha ulteriormente ridotto i livelli di PFAS consentiti nell’acqua potabile, portandoli da 70 a 4 parti per trilione (ppt).

Le tecnologie a supporto della previsione dei valori di tossicità chimica

Ma in che modo si giunge a ritenere “sicuri” o “a rischio” – per gli organismi che vi vivono, per gli esseri umani e l’ambiente – i livelli di agenti chimici presenti nelle acque?

Il modus operandi tradizionale è di tipo sperimentale e prevede l’esposizione, in laboratorio, in condizioni controllate, di taluni organismi acquatici (ad esempio, alghe o alcune tipologie di pesci) a una serie di sostanze chimiche che si intendono testare, arrivando, così, a definire quella precisa concentrazione chimica, in presenza della quale si verificano determinati effetti negli organismi e alla quale viene poi attribuito un “fattore di sicurezza”, dal più basso al più elevato [fonte: “Predicting exposure concentrations of chemicals with a wide range of volatility and hydrophobicity in different multi-well plate set-ups” – Scientific Reports].

Come alternativa più rapida ed economica rispetto al classico metodo sperimentale fondato sull’osservazione in laboratorio, nell’ultimo decennio si sono imposti, quali strumenti di previsione dei livelli di inquinamento chimico delle acque, i metodi computazionali – basati esclusivamente sui dati – tra cui il “Quantitative Structure-Activity Relationship” (QSAR), in grado di «predire “computazionalmente” le possibili attività biologiche di un dato compost chimico, traendo quante più informazioni possibili dal composto stesso e dall’interazione con il suo recettore, vale a dire con l’organismo acquatico» [fonte: “Quantitative Structure-Activity Relationship” – ScienceDirect].

Anche i modelli predittivi fondati sulle tecniche di machine learning si sono rivelati idonei allo scopo, consentendo di correlare le differenze nelle diverse strutture degli agenti chimici ai cambiamenti osservati negli organismi a livello tossicologico.

Quando, però, è necessario fare previsioni in merito a sostanze chimiche appartenenti a più classi – per ipotesi, acido perfluorottano solfonico (PFOS), acido perfluoroesano solfonico (PFHxS) e acido perfluorononanoico (PFNA) – spesso sono necessari più modelli QSAR, come fa notare un gruppo di ricercatori presso il Dipartimento di Scienze Matematiche della Chalmers University of Technology e il Dipartimento di Biologia e Scienze Ambientali dell’University of Göteborg, entrambe in Svezia, autori dello studio illustrato in “Transformers enable accurate prediction of acute and chronic chemical toxicity in aquatic organisms” (Science Advances, marzo 2024), i quali sono critici anche nei confronti dell’approccio che sfrutta l’apprendimento automatico:

«… è stato utilizzato per prevedere varie attività biologiche, inclusa la tossicità delle acque su taluni organismi. Tuttavia, i metodi attuali non possiedono ancora la precisione necessaria e un dominio di applicabilità sufficientemente ampio, che sono, invece, d’obbligo per le applicazioni nei contesti normativi»

L’approccio computazionale basato sulle reti neurali transformer

In tema di inquinamento chimico delle acque e di perizia nel misurare il grado di tossicità di determinate sostanze sugli organismi al loro interno, secondo il team svedese, i metodi computazionali esistenti come, appunto, il QSAR e l’apprendimento automatico, sono in grado di sostituire solo una piccola percentuale dei dati che si ricavano attraverso le procedure sperimentali classiche.

Urgono nuovi approcci, soprattutto a sostegno degli organi competenti nell’analisi della moltitudine di sempre nuovi agenti chimici artificiali prodotti, col fine di classificarli più rapidamente e in modo più puntuale e di regolamentarne, così, l’uso.

L’intuizione dei ricercatori ha visto nei transformer la possibile chiave di volta delle previsioni computazionali in ambito tossicologico. Ricordiamo che i “transformer” rimandano a una particolare tipologia di rete neurale dalla struttura piuttosto semplice, originariamente sviluppata nell’elaborazione del linguaggio naturale. Negli ultimi anni, tuttavia – notano gli autori – le tecniche di deep learning sulle quali essa poggia hanno dato prova di efficienza nel catturare informazioni anche da strutture biologiche e chimiche.

«I transformer si avvalgono dell’auto-attenzione, un meccanismo che deduce dipendenze complesse direttamente dai dati, per enfatizzare le parti della struttura chimica ritenute particolarmente ricche di informazioni. Ciò consente di identificare le caratteristiche strutturali più importanti del composto, per una previsione accurata della sua tossicità chimica»

precisa il gruppo di studio. Nel dettaglio, la rete neurale transformer messa a punto è stata addestrata sulla base di grandi quantità di dati provenienti da test di laboratorio (147.864 misurazioni) – sia standardizzati che condotti dalla comunità scientifica internazionale – eseguiti, in passato, su ben 6473 strutture di agenti chimici e sui loro effetti tossicologici sugli organismi acquatici dei tre gruppi comunemente utilizzati nella regolamentazione chimica, ovvero algheinvertebrati e pesci.

I test di confronto con i modelli predittivi QSAR (Quantitative Structure-Activity Relationship)

Una delle principali differenze tra il modello transformer proposto dai ricercatori e i metodi QSAR convenzionali, è dato dalla rappresentazione numerica delle strutture chimiche in grado di analizzare, maggiore nel primo metodo.

Durante la fase di test, infatti, la rete neurale transformer per la previsione dei valori di tossicità chimica su alghe, invertebrati e pesci, ha dimostrato domini di applicabilità sostanzialmente aumentati, grazie ai quali è possibile fare previsioni per insiemi di sostanze chimiche più ampi e diversificati (anche estranee ai dati di addestramento), al contrario di quanto accade impiegando strumenti di previsione basati sulla Quantitative Structure-Activity Relationship.

Ad esempio, la rappresentazione numerica delle strutture chimiche propria del modello QSAR denominato Ecosar – tra quelli utilizzati dal team per i test comparativi – conta 263 domini di applicabilità, che coprono 111 classi chimiche solo per l’analisi predittiva dei valori di tossicità chimica sui pesci, a discapito degli altri due gruppi di organismi acquatici (alghe e invertebrati). 

Grafico che mostra la percentuale di strutture chimiche per le quali la rete neurale transformer e i modelli QSAR proposti (Ecosar, Vega e T.E.S.T.) sono in grado di fare previsioni relative alla loro tossicità su alghe, invertebrati acquatici e pesci, riportata sia per le sostanze chimiche che rientrano nel normale dominio di applicabilità (inside AD), sia per quelle sostanze in merito alle quali è possibile fare una previsione (extended AD). [(A) e (B)] pesce EC50 (n = 3542) e pesce EC10 (n = 2321); [(C) e (D)] invertebrati acquatici EC50 (n = 3741) e invertebrati acquatici EC10 (n = 2647); [(E) e (F)] alghe EC50 (n = 2843) e alghe EC10 (n = 2756) [fonte: “Transformers enable accurate prediction of acute and chronic chemical toxicity in aquatic organisms” - Science Advances - https://www.science.org/doi/10.1126/sciadv.adk6669].
La percentuale di strutture chimiche per le quali la rete neurale transformer e i modelli QSAR proposti (Ecosar, Vega e T.E.S.T.) sono in grado di fare previsioni relative alla loro tossicità su alghe, invertebrati acquatici e pesci, riportata sia per le sostanze chimiche che rientrano nel normale dominio di applicabilità (inside AD), sia per quelle sostanze in merito alle quali è possibile fare una previsione (extended AD). [(A) e (B)] pesce EC50 (n = 3542) e pesce EC10 (n = 2321); [(C) e (D)] invertebrati acquatici EC50 (n = 3741) e invertebrati acquatici EC10 (n = 2647); [(E) e (F)] alghe EC50 (n = 2843) e alghe EC10 (n = 2756) [fonte: “Transformers enable accurate prediction of acute and chronic chemical toxicity in aquatic organisms” – Science Advances – https://www.science.org/doi/10.1126/sciadv.adk6669].

Commenta il gruppo di lavoro:

«Il modello transformer ha mostrato elevate prestazioni predittive per tutti i gruppi di organismi testati – alghe, invertebrati e pesci – e ha, rispetto ai metodi QSAR comunemente utilizzati, un campo di applicabilità più ampio e un errore notevolmente inferiore»

Inoltre, il grafico evidenzia che, quando la rete transformer viene addestrata su dati con concentrazioni a effetto multiplo (EC50/EC10), le sue prestazioni migliorano ulteriormente. E, a proposito di errori, questi corrispondono «a un fattore compreso tra 2,00 e 3,50 rispetto alle concentrazioni di effetti misurate sperimentalmente».

Glimpses of Futures

Quello dell’inquinamento globale delle acque, espandendosi al punto da travolgere, come un’onda gigantesca, anche quelle sotterranee e potabili, sempre più contaminate dalle pericolose sostanze alchiliche perfluorurate e polifluorurate (PFAS), è divenuto un problema assai “vicino” a noi e alla catena alimentare da cui dipendiamo. Un problema che, per la sua enormità e per i molti attori coinvolti, è quasi impossibile da gestire senza una puntuale politica di controllo e gestione delle acque reflue, senza regolamentazioni ferree, leggi e sanzioni per chi non le rispetta.

La tecnologia, in tutto questo, può contribuire in modo fattivo, stimando in modo rapido la tossicità delle centinaia e migliaia di sostanze chimiche ancora prive di un profilo tossicologico, ma nonostante questo ampiamente utilizzate dalle industrie nel mondo.

Con l’obiettivo di anticipare possibili scenari futuri, proviamo ora ad analizzare – servendoci della matrice STEPS – gli impatti che l’evoluzione dei modelli predittivi transformer per la previsione dei valori di tossicità chimica delle acque,potrebbe avere su più fronti.

S – SOCIAL: attualmente, sottolineano gli autori del lavoro illustrato, le sostanze chimiche presenti sul mercato globale – e utilizzate in ambito industriale – sono oltre 100.000, ma solo una piccola parte di queste rimanda a una scheda descrittiva del proprio grado di tossicità nei confronti dell’uomo e dell’intero ecosistema. Il resto è in attesa di analisi e di valutazione. In questo scenario, l’evoluzione del metodo computazionale basato su tecniche di intelligenza artificiale, come quello descritto, finalizzato alla previsione della tossicità chimica delle acque, potrebbe, in futuro, porre fine a questa attesa, velocizzando tutta la procedura di analisi e, al contempo, renderla più precisa, perché fondata su dati oggettivi e su calcoli matematici e non su osservazioni di quanto accade durante gli esperimenti di laboratorio, compresi i test sugli animali. Inoltre, mediante lo screening di grossi quantitativi di dati inerenti alle specifiche tecniche di centinaia di nuovi agenti chimici e al successivo incrocio di tali dati, le tecniche AI contribuirebbero anche allo sviluppo di sostanze chimiche più sostenibili, nonché all’individuazione di quelle più benigne con cui sostituire le più tossiche.

T – TECHNOLOGICAL: le performance ottenute dalla rete neurale transformer nei test comparativi eseguiti dal team, specie in quelle prove di previsione dei valori di tossicità chimica che andavano oltre il normale dominio di applicabilità (extended AD), provano che i dati di addestramento erano sufficientemente ricchi ed eterogenei. Il problema dei dati, tuttavia, si porrà in futuro, con l’evoluzione del modello predittivo descritto, il quale, per mantenere elevato il livello prestazionale, avrà sempre più bisogno non solo di grandi volumi di dati, ma di grandi volumi di dati di alta qualità. Per tale motivo, negli anni a venire, per poter contare su metodi AI ancora più efficienti e affidabili, tesi alla previsione dei valori di tossicità chimica delle acque, saranno necessari grandi sforzi per raccogliere i dati di analisi tossicologiche provenienti da più fonti indipendenti, con l’obiettivo di aggregare dataset variegati e di dimensioni considerevoli. Un altro scoglio è, poi, rappresentato dall’annosa mancanza di dati organizzati sulla tossicità chimica. Motivo per cui, i set di dati con i quali i ricercatori hanno allenato il transformer era ibrido, composto sia da dati di test di laboratorio standardizzati che da esperimenti condotti dalla comunità scientifica. In uno scenario futuro, dunque, sarà centrale un lavoro si data science per rendere completi, coerenti e accessibili tutti quei dati e quei metadati rappresentativi della tossicità chimica.

E – ECONOMIC: in futuro, l’adozione di metodi AI basati sulle reti neurali transformer per la previsione della tossicità chimica delle acque – più economici rispetto ai metodi tradizionali – in primis, abbatterebbe i costi di gestione dei laboratori per le sperimentazioni dirette sugli organismi acquatici esposti a determinate sostanze chimiche. E, in seconda battuta, velocizzando l’iter della valutazione tossicologica di quelle migliaia di agenti chimici impiegati dalle industrie e scaricati in mare senza essere mai stati analizzati, contribuirebbe alla riduzione del carico chimico nelle acque e, indirettamente, anche alla riduzione dei costi relativi agli interventi volti a mitigare l’inquinamento chimico di fiumi, laghi, mari e falde sotterranee. Un risparmio economico che, a tendere, andrebbe sempre più reinvestito nello sfruttamento delle acque reflue in quanto risorsa, come insegna “The United Nations world water development report, 2017: Wastewater: an untapped resource; executive summary”, a cura dell’UNESCO, per il quale «… le acque reflue gestite in modo sicuro sono un’opportunità, una fonte sostenibile di acqua, energia e altri materiali recuperabili, offrendo, allo stesso tempo, nuove opportunità commerciali e creando posti di lavoro green».

P – POLITICAL: l’ipotesi di una riduzione del carico chimico nelle acque, ottenuta mediante l’impiego di sempre più evoluti modelli predittivi nella previsione della tossicità chimica sugli organismi acquatici, in futuro potrebbe rientrare nell’ambito di una più ampia politica di controllo delle acque di scarico industriali, fungendo da possibile leva per accordi e normative che regolamentino, a tappeto, la gestione delle acque reflue. E questo anche in vista, in base ai dati del Department of Economic and Social Affairs ONU, di una maggiore densità demografica delle città entro il 2050, quando si stima che il 68% della popolazione mondiale vivrà in aree urbane, rendendo così più urgente la messa a punto «di infrastrutture adeguate per affrontare la gestione delle acque reflue in modo efficiente e sostenibile». Allo stato attuale, il 20 febbraio 2024, la Casa Bianca ha annunciato quasi 6 miliardi di dollari destinati a infrastrutture per l’acqua potabile pulita e le acque reflue, seguita dall’Unione europea che, ad aprile 2024, ha adottato l’accordo raggiunto con il Consiglio a gennaio 2024 in tema di “inquinamento zero per l’Europa”, «creando le condizioni per la definizione di norme più elevate per il trattamento e il monitoraggio delle acque reflue urbane, in modo da non rilasciare nell’ambiente sostanze nocive, come le microplastiche e le sostanze PFAS».

S – SUSTAINABILITY: l’evoluzione dei modelli predittivi transformer per la previsione dei valori di tossicità chimica delle acque, in futuro, potrebbe impattare positivamente non solo sulla sostenibilità ambientale, andando a ridurre, a livello globale, il carico chimico nelle acque, ma altresì sulla sostenibilità sociale, specie in quei Paesi di Africa, Asia e America Latina, più fragili sotto il profilo economico-sociale e in cui – secondo i dati dell’United Nations Environment Programme (UNEP) sulla qualità dell’acqua nel mondo – dagli anni ’90, l’inquinamento idrico è peggiorato in quasi tutti i fiumi, con forti ripercussioni sulla disponibilità di acqua potabile. Lo United Nations World Water Development Report (WWDR) annuale ci ricorda che, sia per quanto riguarda i decenni passati, sia relativamente a tempi più recenti, i maggiori incrementi nell’esposizione agli inquinanti si registrano proprio nei Paesi a reddito basso e medio-basso, principalmente in seguito a una maggiore crescita demografica (soprattutto in Africa) e alla mancanza di un’attenta politica di gestione delle acque reflue.

Scritto da: