Grazie a uno strumento computazionale, un recente studio australiano rivela mutazioni in porzioni del genoma umano tradizionalmente trascurate, che potrebbero, in futuro, contribuire alla definizione di un approccio nuovo al trattamento di determinate patologie oncologiche.
All’interno del genoma umano, esiste una regione che non fornisce alcuna istruzione per produrre proteine, ossia “non codifica” per le proteine, da cui il nome di “DNA non codificante”, in inglese “non-coding DNA”.
Nel ricordare come, in passato, questa regione fosse definita dai genetisti “junk DNA”, ovvero “DNA spazzatura”, Shurjo K. Sen – ricercatore e Program Director presso l’Office of Genomic Data Science, in seno al National Human Genome Research Institute (nel Maryland, USA) – fa notare che «il genoma umano è una vasta distesa di nucleotidi, quasi 3,3 miliardi. E che, in verità, solo una frazione molto piccola di tale distesa, circa il 2%, codifica quelle che sappiamo essere proteine. Alla luce di questo, la domanda, più che sulle dimensioni, verte, piuttosto, sull’attività del restante 98%. È lì che non fa nulla oppure ha una propria funzione?».
A partire dall’ultimo decennio – prosegue lo scienziato – «abbiamo iniziato a renderci conto che ciò che consideriamo “non codificante”, in realtà, potrebbe avere un modo più sottile di passare le proprie informazioni. Potrebbe non codificare nel senso classico, ma ci sono comunque moltissimi dati cruciali racchiusi in questa parte di genoma» [fonte: Non-coding DNA – National Human Genome Research Institute, 13 luglio 2024].
E di questo ha dato prova un lavoro del 2021 pubblicato su Nature (“Non-coding deletions identify Maenli lncRNA as a limb-specific En1 regulator”), il quale ha stabilito, per la prima volta, come una specifica variazione di un cromosoma nel DNA non codificante sia correlata a gravi anomalie congenite degli arti. Quello fu l’inizio.
Takeaway
I siti di legame della proteina CTCF nel DNA non codificante
Sempre su Nature, due anni dopo, appare uno studio a cura di due ricercatori del Discovery Sciences di AstraZeneca (“An expanded genomic database for identifying disease-related variants”, 6 dicembre 2023), incentrato proprio sul ruolo del DNA non codificante nell’analisi delle corrispondenze tra malattie e mutazioni genetiche.
Un ruolo non semplice da comprendere appieno, per il fatto che, nelle porzioni di non-coding DNA – spiegano gli autori – non è ancora chiara la distinzione tra le variazioni potenzialmente dannose e le variazioni “neutre” per la salute umana [per approfondimenti, rimandiamo alla lettura del nostro articolo “Mutazioni genetiche: un nuovo approccio identifica quelle potenzialmente pericolose anche nel non-coding DNA”].
Riprende le fila del discorso in materia, un team di ricerca dell’Epigenetics Laboratory, presente nel Garvan Institute of Medical Research, a Sidney, in un articolo (“Machine learning enables pan-cancer identification of mutational hotspots at persistent CTCF binding sites” – Nucleic Acids Research, 2 luglio 2024) in cui l’attenzione va alle mutazioni genetiche che colpiscono, nello specifico, i siti di legame della proteina CTCF, che risiedono all’interno del DNA non codificante.
Cos’è la proteina CTCF? La sigla rimanda all’acronimo inglese “CCCTC-binding factor”, letteralmente “fattore legante CCCTC”, proteina che funge da supporto nel mediare l’organizzazione del genoma e l’espressione dei geni al suo interno. Il lavoro di mappatura dei siti di legame CTCF in diverse specie, svolto negli ultimi anni dal mondo della ricerca, ha rivelato che il genoma è interamente coperto da tali siti [fonte: “CTCF as a multifunctional protein in genome regulation and gene expression” – Experimental & Molecular Medicine, 2015].
Il DNA non codificante e le “ancore” all’interno del genoma
In verità, non è la prima volta che il team australiano affronta il tema dei siti di legame della proteina CTCF nel non-coding DNA. In uno studio che risale al 2020 (“Constitutively bound CTCF sites maintain 3D chromatin architecture and long-range epigenetically regulated domains” – Nature Communications), ha descritto come questi siti siano in grado di avvicinare, di legare tra loro, porzioni distanti del DNA non codificante, «formando strutture 3Dche controllano quali geni vengono attivati o disattivati». Precisano i ricercatori:
«In particolare, abbiamo identificato un sottoinsieme di siti di legame del CTCF che abbiamo definito “persistenti”, poiché agiscono come “ancore” all’interno del genoma»
L’ipotesi che ha ispirato il più recente lavoro (luglio 2024) del gruppo di studio del Garvan Institute of Medical Research sulle mutazioni genetiche ai danni dei siti di legame del CTCF, riguarda l’eventualità di un difetto nell’ancoraggio, con conseguente interruzione del processo di organizzazione 3D del DNA non codificante e, dunque, con la perdita della funzione di controllo, da parte della proteina CTCF, dell’espressione genica, causando ricadute importanti sulla formazione delle cellule tumorali (vedremo, in seguito, di quali tipi di ricadute si tratta).
Per indagare tale ipotesi, gli autori si sono serviti di un sistema di apprendimento automatico che hanno denominato CTCF-INSITE (IN-Silico Investigation of persisTEnt binding), la cui funzione è fare previsioni in merito a quali siti di legame della proteina CTCF, nel non-coding DNA, potrebbero eventualmente fungere da “ancore” (e, dunque, dimostrarsi persistenti) nell’ambito di dodici diverse tipologie di tumori, contribuendo, così, alla loro formazione e progressione.
Due modelli ML per prevedere le funzioni di ancoraggio nell’ambito di dodici tipologie di tumori
Nel dettaglio, lo strumento computazionale messo a punto si avvale di due modelli di machine learning,addestrati sulla base di una serie di caratteristiche genetiche ed epigenetiche di siti di legame CTCF persistenti (detti anche P-CTCF) simulati al computer (in silico).
In particolare, le caratteristiche genetiche ed epigenetiche prescelte – atte a determinare la persistenza del legame della proteina e, quindi, l’inclinazione dei siti ad agire come “ancore” nel DNA non codificante – sono quindici.
Dopo l’addestramento, i due modelli AI sono stati testati attraverso l’analisi di oltre 3.000 campioni di cellule tumorali provenienti da pazienti con diagnosi riferite a dodici tipi di cancro (tra cui quello della prostata, della mammella e del colon-retto), disponibili nel database dell’International Cancer Genome Consortium (ICGC).
L’analisi della gigantesca mole di dati ha portato ad alcune scoperte e considerazioni significative. In primo luogo, in tutti i dodici tipi di cancro, all’interno del non-coding DNA, sono stati identificati siti di legame CTCF persistenti. Ma non solo. Ogni campione di cellule tumorali presentava almeno una mutazione in un sito di legame. Il che significa che tutti gli ancoraggi mostravano mutazioni.
«Questa ricerca conferma che, nei tumori, i siti di legame CTCF persistenti fungono da “hotspot mutazionali”» osserva il team di lavoro.
La seconda evidenza, emersa mediante test di laboratorio, ha convalidato l’ipotesi alla quale si è accennato in precedenza, secondo la quale un difetto nell’ancoraggio – in questo caso specifico, dovuto alle mutazioni tumorali – effettivamente riduce le proprietà leganti dei siti CTCF persistenti.
Che cosa vuol dire questo, nel concreto? Che le suddette mutazioni del non-coding DNA sono legate all’interruzione del fattore legante e che tale interruzione, a sua volta, è in grado di svolgere un ruolo nella rottura dello stato di equilibrio delle strutture 3D delle porzioni del DNA, favorendo potenzialmente la formazione e la progressione delle cellule tumorali. Ciò suggerisce – evidenziano i ricercatori – che:
«Il legame CTCF interrotto è associato alla perdita dell’ancoraggio. E il fatto che le mutazioni tumorali vengano “arricchite” da questa perdita indica che la rottura dell’ancoraggio fornisce loro un vantaggio selettivo. Nell’insieme, tutto questo apre a ipotesi future sul fatto che le mutazioni dei siti di legame CTCF persistenti possano promuovere programmi fondati sull’alterazione dell’ancoraggio dei geni correlati al cancro»
Glimpses of Futures
Sebbene occorrano nuovi studi per convalidare i risultati ottenuti dalla ricerca descritta, essi vanno nella direzione di un approccio completamente nuovo al trattamento di numerose tipologie di cancro.
Cercando, ora, di anticipare possibili scenari futuri, proviamo ad analizzare – attraverso la matrice STEPS – gli impatti che l’evoluzione del corso di studi illustrato, sulle funzioni del DNA non codificante, potrebbe avere su più fronti.
S – SOCIAL: la nuova generazione di terapie antitumorali segue la linea della personalizzazione, che include trattamenti mirati, “a misura” del singolo paziente, in linea con la risposta riparatrice delle sue cellule al danno al DNA e definiti sulla base di mutazioni genetiche specifiche. Il tutto accompagnato da tempistiche di attesa assai lunghe per la persona malata. La scoperta – da parte del Garvan Institute of Medical Research – di mutazioni nei siti di legame CTCF persistenti, comuni a differenti tipologie di cancro, fa, invece, pensare alla possibilità, in futuro, di sviluppare metodologie e tecniche efficaci contro molteplici tumori, sposando criteri di terapia oncologica su base genetica ma, al contempo, “universali” e, dunque, forieri di interventi più rapidi. Inoltre, dato per acquisito che gli ancoraggi presenti nei siti di legame della proteina CTCF, all’interno del DNA non codificante, sono funzionali al mantenimento dell’omeostasi dell’architettura dell’intero genoma, è pacifico che eventuali mutazioni al loro interno possano interrompere anche l’equilibrio nelle cellule tumorali, facendo immaginare scenari futuri in cui l’evoluzione della ricerca condurrà all’identificazione di geni chiave che potrebbero fungere da marcatori per la diagnosi precoce del cancro o da bersagli per nuovi trattamenti.
T – TECHNOLOGICAL: in futuro, l’approfondimento delle mutazioni del non-coding DNA associate all’interruzione del fattore legante e, quindi, alla rottura dello stato di equilibrio delle strutture 3D del genoma, potrebbe avvalersi del sistema di editing genomico CRSPR Cas9, al fine di studiare come tali mutazioni, spezzando l’ancoraggio, siano in grado di favorire la formazione delle cellule tumorali. Ricordiamo che CRISPR Cas9 è uno strumento capace di identificare e di tagliare sequenze di DNA bersaglio all’interno del genoma di una cellula vegetale, animale e umana, eliminandole e sostituendole con altre. In questo caso specifico, il suo impiego supporterebbe gli esperimenti volti a comprendere appieno i meccanismi di cancerogenesi legati all’interruzione del processo di organizzazione 3D del DNA non codificante.
E – ECONOMIC: di fronte alle attuali terapie antitumorali mirate che, per essere il più possibile aderenti al profilo genetico del singolo paziente, necessitano di test genetici preliminari e di test di diagnostica molecolare, il cui costo è piuttosto elevato, le future, possibili, terapie universali messe a punto per rispondere alle mutazioni nei siti di legame CTCF persistenti – proprie di più patologie oncologiche come, ad esempio, il cancro alla prostata, il cancro al seno e al colon-retto – che la ricerca illustrata auspica, contribuirebbero a ridurre la spesa oncologica sostenuta dal Sistema sanitario nazionale. A tale riguardo, si calcola, nell’UE, un impatto economico complessivo delle malattie oncologiche che supera i 100 miliardi di euro l’anno.
P – POLITICAL: un approccio al trattamento del cancro come quello vagheggiato dagli scienziati australiani, focalizzato, anziché sulle caratteristiche genomiche uniche del tumore del singolo, sulle mutazioni genetiche comuni a differenti tipologie di cancro, comunque, in futuro, necessiterà di politiche puntuali e attente a garantire sostegno attraverso programmi concreti. Il Piano europeo di lotta contro il cancro, presentato dalla Commissione europea nel 2021, va in questa direzione, promuovendo, oltre alla prevenzione sostenibile e alla diagnosi precoce più efficace, parità di accesso alla diagnostica di ultima generazione e alle cure su base genetica.
S – SUSTAINABILITY: come per le terapie oncologiche personalizzate, anche per future terapie su base genetica ma universali, se queste, negli anni a venire, dovessero essere convalidate e approvate, si porrà il problema della loro sostenibilità sociale, data dall’accesso equo alla loro fruizione e dall’abbattimento delle disuguaglianze sanitarie. Queste ultime, nel caso specifico del nostro Paese, si pongono con l’approvazione del disegno di legge sull’autonomia differenziata delle Regioni del 23 gennaio 2024, pubblicato sulla Gazzetta Ufficiale il 26 giugno 2024 (Legge 26 giugno 2024, n. 86), che sancisce il “regionalismo sanitario”, col rischio di non vedere garantiti in maniera omogenea, in tutte le regioni, test diagnostici e cure per i pazienti oncologici.