Una versione ancora più estesa del catalogo mondiale delle mutazioni genetiche umane e uno strumento in grado di analizzarlo in toto, hanno condotto all’individuazione di quelle regioni del genoma che, quando alterate, possono innescare patologie anche gravi.

Sono una miriade (e spesso rare) le malattie connotate da un’origine genetica. È difficile perfino stimarne un numero preciso. Solo a titolo di esempio, già nel 2016, quelle derivate da alterazioni in un singolo gene erano, nel mondo, oltre diecimila [fonte: “Genetic Disorders” – Genetic Alliance UK]. La comunità scientifica internazionale da diversi decenni, ormai, studia tali patologie, focalizzandosi sulle loro correlazioni con le mutazioni genetiche.

È anche solo un minimo cambiamento nella sequenza del DNA, rispetto alla sequenza normale, a determinare l’insorgere di una malattia genetica. Il cambiamento (mutazione) può riguardare un solo gene o più geni, arrecare danni ai cromosomi oppure alle strutture che trasportano i geni stessi.

Tra le malattie genetiche maggiormente note, ricordiamo la sindrome di Down, la fibrosi cistica, la distrofia muscolare di Duchenne e l’anemia falciforme. Ma sono, purtroppo, ancora molte quelle sconosciute, senza diagnosi. In particolare, il National Human Genome Research Institute sottolinea:

« man mano che studiamo e sveliamo i segreti del genoma umano, apprendiamo che quasi tutte le malattie hanno una componente genetica. Alcune di esse sono causate da mutazioni ereditate dai genitori e, quindi, presenti alla nascita. Altre sono generate da mutazioni acquisite durante l’arco di vita. Queste ultime non sono ereditate, ma si verificano in modo casuale o in seguito a un’esposizione ambientale, come quella al fumo di tabacco o a sostanze chimiche tossiche, cagionando diversi tipi di tumori, così come talune forme di neurofibromatosi»

Le “mutazioni genetiche acquisite” rappresentano una matrice del cancro molto più comune rispetto alle “mutazioni ereditarie”. E, anche se i cambiamenti in alcuni geni non provocano in modo diretto la malattia, questi potrebbero comunque contribuire ad aumentare le probabilità dell’insorgere di una patologia oncologica. Ad esempio, determinate alterazioni genetiche sono responsabili di una ridotta capacità dell’organismo di disgregare le tossine sprigionate dal fumo di sigaretta: ecco che, tra coloro che fumano, i soggetti con questo tipo di variazione del DNA corrono un rischio maggiore di contrarre tumori ai polmoni o altre tipologie di disturbi legati al fumo [fonte: “Gene changes and cancer” – American Cancer Society].


Gli studi degli ultimi due anni in tema di mutazioni genetiche hanno fatto sempre più luce sull’importanza, nella ricerca delle cause delle malattie ancora senza nome, di quelle regioni del genoma umano solo apparentemente prive di funzioni, in quanto “non codificano”, non danno istruzioni per produrre proteine.
Le variazioni che interessano le porzioni di genoma non codificante hanno di recente trovato posto all’interno del più grande database pubblico delle mutazioni genetiche umane, nonché in seno a una nuova metodologia che determina, formulando punteggi, quali geni possiedono più probabilità di essere correlati a una data malattia.
Sia il catalogo delle mutazioni che la metrica capace di quantificare il livello di intolleranza alle variazioni genetiche pongono al centro il non-coding DNA, segnando così il terreno della futura diagnostica, che immaginiamo tempestiva, tesa a rallentare il decorso delle malattie e, in uno scenario evolutivo, a curarle e sconfiggerle.

Malattie e mutazioni genetiche: focus sul DNA non codificante

Il lavoro di due ricercatori del Discovery Sciences di AstraZeneca – il primo della sede USA, nel Massachusetts, il secondo di quella inglese, a Cambridge – enfatizza l’importanza di un fattore, oggi, ritenuto sempre più centrale nello studio delle corrispondenze tra malattie e mutazioni genetiche, anche se la strada da fare per comprenderlo appieno e approfondirne le funzioni è ancora lunga. Si tratta del DNA non codificante (dall’inglese “non-coding DNA”), di cui i due scienziati trattano nell’articolo “An expanded genomic database for identifying disease-related variants”, apparso su Nature il 6 dicembre 2023.

Iniziamo col dire che il “DNA non codificante” fa riferimento a quella «porzione del genoma umano che non dà istruzioni per produrre proteine» e che, appunto, “non codifica” per le proteine. Una porzione assai ampia, poiché, in realtà, solo l’uno o il due per cento del DNA è costituito da geni codificanti [fonte: “What is noncoding DNA?” – National Library of Medicine].

Fino a non molti anni fa, veniva addirittura definito dai genetisti “junk DNA”, cioè “DNA spazzatura”, privo di scopo e di significato nel più ampio quadro dell’attività genetica dell’essere umano. Solo nel 2021 la ricerca iniziò a stabilire un nesso preciso tra le mutazioni del non-coding DNA e lo stato di malattia.

Più nel dettaglio, l’indagine “Non-coding deletions identify Maenli lncRNA as a limb-specific En1 regulator”, pubblicata il 10 febbraio 2021 sempre su Nature, dimostrò per la prima volta come una specifica variazione di un cromosoma all’interno di una regione non codificante del genoma sia legata a gravi anomalie congenite degli arti.

Fu un passo avanti decisivo, anche se il gruppo di lavoro, all’epoca, concluse ricordando che «l’interpretazione del non-coding DNA è ancora una grande sfida, proprio perché ne sappiamo ancora così poco».

Quali sono le mutazioni che determinano lo stato di salute?

Nel loro scritto in tema di malattie e mutazioni genetiche, i due scienziati del Discovery Sciences di AstraZeneca sono partiti da una considerazione ben precisa: ad oggi, per quanto riguarda le porzioni di DNA non codificante, non è ancora chiara la distinzione tra le loro variazioni potenzialmente dannose e le variazioni “neutre” per la salute umana. In estrema sintesi, non tutte le mutazioni del non-coding DNA sono pericolose.

I due autori, in particolare, fanno riferimento a un recente studio, “A genomic mutational constraint map using variation in 76,156 human genomes”, a cura del team del Broad Institute – che aggrega ricercatori nell’ambito di discipline diverse, provenienti da istituzioni a livello globale, tra cui anche il Massachusetts Institute of Technology, l’Università di Harvard e gli ospedali a lei affiliati – e al Genome Aggregation Database (gnomAD), un catalogo mondiale, aperto al pubblico, delle mutazioni genetiche umane, la cui prima versione fu rilasciata nel 2020 da un consorzio di ricerca internazionale coordinato dallo stesso Broad Institute.

Inizialmente, il database conteneva dati relativi alla sequenza di DNA codificante di 125.748 persone (tutte coperte dall’anonimato, naturalmente) e dati inerenti all’intero genoma di 15.708 soggetti. Da allora – rimarcano i due studiosi di AstraZeneca – questa immensa mole di big data genomici è andata ampliandosi, tanto che, oggi, grazie al citato lavoro del Broad Institute, essa comprende sequenze dell’intero genoma di 76.156 individui di provenienza geografica e di etnie diverse, fornendo, così, un quadro molto più approfondito delle mutazioni genetiche umane, incluse quelle delle regioni non codificanti.

«La maggior parte delle mutazioni sono clinicamente insignificanti – commentano – Il numero più ampio e diversificato di interi genomi in questa nuova versione di gnomAD consentirà ai genetisti di individuare con maggiore rapidità quali variazioni del DNA sono davvero rare – e, quindi, con maggiore ragionevolezza legate alla malattia – anche nelle porzioni di genoma non codificante».

Malattie e mutazioni genetiche: una nuova metrica “misura” le variazioni del DNA non codificante

In materia di malattie e mutazioni genetiche – fanno notare i due autori – un’altra peculiarità di un catalogo così ricco ed eterogeneo come il Genome Aggregation Database risiede nel suo prestarsi all’addestramento delle cosiddette “metriche di intolleranza“, la cui funzione è «… determinare quali geni sono intolleranti alla variazione genetica: quelli con meno variazioni del previsto sono più intolleranti e, proprio per questo, possiedono più probabilità di essere associati alla malattia rara rispetto ai geni che ospitano più variazioni».

Negli ultimi due anni, la ricerca è andata nella direzione di una sempre maggiore inclusione, nei parametri di intolleranza, delle regioni non-coding del genoma umano. A tale proposito, il menzionato team del Broad Institute ha recentemente messo a punto una metrica denominata “Gnocchi”, per mezzo della quale vengono assegnati punteggi di intolleranza alle mutazioni che interessano anche porzioni di genoma non codificanti. E spiega:

«… mentre i geni codificanti proteine hanno confini ben definiti, le regioni non codificanti non sono divise in unità funzionali. Per aggirare questo problema, le abbiamo suddivise in “finestre”, calcolando per ciascuna di esse il grado di intolleranza alle variazioni»

Questo nuovo strumento, rispetto ai precedenti, determina il numero “teorico” di mutazioni per ciascuna finestra non-coding, impiegando un algoritmo di calcolo allenato sulla base di una serie di caratteristiche genomiche, tra cui «le sequenze locali di DNA». Il numero previsto viene poi messo a confronto con il numero effettivo di varianti presenti in ciascuna sequenza all’interno del catalogo gnomAD.

Ebbene, dai primi test in laboratorio è emerso che le porzioni non codificanti che presentavano molte meno mutazioni del previsto hanno ricevuto un punteggio Gnocchi maggiore. Il che significa che tali porzioni sono più intolleranti alle mutazioni e, dunque, hanno maggiori possibilità di essere rilevanti per l’insorgere di malattie genetiche.

Glimpses of futures

La ricerca sulle mutazioni genetiche, sia erediate che acquisite, è l’arma più potente che la scienza possiede per arrivare a dare un nome alle malattie ancora sconosciute che ne derivano e riuscire a diagnosticarle sempre più tempestivamente per rallentarne il decorso.

L’obiettivo ultimo, a partire dalla diagnosi precoce, è poterle curare. Questo è lo scenario evolutivo più ambizioso al quale guardare quando si parla di strumenti come quelli descritti, ovvero un catalogo mondiale di tutte le mutazioni genetiche umane (in regioni codificanti come in quelle non codificanti) e una metrica in grado di quantificare il livello di intolleranza alle variazioni anche per quanto concerne le porzioni non-coding del genoma, rilevando quelle da monitorare perché “riconosciute” come potenzialmente nocive per la salute.

Certo, si dovrà lavorare molto. Il non-coding DNA rappresenta un ambito di studi, per molti versi, oscuro, di cui non si conoscono ancora le linee di demarcazione tra bianco e nero, tra ciò che è bene (neutro) e male (nocivo).

In futuro, il database gnomAD continuerà a crescere. I due ricercatori del Discovery Sciences di AstraZeneca fanno sapere che «la priorità è espandere continuamente il catalogo, affinché possa essere ancora più rappresentativo della popolazione globale. Solo in questo modo, potrà fornire agli scienziati sempre più mezzi con cui svelare i segreti nascosti del nostro genoma».

la metrica “Gnocchi” verrà, negli anni a venire, continuamente perfezionata, allo scopo di supportare in modo fattivo i medici nell’analisi del DNA dei pazienti sospettati di avere una malattia genetica sconosciuta, aiutandoli – in sede di diagnosi – a vagliare tutte le varianti, escludendo quelle comuni e insignificanti per focalizzarsi solo su quelle con più probabilità di causare la patologia.

Con l’intento di anticipare scenari futuri, proviamo a delineare – avvalendoci della matrice STEPS – gli impatti, positivi o negativi, che le soluzioni descritte potrebbero avere su più fronti.

S – SOCIAL: la diagnosi precoce delle malattie genetiche sconosciute, attraverso l’utilizzo, già nel periodo neonatale, degli strumenti illustrati, si tradurrebbe, in futuro, in una loro presa in carico più tempestiva – e, dunque, più consapevole e meno traumatica – da parte delle famiglie dei pazienti e da parte dei caregiver.

T – TECHNOLOGY: un database destinato a divenire sempre più esteso e complesso come quello delle mutazioni genetiche umane, potrebbe – a tendere – vedere l’apporto delle tecniche di intelligenza artificiale (tra cui il machine learning), per un’analisi e un incrocio più rapidi dei grossi quantitativi di dati in esso contenuti.

E – ECONOMY: in uno scenario futuro, l’impatto economico positivo dato dall’applicazione del database gnomAD e della metrica Gnocchi a supporto della diagnosi precoce delle malattie genetiche, porterebbe a una riduzione complessiva dei costi dovuti al ritardo diagnostico, a carico delle famiglie, del sistema sanitario e previdenziale.

P – POLITICAL: a destare qualche preoccupazione di carattere etico, il fatto che, ad oggi, la banca dati mondiale dei genomi includa soltanto quasi il cinquanta per cento di informazioni provenienti da persone di origine non europea. Per conferire, in futuro, il giusto carattere di equità a un tool destinato all’ambito medico, gli organi preposti dovranno monitorarne l’eterogeneità equilibrata dei dati sotto il profilo dell’etnia e dell’appartenenza geografica.

S – SUSTAINABILITY: dal punto di vista della sostenibilità sociale, la diagnosi tempestiva delle patologie di matrice genetica deve poter essere accessibile a tutte le comunità, a tutte le famiglie, nel rispetto del diritto di ognuno alla salute e alle cure necessarie. I rischi maggiori riguardano le persone con fragilità socio-economica, soprattutto laddove – come in Italia, dal 1° gennaio 2024 [fonte: Osservatorio Malattie Rare] – il sistema sanitario nazionale non fornisce gratuitamente in tutto il territorio le prestazioni relative alla genetica.

Scritto da:

Paola Cozzi

Giornalista Leggi articoli Guarda il profilo Linkedin