Se l’IA svela i segreti di (quasi) tutte le proteine

Sono oltre 200 milioni quelle di cui AlphaFold, l’intelligenza artificiale sviluppata da DeepMind ed EMBL-EBI è riuscita a prevedere la struttura 3D. Un contributo fondamentale alla ricerca scientifica.

Redazione ANSA

Di Alessio Jacona*

Grazie all’intelligenza artificiale, da oggi conosciamo i segreti di oltre 200 milioni di proteine, ovvero di quasi tutte le proteine catalogate conosciute dalla scienza. Merito della collaborazione tra DeepMind, azienda del gruppo Alphabet (Google) specializzata nello sviluppo dell’IA, e EMBL-EBI, l’Istituto Europeo di Bioinformatica dell’EMBL (Laboratorio Europeo di Biologia Molecolare), che ora rendono questi eccezionali risultati accessibili alla comunità scientifica attraverso l'AlphaFold Protein Structure Database.

Le proteine sono i mattoni della vita. Comprenderne il funzionamento è fondamentale per la ricerca scientifica e significa ad esempio essere in grado di progettare più facilmente e con maggiore efficacia nuove medicine o nuovi enzimi, oppure consente di comprendere perché e come le proteine sono la causa di tumori e malattie neurologiche come Alzheimer, Huntington e Parkinson.

Ma per capire come funziona una proteina, bisogna essere in grado di prevederne la struttura tridimensionale partendo dalla sua sequenza di amminoacidi. Negli ultimi 50 anni, la previsione del “folding proteico” è stata una delle sfide più difficili da superare per ricercatori e scienziati, finché nel 2021 è arrivata la svolta: l’IA AlphaFold di DeepMInd era riuscita a prevedere la struttura 3D delle 20.000 proteine espresse dal genoma umano, oltre a quelle di altri 20 organismi (dal topo al parassita della malaria) cruciali per la ricerca. Un patrimonio di conoscenza pari a circa 350mila proteine, la cui struttura 3D è stata resa accessibile alla comunità scientifica de DeepMind e EMBL-EBI tramite l’AlphaFold Protein Structure Database, mentre contemporaneamente venivano pubblicate la metodologia e il codice open source di AlphaFold, per consentire alla comunità scientifica di trarre insegnamento dai suoi progressi.

Da allora, più di 500.000 ricercatori e biologi di oltre 190 Paesi hanno avuto accesso al database AlphaFold per visualizzare oltre 2 milioni di strutture. Il database funziona come una "ricerca su Google" per le strutture proteiche, fornendo un accesso immediato ai modelli previsti e riducendo il tempo necessario agli scienziati per conoscere le forme probabili delle proteine che stanno studiando, accelerando il lavoro sperimentale.

Poi, oggi, la nuova svolta: il database è stato ampliato di 200 volte, passando da quasi 1 milione di strutture proteiche a oltre 200 milioni di strutture, che coprono quasi tutti gli organismi sulla Terra che hanno avuto il loro genoma sequenziato. L'espansione del database include strutture previste per la più ampia gamma possibile di specie, tra cui piante, batteri, animali e altri organismi, aprendo nuove strade di ricerca nelle scienze della vita che avranno un impatto sulle sfide globali, tra cui la sostenibilità, l'insicurezza alimentare e le malattie trascurate.

Intanto AlphaFold ha già supportato gli scienziati ad esempio fornendo indicazioni per lo sviluppo di un vaccino efficace contro la malaria. I ricercatori dell'Università di Oxford e del

National Institute of Allergy and Infectious Diseases hanno studiato una proteina di superficie del gamete chiamata Pfs48/45, che è uno dei candidati più promettenti per l'inclusione in un vaccino contro la malaria che ne blocca la trasmissione. "Combinando i modelli AlphaFold con le informazioni sperimentali ottenute dalla cristallografia, abbiamo potuto svelare la struttura di Pfs48/45, comprenderne la dinamica e mostrare dove si legano gli anticorpi bloccanti la trasmissione", ha dichiarato Matthew Higgins, professore di parassitologia molecolare. "Questa conoscenza sarà ora utilizzata per progettare vaccini migliori, che inducono gli anticorpi più efficaci nel bloccare la trasmissione"

Non solo: AlphaFold ha inoltre mostrato di poter avere un impatto anche in settori quali la lotta all'inquinamento da plastica, la comprensione del morbo di Parkinson, la protezione delle api da miele, la comprensione dei meccanismi di formazione del ghiaccio, la lotta a malattie trascurate come la malattia di Chagas e la leishmaniosi e l'esplorazione dell'evoluzione umana.

"AlphaFold offre ora una visione tridimensionale dell'universo proteico", ha dichiarato Edith Heard, Direttore generale dell'EMBL. "La popolarità e la crescita del database AlphaFold testimoniano il successo della collaborazione tra DeepMind ed EMBL. È un assaggio delle potenzialità della scienza multidisciplinare".

 

*Giornalista, esperto di innovazione e curatore dell’Osservatorio Intelligenza Artificiale

RIPRODUZIONE RISERVATA © Copyright ANSA