Gli scienziati progettano le molecole "al contrario" per accelerare le scoperte
Un metodo innovativo offre il potenziale per una più rapida creazione di farmaci, materiali e nuove tecnologie
Annunci
Ogni farmaco nel vostro armadietto, ogni materiale nella batteria del vostro telefono e praticamente ogni composto che fa funzionare la vita moderna è nato da un'ipotesi molecolare, con gli scienziati che ipotizzavano che una particolare disposizione di atomi avrebbe potuto fare qualcosa di utile - uccidere un'infezione batterica, immagazzinare la carica elettrica o assorbire la luce solare in modo efficiente.
Ma, dati i miliardi e miliardi di potenziali piccole molecole, trovare la combinazione giusta per rimediare a un'afflizione o per far progredire la tecnologia è una sfida: la ricerca di un ago nel pagliaio può richiedere decenni.
Negli ultimi anni, gli strumenti di intelligenza artificiale hanno contribuito ad abbreviare questo processo. I modelli di intelligenza artificiale generativa possono proporre strutture molecolari guidate dalle proprietà dell'obiettivo, comprimendo ciò che un tempo richiedeva anni di tentativi ed errori in ore di calcolo.
Un gruppo di ricercatori ha ora sviluppato un nuovo metodo che fa progredire ulteriormente questa capacità. Il metodo, PropMolFlow (Property-guided Molecular Flow), può generare candidati molecolari circa 10 volte più velocemente rispetto ai metodi esistenti, senza compromettere l'accuratezza o la validità chimica dei risultati.
La scoperta, condotta da scienziati dell'Università della Florida e della New York University, è descritta nella rivista Nature Computational Science.
"Per la maggior parte della storia della scienza, la scoperta dei materiali ha spesso preceduto la comprensione: i composti utili sono stati trovati per caso, poi gli scienziati hanno capito perché funzionavano", spiega Stefano Martiniani, professore assistente di fisica, chimica, matematica e scienze neurali alla NYU e autore dell'articolo. L'intelligenza artificiale generativa offre la possibilità di invertire la situazione: specificare le proprietà, quindi trovare le strutture". PropMolFlow rappresenta un altro passo verso la realizzazione di questa visione".
"In un campo in cui la velocità di calcolo si traduce direttamente in velocità di scoperta, questo rappresenta un progresso significativo", aggiunge Mingjie Liu, professore assistente presso il Dipartimento di Chimica dell'Università della Florida e uno degli autori dell'articolo. "Il lavoro non sostituisce ciò che l'ha preceduto, ma dimostra piuttosto che la prossima generazione di generatori molecolari può essere sostanzialmente più veloce, pur mantenendo l'accuratezza che rende questi strumenti utili".
Progettare molecole a ritroso
Gli autori del lavoro, che comprendono anche ricercatori dell'Università del Minnesota e della Brigham Young University, notano che la progettazione di molecole è fondamentalmente un "problema inverso".
"I chimici di solito non vogliono 'una molecola'", spiega Martiniani. "Vogliono invece una molecola che faccia qualcosa di specifico: interagire fortemente con la luce per applicazioni ottiche o possedere una particolare struttura elettronica che determini il modo in cui assorbe l'energia o conduce l'elettricità".
I progressi dell'intelligenza artificiale hanno reso possibile questo tipo di progettazione mirata. La scoperta tradizionale di farmaci e materiali parte in genere da ciò che è già noto, modificando i composti esistenti o cercando nei cataloghi di molecole già sintetizzate. L'intelligenza artificiale generativa può invece inventare strutture completamente nuove da zero, esplorando possibilità chimiche che nessuno ha mai considerato prima.
Questa capacità si è sviluppata rapidamente a partire dal 2022, quando i ricercatori hanno mostrato per la prima volta che lo stesso tipo di IA che alimenta i generatori di immagini come DALL-E poteva essere adattato per creare strutture molecolari tridimensionali. Ogni metodo successivo ha migliorato l'accuratezza del targeting delle proprietà, la validità chimica delle strutture generate o la velocità di generazione.
PropMolFlow li migliora tutti e tre contemporaneamente, utilizzando un algoritmo innovativo che trova percorsi più diretti dal rumore casuale a strutture molecolari valide. Il risultato: circa 100 passaggi computazionali, mentre i metodi precedenti ne richiedevano 1.000.
Precisione senza scorciatoie
I ricercatori si sono resi conto che la velocità è inutile se le molecole generate non hanno senso dal punto di vista chimico o non hanno le proprietà desiderate, ovvero le caratteristiche desiderate per soddisfare un'esigenza specifica, quindi hanno testato l'accuratezza di PropMolFlow confrontandolo con altri modelli.
In questo caso hanno scoperto che il metodo superava costantemente i modelli di base per quanto riguarda la validità strutturale: generava molecole con schemi di legame corretti e geometrie appropriate più del 90% delle volte.
"Questo è importante perché molti approcci precedenti producevano strutture che sembravano superficialmente plausibili ma che violavano le regole chimiche di base", spiega Martiniani.
Allo stesso modo, PropMolFlow è stato in grado di rendere le proprietà molecolari ricercate dagli scienziati, con un'accuratezza competitiva o superiore su più proprietà molecolari rispetto ai migliori approcci esistenti, e allo stesso tempo con un calcolo molto più rapido.
Controllo dei compiti dell'intelligenza artificiale
Un problema fondamentale della progettazione molecolare basata sull'IA è la valutazione.
"Se una rete neurale genera una molecola e un'altra rete neurale ne predice le proprietà, entrambi i sistemi possono avere punti ciechi simili perché attingono allo stesso serbatoio di informazioni: l'IA sta quindi valutando i propri compiti", osserva Martiniani.
Il team di PropMolFlow ha affrontato questo problema convalidando le molecole generate utilizzando la teoria funzionale della densità, un metodo di chimica quantistica basato sulla fisica che calcola le proprietà molecolari da principi primi, indipendentemente da qualsiasi modello di apprendimento automatico.
Per la maggior parte delle proprietà, le previsioni della rete neurale hanno effettivamente seguito i calcoli basati sulla fisica, confermando che una valutazione più rapida basata sull'intelligenza artificiale è statisticamente affidabile.
"Questo tipo di convalida fornisce la credibilità necessaria affinché le molecole generate vengano prese in seria considerazione per applicazioni reali", afferma Liu.
Cosa permette di fare
La combinazione di velocità e precisione dimostrata da PropMolFlow ha implicazioni pratiche per la scoperta molecolare, concludono gli autori.
"Con la capacità di generare migliaia di candidati chimicamente validi e con proprietà mirate in pochi minuti anziché in ore, i ricercatori possono iterare più velocemente: generare candidati, filtrare computazionalmente, convalidare i migliori con la fisica o con gli esperimenti, e riportare i risultati per migliorare la fase successiva", spiega Martiniani.
"I farmaci reali e i materiali avanzati sono in genere più grandi e più complessi delle molecole che abbiamo esplorato, e l'estensione di questi approcci a sistemi più grandi rimane una sfida attiva", riconosce Liu. "Ma i principi si traducono e l'attento trattamento dell'incorporazione delle proprietà e della convalida basata sulla fisica fornisce un modello per applicazioni più ambiziose".
Nota: questo articolo è stato tradotto utilizzando un sistema informatico senza intervento umano. LUMITOS offre queste traduzioni automatiche per presentare una gamma più ampia di notizie attuali. Poiché questo articolo è stato tradotto con traduzione automatica, è possibile che contenga errori di vocabolario, sintassi o grammatica. L'articolo originale in Inglese può essere trovato qui.