A IA reconstrói moléculas a partir de fragmentos que explodiram

Os investigadores treinaram uma rede neuronal que pode utilizar o momento dos iões para trabalhar para trás e prever a geometria pré-explosão de uma molécula

23.03.2026
Illustration: Greg Stewart/SLAC National Accelerator Laborator

Os investigadores treinaram um novo modelo Al para reconstruir estruturas 3D de moléculas a partir de informações captadas quando as explodem com poderosos raios X.

Investigadores do SLAC National Accelerator Laboratory, nos Estados Unidos, do European XFEL e de instituições colaboradoras construíram recentemente um modelo generativo de IA capaz de recriar estruturas moleculares a partir do movimento dos iões da molécula depois de serem destruídos por raios X, uma técnica designada por imagem de explosão de Coulomb. Os dados do instrumento Small Quantum Systems (SQS) do European XFEL foram cruciais para demonstrar a aplicabilidade deste método recentemente desenvolvido.

A investigação, publicada na revista Nature Communications, constitui um passo importante para a obtenção de imagens instantâneas de moléculas durante reacções químicas - um avanço que poderá ter impactos importantes na medicina e na indústria. O modelo de aprendizagem automática previu com exatidão as geometrias de uma série de moléculas diferentes constituídas por menos de dez átomos, abrindo caminho para a aplicação da técnica a moléculas maiores. "Estávamos muito entusiasmados com isso", disse Xiang Li, um cientista associado da Linac Coherent Light Source (LCLS) do SLAC e principal autor do estudo. "É o primeiro modelo de IA construído para a reconstrução da estrutura molecular a partir de imagens de explosão de Coulomb." Rebecca Boll, cientista do instrumento SQS e coautora do artigo, acrescentou: "É muito difícil reconstituir uma molécula explodida no espaço real a partir dos momentos registados. A inteligência artificial pode ajudar-nos a conseguir isso".

Uma nova forma de ver as moléculas

Atualmente, as opções disponíveis para obter imagens de moléculas isoladas em fase gasosa são limitadas. Com a microscopia eletrónica, por exemplo, os objectos têm de ser fixados, o que impossibilita a imagem de moléculas que flutuam livremente. E para que as técnicas baseadas na difração funcionem, a amostra de moléculas tem de ser suficientemente densa para gerar um sinal forte no detetor. A imagem resultante é, tecnicamente, uma média de muitas moléculas, o que impede os investigadores de estudarem pormenores apenas visíveis quando se obtêm imagens de moléculas isoladas.

No artigo, os investigadores centraram-se na imagem por explosão de Coulomb. Nesta técnica, um impulso de raios X atinge uma única molécula numa câmara de vácuo, arrancando os electrões da molécula. Isto deixa para trás iões positivos que se repelem explosivamente uns dos outros e se chocam contra um detetor. O detetor capta o seu momento, que pode ser utilizado para reconstruir a estrutura da molécula. "Esta técnica tem a capacidade de isolar pequenos detalhes que são quimicamente relevantes", disse James Cryan, diretor-adjunto interino do LCLS para a ciência, investigação e desenvolvimento e coautor do artigo.

"Já usámos anteriormente a imagem da explosão de Coulomb no SQS com grande sucesso", disse o coautor Michael Meyer, cientista principal do instrumento europeu XFEL. "Mas muitas vezes, até agora, tem sido inviável fazer uma reconstrução real da geometria molecular devido a restrições de computação." Embora o impulso de raios X elimine rapidamente os electrões, os iões restantes não explodem instantaneamente. Durante este breve atraso, os átomos podem deslocar-se ligeiramente, o que torna difícil reconstruir a estrutura original utilizando a lei de Coulomb para as forças electrostáticas. "Não será exato porque a simples utilização dessa lei só funciona se o processo de carregamento for instantâneo", explicou Li.

Para tornar as coisas ainda mais complicadas, cada átomo adicional na molécula acrescenta um nível exponencial de complexidade. "É muito difícil trabalhar no sentido inverso para obter a estrutura original", disse o coautor Phay Ho, um físico do Laboratório Nacional de Argonne, nos Estados Unidos. "É como partir um copo e tentar juntá-lo a partir da forma como os pedaços se separaram. Muitos problemas da física e da química modernas envolvem a reconstrução de estruturas ocultas a partir de medições indirectas. Este trabalho demonstra como a IA pode ajudar a resolver esses problemas inversos".

Aprendizagem automática para estruturas moleculares

A equipa de investigação propôs-se construir um modelo de aprendizagem automática que pudesse ultrapassar esta limitação informática. Desenvolveram e treinaram o modelo na Facilidade de Dados Científicos Partilhados (S3DF) do SLAC. Os modelos de IA generativa são adequados para esta tarefa porque "pensam" de forma diferente de uma simulação informática normal. Em vez de trabalharem através de uma série de equações, aprendem encontrando padrões nos dados de treino. Depois, utilizam esses padrões para fazer previsões estatísticas.

Para recolher dados de treino, a equipa recorreu a uma simulação criada por Ho. A simulação analisa estruturas moleculares e calcula o momento dos seus iões após uma explosão de Coulomb. Depois de funcionar durante mais de um mês, a simulação de computação intensiva, que utiliza equações da mecânica quântica e da física clássica, produziu um conjunto de dados de 76 000 amostras moleculares.

Inicialmente, os investigadores treinaram a IA apenas com este conjunto de dados, que é pequeno para os padrões de treino de IA, e descobriram que o modelo previa estruturas incorrectas a partir dos dados da explosão. Por isso, refizeram o treino, acrescentando outro conjunto de dados obtido apenas com recurso à física clássica. O segundo conjunto era menos preciso, mas cerca de 100 vezes maior do que o primeiro.

Este treino em duas fases foi o truque para prever estruturas precisas.

Os investigadores testaram o modelo de IA pedindo-lhe que previsse estruturas moleculares numa parte dos dados de simulação que não tinha visto no treino. O modelo, a que a equipa deu o nome de MOLEXA (abreviatura de "reconstrução da estrutura molecular a partir de imagens de explosões de Coulomb"), pegou nos momentos dos iões e calculou as estruturas mais prováveis. "Descobrimos que este processo de formação em duas etapas suprimiu o erro de previsão por um fator de dois", disse Li.

A equipa testou então o MOLEXA com conjuntos de dados experimentais registados no SQS. As moléculas testadas incluíam água, tetrafluorometano e etanol. Introduziram os momentos iónicos experimentais no modelo, reconstruíram as estruturas moleculares e depois compararam as reconstruções com as estruturas conhecidas listadas pelo Instituto Nacional de Normas e Tecnologia.

Descobriram que as previsões coincidiam em grande parte com as estruturas estabelecidas. Em geral, as ligações estavam nos sítios certos, com apenas ligeiras variações nos seus ângulos. Os erros de posição eram geralmente inferiores a metade do comprimento de uma ligação química típica. "O modelo está de facto, na maioria das vezes, a fazer melhor do que isso", acrescentou Li. "É apenas um ponto de partida para investigação futura, que não só melhorará a precisão do modelo como também alargará a sua aplicabilidade a sistemas moleculares maiores."

Expandir para moléculas maiores e reacções químicas

"Experiências como a imagem da explosão de Coulomb geram frequentemente uma quantidade esmagadora de dados difíceis de interpretar", explicou Serguei Molodtsov, diretor científico do European XFEL. "Ao utilizar a inteligência artificial para analisar estes dados, podemos alargar o âmbito das experiências que podem ser realizadas nas nossas instalações, permitindo aos nossos utilizadores explorar estudos anteriormente considerados demasiado complexos." Em trabalhos futuros, os investigadores planeiam aumentar o número de átomos que o modelo de aprendizagem automática consegue reunir e aplicar o modelo a experiências resolvidas no tempo no LCLS e no XFEL europeu. Isso ajudará os investigadores a reconstruir instantâneos de moléculas em movimento, criando filmes moleculares do tipo flip-book com informações sobre a forma como as reacções químicas se desenrolam.

A equipa está agora também a testar a capacidade do modelo para reconstruir moléculas a partir de dados incompletos. Na maior parte das vezes, o detetor não detecta um ião produzido na explosão de Coulomb. Li quer saber, por exemplo: Será que a IA consegue reconstruir uma molécula de etanol se um ou mais dos seus iões de hidrogénio não forem registados no detetor?

Se estes desafios forem resolvidos, a técnica poderá tornar-se mais aplicável na investigação biológica e química. As proteínas, por exemplo, podem ser constituídas por milhares de átomos. "É esse o objetivo", disse Li. "Poderemos estudar sistemas que sejam mais relevantes do ponto de vista biológico ou industrial".

A equipa também incluiu investigadores do Instituto PULSE de Stanford; da Universidade de Stanford; da Universidade do Estado do Kansas; do Instituto Max Planck de Física Nuclear, Alemanha; do Instituto Fritz Haber, Alemanha; e da Universidade de Sorbonne, França.

Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Inglês pode ser encontrado aqui.

Publicação original

Outras notícias do departamento ciência

Notícias mais lidas

Mais notícias de nossos outros portais