Previsão mais rápida e fiável da estrutura cristalina de moléculas orgânicas
Anúncios
A previsão de estruturas cristalinas de moléculas orgânicas é uma tarefa crítica em muitas indústrias, especialmente na farmacêutica e na conceção de materiais funcionais. Nos produtos farmacêuticos, as estruturas cristalinas influenciam diretamente a solubilidade e a estabilidade de um medicamento. Nos materiais funcionais, como os semicondutores orgânicos, o controlo das estruturas cristalinas é crucial para obter as propriedades electrónicas desejadas. No entanto, a previsão da estrutura cristalina (CSP) é uma tarefa inerentemente difícil devido às fracas e diversas interações intra- e inter-moleculares exclusivas dos cristais orgânicos. Mesmo pequenas variações podem resultar em arranjos de empacotamento totalmente diferentes.
A CSP é normalmente efectuada em duas fases: exploração da estrutura e relaxamento da estrutura. Na primeira fase, é gerado um grande número de estruturas potenciais, frequentemente de forma aleatória, para as quais foram desenvolvidos vários algoritmos de pesquisa. Durante o relaxamento da estrutura, essas estruturas são refinadas para identificar as configurações mais estáveis usando a minimização de energia. No entanto, a geração aleatória de estruturas produz frequentemente várias estruturas de baixa densidade e instáveis, enquanto os métodos convencionais baseados na teoria do funcional da densidade (DFT) para o relaxamento da estrutura são computacionalmente dispendiosos e demorados.
Para fazer face a estes desafios, o Professor Associado Takuya Taniguchi do Centro de Ciência de Dados e Ryo Fukasawa da Escola Superior de Ciências e Engenharia Avançadas da Universidade de Waseda, no Japão, desenvolveram um fluxo de trabalho CSP inovador baseado na aprendizagem automática (ML), designado SPaDe-CSP, que utiliza preditores de grupo espacial (SP) e de densidade de empacotamento (PD). "O nosso fluxo de trabalho emprega uma estratégia única em que os modelos de aprendizagem automática prevêem primeiro os grupos espaciais e as densidades cristalinas mais prováveis, filtrando os candidatos instáveis e de baixa densidade antes dos passos de relaxamento computacionalmente intensivos", explica Taniguchi. "Juntamente com um potencial de rede neural eficiente para o relaxamento da estrutura, este método permite um caminho mais direto e fiável para identificar as disposições cristalinas observadas experimentalmente. "O seu estudo foi publicado na revista Digital Discovery em 13 de outubro de 2025.
O SPaDe-CSP reduz o espaço de pesquisa para cristais orgânicos, prevendo primeiro os prováveis candidatos a grupos espaciais e densidades de cristal usando modelos de ML. Para treino e teste, os investigadores extraíram um conjunto de dados da Base de Dados Estrutural de Cambridge (CSD), que consiste em 32 candidatos a grupos espaciais com 169 656 entradas de dados. Ambos os modelos de previsão utilizaram MACCSKeys como impressão digital molecular e LightGBM como função de previsão. Os investigadores também interpretaram os modelos treinados utilizando a análise de explicações aditivas de Shapley (SHAP) para identificar as caraterísticas estruturais mais importantes para previsões eficazes.
Após a amostragem da rede, as estruturas não relaxadas geradas são então submetidas ao relaxamento da estrutura usando um potencial de rede neural eficiente (NNP) pré-treinado em dados DFT, produzindo finalmente o diagrama de densidade de energia da molécula alvo. Dois hiperparâmetros controlam o processo SPaDe-CSP: o limiar de probabilidade para filtrar os grupos espaciais e a janela de tolerância para a densidade cristalina.
Os investigadores testaram o fluxo de trabalho primeiro numa molécula modelo do conjunto de dados CSD para investigar a dependência da taxa de sucesso dos hiperparâmetros e depois em 20 moléculas orgânicas diferentes, incluindo a molécula modelo, para testar a generalização. Os resultados foram validados com sucesso em relação às estruturas cristalinas experimentais conhecidas das moléculas, e também comparados com os resultados obtidos com o PSC aleatório convencional.
Os resultados revelaram que a probabilidade de sucesso aumenta com um limiar de grupo espacial mais elevado e uma janela de tolerância de densidade mais pequena. Para 80% dos compostos testados, a SPaDe-CSP previu com sucesso as estruturas cristalinas experimentais, alcançando o dobro da taxa de sucesso da CSP aleatória. Em particular, os investigadores também identificaram um descritor estrutural chave que se correlaciona linearmente com a taxa de sucesso, indicando influências estruturais ao nível do cristal e da molécula.
"A nossa estratégia pode acelerar significativamente a conceção e a descoberta de novas moléculas nas indústrias farmacêutica e de ciência dos materiais", afirma Taniguchi. "Isto permitirá uma identificação mais rápida e fiável da forma física mais estável e eficaz de um novo fármaco, importante para manter a solubilidade, o prazo de validade e a eficácia global, e permitirá o rastreio computacional de novos materiais funcionais com propriedades electrónicas óptimas".
Ao tornar a CSP mais rápida e mais fiável, esta investigação marca um passo importante para acelerar a descoberta de medicamentos que salvam vidas e de tecnologias da próxima geração.
Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Inglês pode ser encontrado aqui.