Home Ciência Uma nova abordagem de IA para design de proteínas

Uma nova abordagem de IA para design de proteínas

10
0
Veja o texto para legenda. Crédito: Alexandra Banbanaste (EPFL)

Veja o texto da legenda.

Pesquisadores um novo modelo orientado por IA projetado para prever sequências de proteínas a partir de andaimes de backbone, incorporando ambientes moleculares complexos. Ele promete avanços significativos em engenharia de proteínas e aplicações em vários campos, incluindo medicina e biotecnologia.

Legenda da imagem: Representação esquemática da predição de sequência com CARBonAra. O transformador geométrico amostra o espaço de sequência da enzima beta-lactamase TEM-1 (em cinza) complexada com um substrato natural (em ciano) para produzir novas enzimas bem dobradas e ativas. Crédito: Alexandra Banbanaste (EPFL)

Projetar proteínas que podem desempenhar funções específicas envolve entender e manipular suas sequências e estruturas. Essa tarefa é crucial para desenvolver tratamentos direcionados para doenças e criar enzimas para aplicações industriais.

Um dos grandes desafios na engenharia de proteínas é projetar proteínas de novo, ou seja, do zero, para adaptar suas propriedades para tarefas específicas. Isso tem implicações profundas para a biologia, medicina e ciência dos materiais. Por exemplo, proteínas projetadas podem atingir doenças com alta precisão, oferecendo uma alternativa competitiva aos medicamentos tradicionais baseados em pequenas moléculas.

Além disso, enzimas personalizadas, que agem como catalisadores naturais, podem facilitar reações raras ou inexistentes na natureza. Essa capacidade é particularmente valiosa na indústria farmacêutica para sintetizar moléculas complexas de medicamentos e na tecnologia ambiental para quebrar poluentes ou plásticos de forma mais eficiente.

Uma equipe de cientistas liderada por Matteo Dal Peraro na EPFL desenvolveu o CARBonAra (Context-aware Amino acid Recovery from Backbone Atoms and heteroatoms), um modelo baseado em IA que pode prever sequências de proteínas, mas levando em conta as restrições impostas por diferentes ambientes moleculares – uma realização única. O CARBonAra é treinado em um conjunto de dados de aproximadamente 370.000 subunidades, com 100.000 adicionais para validação e 70.000 para teste do Protein Data Bank (PDB).

CARBonAra se baseia na arquitetura do framework Protein Structure Transformer (PeSTo) – também desenvolvido por Lucien Krapp no ​​grupo de Dal Peraro. Ele usa transformadores geométricos, que são modelos de aprendizado profundo que processam relações espaciais entre pontos, como coordenadas atômicas, para aprender e prever estruturas complexas.

O CARBonAra pode prever sequências de aminoácidos a partir de andaimes de backbone, as estruturas de moléculas de proteína. No entanto, uma das características de destaque do CARBonAra é sua percepção de contexto, que é especialmente demonstrada em como ele melhora as taxas de recuperação de sequência – a porcentagem de aminoácidos corretos previstos em cada posição em uma sequência de proteína em comparação a uma sequência de referência conhecida.

O CARBonAra melhorou significativamente as taxas de recuperação quando incluiu “contextos” moleculares, como interfaces de proteínas com outras proteínas, ácidos nucleicos, lipídios ou íons. “Isso ocorre porque o modelo é treinado com todos os tipos de moléculas e depende apenas de coordenadas atômicas, de modo que pode lidar não apenas com proteínas”, explica Dal Peraro. Esse recurso, por sua vez, aumenta o poder preditivo e a aplicabilidade do modelo em sistemas biológicos complexos da vida real.

O modelo não tem bom desempenho apenas em benchmarks sintéticos, mas foi validado experimentalmente. Os pesquisadores usaram CARBonAra para projetar novas variantes da enzima TEM-1 –lactamase, que está envolvida no desenvolvimento de resistência antimicrobiana. Algumas das sequências previstas, diferindo em aproximadamente 50% da sequência do tipo selvagem, foram dobradas corretamente e preservam alguma atividade catalítica em altas temperaturas, quando a enzima do tipo selvagem já está inativa.

A flexibilidade e a precisão do CARBonAra abrem novos caminhos para a engenharia de proteínas. Sua capacidade de levar em conta ambientes moleculares complexos o torna uma ferramenta valiosa para projetar proteínas com funções específicas, aprimorando futuras campanhas de descoberta de medicamentos. Além disso, o sucesso do CARBonAra na engenharia de enzimas demonstra seu potencial para aplicações industriais e pesquisa científica.

Referências

Lucien F. Krapp, Fernando A. Meireles, Luciano A. Abriata, Jean Devillard, Sarah Vacle, Maria J. Marcaida, Matteo Dal Peraro. Aprendizado profundo geométrico com reconhecimento de contexto para design de sequência de proteínas. Nature Communications 25 de julho de 2024. DOI: 10.1038/s41467’024 -50571-y

Source