O AlphaFold e o desenvolvimento de vacinas

Desenvolvimento de vacinas assistido pela estrutura de proteínas

Figura 1 – Enfermeira aspira para a seringa o conteúdo da ampola da vacina Covid-19. Fonte: Banco de imagens digitais da Fundação Oswaldo Cruz.

Em um vídeo anterior no canal do YouTube do OnlineBioinfo, falamos sobre o desenvolvimento de vacinas e a Bioinformática. Nesse video, focamos no uso de técnicas de aprendizado de máquina para a identificação de epitopos, que são pequenas porções antigênicas do patógeno. Ou seja, trechos das proteínas que desencadeiam resposta imune em nosso organismo. Falamos que existem vacinas construídas com a técnica de múltiplos epitopos e que a Bioinformática Estrutural pode ser usada para modelar as proteínas multi-epitopos e simular o docking delas com proteinas alvo humanas. Vejam mais detalhes lá.

Figura 1 – Proteína Spike do SARS-CoV-2 em estado pré-fusão. Fonte: Protein Data Bank.

Neste texto, vamos focar no desenvolvimento de vacinas com base em dados de estruturas de proteínas. Segundo (Higgins, 2021), o desenvolvimento de vacinas baseado em estrutura é muito comum e foi usado no desenvolvimento de vacinas para COVID-19. As vacinas seriam mais eficazes se se baseassem na proteína Spike em seu estádo pré-fusão (Figura 1), uma conformação em que ela não se fundiu ainda com a membrana da célula humana. A Pfizer-BioNTech e a Moderna buscaram introduzir mutações que estabilizassem a proteína Spike no estado pré-fusão.

Figura 2 – Proteína Spike do SARS-CoV-2 em estado pós-fusão. Fonte: Protein Data Bank.

Algumas possibilidades de mutações na estrutura da proteína que podem fazer com que a Spike se estabilize no estado pré-fusão (Figura 1) e não passe para o estado pós-fusão (Figura 2) são:

  • Adição de resíduos de cisteína para induzir a formação de ligações dissulfeto que poderiam dificultar a ampla mudanã conformacional necessária.
  • Inclusão de resíduos hidrofóbicos em vazios no núcleo da proteína. Essa estratégia foi capaz de aumentar em 10x a neutralização.
  • Inclusão de resíduos de prolina em regiões de terminação de hélices. A prolina é um aminoácido cuja cadeia lateral se dobra e se liga a cadeia principal e tem pouca liberdade conformacional, de modo que não é provável sua ocorrência em alfa-hélices. De fato, elas são conhecidas como resíduos terminadores de hélices. A proteína Spike tem uma região de loops que forma hélices em seu estado pós-fusão (Figura 2). Essa abordagem usado pela Pfizer, Moderna, Novavax e Johnson levaram a um aumento de 50x na neutralização.
  • Inclusão de pontes salinas que são interações eletrostáticas fortes.

AlphaFold

O CASP14 (Critical Assessment of Protein Structure Prediction) relatou que o método AlphaFold produz modelos com GDTs (Global Distance Scores) acima de 90 (em 100) para cerca de 2/3 das proteínas modeladas. É uma acurácia equiparada a de modelos experimentais.

A grande maioria das proteínas do SARS-CoV-2 foi resolvida experimentalmente, mas algumas tiveram que ser modeladas de forma teórica computacionalmente. Inclusive complexos também foram modelados quando não se conseguia resolver a estrutura do complexo. As proteínas também foram modeladas quando não foi possível resolver experimentalmente a proteína inteira. O AlphaFold foi usado nesse processo para modelar duas delas (Higgins, 2021).

Considerando que o AlphaFold alcança uma grande acurácia na construção de seus modelos e que esses modelos podem apoiar no desenvolvimento de vacinas para o SARS-CoV-2 (e outros patógenos com menor cobertura de dado estruturais), até que ponto o AlphaFold poderia alavancar o desenvolvimento de vacinas?

Problemas em aberto

O método da DeepMind trouxe importantes avanços no estado-da-arte da modelagem comparativa mas ainda apresenta algumas limitações importantes que devem são interessantes problemas de pesquisa:

Figura 3 – A proteína Spike ligada às moléculas de acúcares como exemplo de modificações pós-traducioais.
  1. Incapacidade de lidar com mudanças conformacionais. O método não se propõe a lidar com a flexibilidade das proteínas. Grande parte das proteínas, como é o caso da proteína Spike discutida acima, realiza sua função sofrendo grandes mudanças conformacionais. Essas mudanças podem ocorrer pela interação com outras moléculas, ou mesmo por mudanças no seu ambiente.
  2. Ignora as modificações pós-traducionais. Após a tradução, proteínas passam por algumas modificações que também são essenciais para sua função. A glicosilação, que é a ligação de moléculas de açúcar, é um exemplo importante. A mesma proteína Spike é uma glicoproteína, coberta por dezenas de moléculas de açúcar (Figura 3).
  3. Não lida com as interações com outras moléculas. De fato, o AlphaFold é um método que se propõe a realizar a modelagem da molécula e, como diversos outros métodos com o mesmo fim, não adicionam ligantes como receptores (outras proteínas), anticorpos, DNA, pequenas moléculas e íons. Para tal, é necesário usar outros métodos da Bioinformática Estrutural.
  4. Incapacidade de modelar mutações. De fato, uma das limitações do método é que ele não foi projetado para avaliar o impacto de mutações na estrutura de uma proteína. Mutações podem representar pequenas mudanças locais ou podem gerar grandes mudanças conformacionais. Pela forma como o modelo é construído, não se espera que duas sequências com pequenas diferenças de aminoácidos gerem estruturas muito diferentes. É provável que elas gerem modelos bem próximos mesmo que certa mutação provoque grandes mudanças conformacionais. Para avaliar computacionalmente esse tipo de modificação, o mais indicado seria realizar simulações da dinâmica molecular.
  5. Lidar com covariação de resíduos proteínas em complexos. Aí está outra tarefa para a qual o AlphaFold definitivamente não foi projetado mas que impacta o desenvolvimento de vacinas. A experiência da pandemia de COVID-19 nos mostra que provavelmente as vacinas terão que evoluir conforme as proteínas virais vão sofrendo mutações. Seria muito desejável que os métodos de modelagem conseguissem modelar os complexos considerando o impacto das covariações de aminoácidos na superfície de ligação entre eles.

Enfim, o AlphaFold e o uso de redes neurais profundas se mostrou muito promissor na solução de problemas em aberto na ciência. A disponibilidade de dados de qualidade sobre centenas de milhares de estruturas de proteínas faz com que essa nova ferramenta abra muitas perspectivas científicas e tecnológicas.

Entretanto, há muitos problemas a serem resolvidos. Estes cinco problemas discutidos acima serão certamente problemas de pesquisa bastante relevantes na Bioinformática Estrutural nos próximos anos.

Referências

Higgins, Matthew K. Can we AlphaFold our way out of the next pandemic?. Journal of Molecular Biology, v. 433, n. 20, p. 167093, 2021.

SWISS-MODEL – Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) -https://swissmodel.expasy.org/repository/species/2697049

Publicado por OnlineBioinfo Bioinformática

Meu nome é Raquel Minardi, sou bacharel em Ciência da Computação e doutora em Bioinformática. Sou professora do Departamento de Ciência da Computação da UFMG desde 2010, membro afiliado da Academia Brasileira de Ciências (ABC), vice-coordenadora do Programa de Pós-graduação em Bioinformática da UFMG, coordenadora da rede BaBEL de Bioinformática aplicada a Biotecnologia, vice-coordenadora do comitê especial de Biologia Computacional da Sociedade Brasileira de Computação (SBC) e secretaria da diretoria regional centro-sudeste da Associação Brasileira de Bioinformática e Biologia Computacional (AB3C). Sou fascinada pela área de Bioinformática e pela possibilidade de desenvolver modelos e algoritmos para suporte a resolução de problemas tão desafiadores quanto os que envolvem a biologia e biotecnologia. Também amo ensinar e desenvolver conteúdos para ensino a distância.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: