O que são mapas de distância?

Um mapa de distância é uma representação bidimensional (matriz) da estrutura tridimensional de uma proteína. Eles são matrizes quadradas onde o eixo-x representa a sequência de aminoácidos de uma proteína e o eixo-y representa a mesma sequência. Dessa forma, cada célula (x,y) contém um valor real que é a distância euclideana entre o resíduo x e y da sequência proteica. Essa matriz pode ser visualizada como um mapa de calor em que uma escala de cores é utilizada para ilustrar os valores quantitativos dessas distâncias (ver Figura 1).

Figura 1 – Mapa de distâncias de uma Mioglobina. PDB id: 1A6M.
Figura 2 – Estrutura de uma Mioglobina.
PDB id 1A6M.
Figura 3 – As esferas são os carbonos alfa de uma Mioglobina.
PDB id 1A6M.

O mapa de distâncias da Figura 1 é, então, uma representação 2D da estrutura 3D da Mioglobina ilustrada na Figura 2. Neste caso, computamos apenas as distâncias entre os carbonos alfa de cada resíduo de aminoácido, exibidos como esferas na Figura 3.

É interessante notar que os padrões de cores na imagem refletem os trechos distantes da sequência que são trazidos para próximos na estrutura tridimensional. Isso fica representado pelos trechos em roxo que estão distâncias da diagonal. Note, por exemplo, que a região do resíduo 80 está próxima da região do resíduo 130. São regiões distantes que fazem interações químicas não covalentes quando a proteína está enovelada em seu estado tridimensional nativo.

Figura 4 – Explicação dos mapas de contatos.

Defendi minha tese em 2008 mas ainda gosto bastante da figura que aqui reproduzo (Figura 4) e na qual mostro as hélices G e H da Mioglobina em verde e azul respectivamente no mapa e a seta vermelha mostra os contatos entre estas hélices. Veja que são contatos distantes da sequência e que são antiparalelos ou seja, enquanto na hélice G vamos do N ao C terminal da proteína, na hélice H vamos do C ao N terminal. Os mapas de contatos refletem esse empacotamento das estruturas (packing) e é possível reproduzir uma proteína a partir deles.

Figura 5 – Destaque para as alfa-hélices dos mapas de contatos. PDB id 1A6M.

É possível identificar cada estrutura secundária neles. Note que o mapa de contatos é o mapa de distância quando se aplica uma distância de corte (limiar) para plotar os pontos. Digamos, por exemplo, 4,5 angstroms. Na Figura 5, destacamos em vemelho as 8 hélices da mesma Mioglobina. As hélices são formadas principalmente por padrões de ligações de hidrogênio entre resídios distantes de 3-4 resíduos na sequência. Por isso, hélices são vistas como marcações na diagonal dos mapas.

Já as fitas beta são vistas como segmentos de retas que podem ser paralelos ou antiparalelos à diagonal dependendo se são fitas paralelas ou antiparalelas. Note que esses mesmos segmentos podem indicar contatos entre hélices, como mostrado na Figura 4 pela seta em vermelho.

Mioglobina – PDB id 1A6M

Mioglobina é uma proteína toda alfa na qual podemos notar a predominância de hélices pelas 8 marcações na diagonal do mapa de distâncias. A Mioglobina é composta por 8 alfa-hélices.

Tioredoxina – PDB id 1w89

A Tioredoxina é uma proteína alfa-beta, ou seja, mistura alfa-hélices e folhas-beta. É possível notar as 4 pequenas alfa-hélices nas diagonais dos mapas de contados e as fitas-beta pregueadas fazem inúmeros desenhos no restante do mapa.

Apolipoproteína – PDB id 2HZR

Aqui vemos uma Apolipoproteína que é composta por um barril de folhas-beta mais duas pequenas hélices.

Plastocianina – PDB id 3pcy

Por fim, uma pequena Plastocianina composta por um barril beta. Vejam como as estruturas em barril formam quadrados no mapa de distância. Esses quadrados mostram contatos entre fitas paralelas e anti-paralelas.

Em resumo, os mapas tem duas características principais:

  1. Refletem a estrutura de uma proteína contendo as estruturas secundárias e suas interações no espaço tridimensional
  2. São uma assinatura única por tipo de enovelamento, ou seja, cada família estrutural tem um padrão de mapa

Por ter essas características, esses mapas foram recentemente usados pelo Deepmind / Google no método AlphaFold conforme a Figura 6. Em linhas gerais, eles usam redes neurais profundas para prever os mapas de distância a partir de dados de alinhamentos múltiplos de sequências e da base de todas as estruturas tridimensionais resolvidas experimentalmente, entre outros dados. Nesta atividade está grande parte da inovação do método. A seguir, os mapas de distância são usados para reconstrução das coordenadas atômicas através de um método de otimização clássico baseado no gradiente descendente e refinamentos são realizados com base em métodos de minimização de energia.

Figura 6 – Esquema do método AlphaFold. Fonte: https://deepmind.com/research/case-studies/alphafold

Referências

de Melo, Raquel Cardoso. “Classificação estrutural de famílias de proteínas com base em mas de contatos.” (2008). Tese defendida do PPG em BIoinformática da UFMG em 13 de junho de 2008.

Pagina do Alphafold https://deepmind.com/research/case-studies/alphafold

Publicado por OnlineBioinfo Bioinformática

Meu nome é Raquel Minardi, sou bacharel em Ciência da Computação e doutora em Bioinformática. Sou professora do Departamento de Ciência da Computação da UFMG desde 2010, membro afiliado da Academia Brasileira de Ciências (ABC), vice-coordenadora do Programa de Pós-graduação em Bioinformática da UFMG, coordenadora da rede BaBEL de Bioinformática aplicada a Biotecnologia, vice-coordenadora do comitê especial de Biologia Computacional da Sociedade Brasileira de Computação (SBC) e secretaria da diretoria regional centro-sudeste da Associação Brasileira de Bioinformática e Biologia Computacional (AB3C). Sou fascinada pela área de Bioinformática e pela possibilidade de desenvolver modelos e algoritmos para suporte a resolução de problemas tão desafiadores quanto os que envolvem a biologia e biotecnologia. Também amo ensinar e desenvolver conteúdos para ensino a distância.

4 comentários em “O que são mapas de distância?

  1. Oi professora, eu dei uma lida na sua tese de doutorado. Me interessei muito pelo assunto. Eu acho que entendi por alto o problema central abordado, mas me falta muita bagagem de estudos tanto em bioquímica quanto em computação e matemática para entender mais a fundo. Mas o assunto é muito interessante.

    Curtido por 1 pessoa

  2. Obrigado. Eu estou querendo me aprofundar nesses estudos de bioquímica. Também pensei em ler mais sobre tratamento de lixo hospitalar, como fazer com que material infectado pelo coronavirus deixe de representar um risco. Até pensei em me candidatar como voluntário em alguma ONG que trate dessas questões. Talvez eles precisem de alguém que tenha alguns conhecimentos de bioinformatica.

    Curtir

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: