RMSD e RMSF

O RMSF e RMSF são duas métricas de comparação entre estruturas sobrepostas bastante utilizadas em Bioinformática Estrutural.

RMSD para comparação de pares de estruturas

Figura 1 – Exemplo de vários modelos de uma
mesma proteína que estão sobrepostos.
Fonte: PDB id 2M6Q.

RMSD é a sigla para Root Mean Square Deviation que significa raiz quadrada do desvio quadrático médio. Conforme dissemos, ele deve ser calculado entre estruturas que foram sobrepostas (alinhadas tridimensionalmente) e logo estão em um mesmo sistema de coordenadas (ver exemplo na Figura 1).

Ele normalmente é um número que indica a média para os átomos considerados em uma proteína.

Pode ser calculado apenas considerando os Carbonos-alfa, apenas os átomos do backbone da proteína ou ainda todos os átomos.

Como o nome indica, ele é calculado tomando as diferenças individuais entre as coordenadas x, y, e z de um par de moléculas 1 e 2 que são elevadas ao quadrado (para tornar o sinal sempre positivo), somadas, divididas pelo número total de átomos considerados (n) para tirar uma média e, finalmente, a raiz quadrada é retirada para tirar o efeito da potência de 2.

Equação 1 – Raiz do desvio quadrático médio – RMSD

Note que o RMSD pode ser calculado para qualquer par de moléculas desde que uma equivalência tenha sido estabelecida entre os pares de átomos a partir de uma sobreposição estrutural. Ou seja, pode ser calculado:

  • entre diferentes conformeros de uma proteína ou moléculas idênticas em composição
  • entre uma proteína modelada por homologia e uma estrutura experimental
  • entre proteínas de sequências diferentes que compartilhem um enovelamento similar

Isto é possível pois, com a sobreposição, temos pares de átomos que podem ser considerados “equivalentes” ou pelo menos pareados.

RMSF para análise da flutuação dos átomos ao longo do tempo

RMSF é a sigla para Root Mean Square Fluctuation que significa raiz quadrada da flutuação quadrática média. O RMSF normalmente é calculado para uma mesma proteína para a qual se tem uma simulação da dinâmica ao longo do tempo.

Ele é calculado para cada átomo.

De forma similar ao RMSD, ele é calculado tomando as diferenças individuais entre as coordenadas x, y, e z de um par de moléculas (sendo uma de referência e outra que varia ao longo do tempo) que são elevadas ao quadrado (para tornar o sinal sempre positivo), somadas, divididas pelo número total de intervalos de tempo considerados (t) para tirar uma média e, finalmente, a raiz quadrada é retirada para tirar o efeito da potência de 2.

Equação 2 – Raiz da flutuação quadrática média – RMSF

Note que, apesar de a equação ser similar à equação do RMSD, sua semântica é bem diversa. Enquanto o RMSD é uma métrica do quanto se desviam duas estruturas diferentes, o RMSF é uma métrica (por átomo) que mostra o quanto os trechos de uma mesma proteína oscilam em coordenadas em torno de uma estrutura de referência ao longo do tempo de simulação. Ele é uma métrica de flexibilidade da cadeia.

Figura 2 – Gráfico do RMSF de uma proteína. No eixo x
temos os átomos de uma proteína e no eixo y temos o RMSF.

Normalmente, o RMSF é visualizado em um gráfico de linha como o exibido na Figura 2. No eixo x, apresentamos os quase 1.500 átomos da proteína da Figura 1 e, no eixo y, o RMSF. Note que a flexibilidade dos trechos da cadeia são refletidos em maiores valores de RMSF. Na Figura 1, os trechos em azul escuro são o N-terminal da cadeia (menores números seriais dos átomos) e os trechos em vermelho são o C-terminal, ou seja, os trechos com maiores números atômicos. Note como os trechos em vermelho, mais flexíveis, tem um RMSF bem maior no trecho a esquerda do gráfico. Normalmente os trechos em estruturas secundárias apresentam menor RMSF enquanto os loops apresentam um RMSF maior.

Temos no canal do YouTube do OnlineBioinfo vídeos explicando como se calcula o RMSD e o RMSF:

Vídeo sobre o RMSD
Vídeo sobre o RMSF

Esperamos que esse conteúdo seja útil! Deixe sugestões de novos conteúdos nos comentários.

Até breve!

Raquel

Referências

http://www.strodel.info/index_files/lecture/html/analysis-4.html

Publicado por OnlineBioinfo Bioinformática

Meu nome é Raquel Minardi, sou bacharel em Ciência da Computação e doutora em Bioinformática. Sou professora do Departamento de Ciência da Computação da UFMG desde 2010, membro afiliado da Academia Brasileira de Ciências (ABC), vice-coordenadora do Programa de Pós-graduação em Bioinformática da UFMG, coordenadora da rede BaBEL de Bioinformática aplicada a Biotecnologia, vice-coordenadora do comitê especial de Biologia Computacional da Sociedade Brasileira de Computação (SBC) e secretaria da diretoria regional centro-sudeste da Associação Brasileira de Bioinformática e Biologia Computacional (AB3C). Sou fascinada pela área de Bioinformática e pela possibilidade de desenvolver modelos e algoritmos para suporte a resolução de problemas tão desafiadores quanto os que envolvem a biologia e biotecnologia. Também amo ensinar e desenvolver conteúdos para ensino a distância.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: