O RMSF e RMSF são duas métricas de comparação entre estruturas sobrepostas bastante utilizadas em Bioinformática Estrutural.
RMSD para comparação de pares de estruturas

mesma proteína que estão sobrepostos.
Fonte: PDB id 2M6Q.
RMSD é a sigla para Root Mean Square Deviation que significa raiz quadrada do desvio quadrático médio. Conforme dissemos, ele deve ser calculado entre estruturas que foram sobrepostas (alinhadas tridimensionalmente) e logo estão em um mesmo sistema de coordenadas (ver exemplo na Figura 1).
Ele normalmente é um número que indica a média para os átomos considerados em uma proteína.
Pode ser calculado apenas considerando os Carbonos-alfa, apenas os átomos do backbone da proteína ou ainda todos os átomos.
Como o nome indica, ele é calculado tomando as diferenças individuais entre as coordenadas x, y, e z de um par de moléculas 1 e 2 que são elevadas ao quadrado (para tornar o sinal sempre positivo), somadas, divididas pelo número total de átomos considerados (n) para tirar uma média e, finalmente, a raiz quadrada é retirada para tirar o efeito da potência de 2.

Note que o RMSD pode ser calculado para qualquer par de moléculas desde que uma equivalência tenha sido estabelecida entre os pares de átomos a partir de uma sobreposição estrutural. Ou seja, pode ser calculado:
- entre diferentes conformeros de uma proteína ou moléculas idênticas em composição
- entre uma proteína modelada por homologia e uma estrutura experimental
- entre proteínas de sequências diferentes que compartilhem um enovelamento similar
Isto é possível pois, com a sobreposição, temos pares de átomos que podem ser considerados “equivalentes” ou pelo menos pareados.
RMSF para análise da flutuação dos átomos ao longo do tempo
RMSF é a sigla para Root Mean Square Fluctuation que significa raiz quadrada da flutuação quadrática média. O RMSF normalmente é calculado para uma mesma proteína para a qual se tem uma simulação da dinâmica ao longo do tempo.
Ele é calculado para cada átomo.
De forma similar ao RMSD, ele é calculado tomando as diferenças individuais entre as coordenadas x, y, e z de um par de moléculas (sendo uma de referência e outra que varia ao longo do tempo) que são elevadas ao quadrado (para tornar o sinal sempre positivo), somadas, divididas pelo número total de intervalos de tempo considerados (t) para tirar uma média e, finalmente, a raiz quadrada é retirada para tirar o efeito da potência de 2.

Note que, apesar de a equação ser similar à equação do RMSD, sua semântica é bem diversa. Enquanto o RMSD é uma métrica do quanto se desviam duas estruturas diferentes, o RMSF é uma métrica (por átomo) que mostra o quanto os trechos de uma mesma proteína oscilam em coordenadas em torno de uma estrutura de referência ao longo do tempo de simulação. Ele é uma métrica de flexibilidade da cadeia.

temos os átomos de uma proteína e no eixo y temos o RMSF.
Normalmente, o RMSF é visualizado em um gráfico de linha como o exibido na Figura 2. No eixo x, apresentamos os quase 1.500 átomos da proteína da Figura 1 e, no eixo y, o RMSF. Note que a flexibilidade dos trechos da cadeia são refletidos em maiores valores de RMSF. Na Figura 1, os trechos em azul escuro são o N-terminal da cadeia (menores números seriais dos átomos) e os trechos em vermelho são o C-terminal, ou seja, os trechos com maiores números atômicos. Note como os trechos em vermelho, mais flexíveis, tem um RMSF bem maior no trecho a esquerda do gráfico. Normalmente os trechos em estruturas secundárias apresentam menor RMSF enquanto os loops apresentam um RMSF maior.
Temos no canal do YouTube do OnlineBioinfo vídeos explicando como se calcula o RMSD e o RMSF:
Esperamos que esse conteúdo seja útil! Deixe sugestões de novos conteúdos nos comentários.
Até breve!
Raquel
Referências
http://www.strodel.info/index_files/lecture/html/analysis-4.html
Olá Raquel gostei muito do seu conteúdo, também sou pesquisador na área de ciência da computação e nanotecnologia. Estou trabalhando num projeto da covid-19 e gostaria de fazer algumas perguntas para você sobre o RMSD, poderia me passar seu email por favor?. Obrigado.
CurtirCurtir
Claro. Raquelcm@dcc.ufmg.br
CurtirCurtir