Como identificar sítios de ligação em proteínas?

Figura 1 – Proteína ligada a uma pequena molécula em um bolsão ou sítio de ligação.

Sítios de ligação são conjuntos de resíduos de aminoácidos que estão em bolsões de ligação de moléculas que interagem com proteínas. Esses ligantes podem ser pequenas moléculas, peptídeos ou outras proteínas. Os bolsões são frestas muitas vezes volumosas que recebem os ligantes na superfície das proteínas. Veja um exemplo de uma molécula de aspirina ligada ao sítio de ligação de uma proteína na Figura 1.

Os sítios de ligação tem as mais diversas funções, tendo em vista que as proteínas exercem as mais diversas funções em proteínas e, grande parte delas, por meio da interação com outras moléculas:

  • Catalítica: as enzimas são proteínas que catalisam as mais diversas reações químicas
  • Regulação: proteínas se ligam a hormônios, por exemplo
  • Comunicação: proteínas estão envolvidas em cascatas de sinalização através da interação com diversas moléculas
  • Transporte e armazenamento: proteínas, como a Mioglobina, transportam substâncias como o oxigênio ou as armazenam, como a Ferritina, que armazena o ferro
  • Ligação a grupos prostéticos: que são grupamentos que se ligam a proteínas para permitir que elas realizem suas funções como, por exemplo, o grupo heme das Hemoglobinas que ligam o oxigênio no átomo de ferro
  • Defesa e ataque: seres vivos podem produzir toxinas que são proteínas que se ligam a outras proteínas para defender um organismo ou atacar um hospedeiro
Figura 2 – Exemplo de uma enzima do tipo Tripsina ligada a um inibido proteico (em amarelo) no sítio de ligação (em marrom).

Sítios ativos não são sinônimos de sítios de ligação. Normalmente, os sítios ativos são um conjunto menor de resíduos que faz parte do sítio de ligação. Na Figura 2, ilustramos uma enzima do tipo Tripsina ligada a um inibidor proteico (em amarelo). Note que o sítio de ligação é um conjunto grande de resíduos (em marrom) que compõem uma região que recebe o ligante.

Figura 3 – Em bastões, ilustramos a tríade catalítica da Trispina composta por uma HIS, um ASP e uma SER. Eles estã no sítio de ligação.

Na Figura 3, ilustramos em bastões os três resíduos que compõe o sítio catalítico da enzima. Note que eles estão no sítio de ligação mas são os resíduos que estão diretamente envolvidos na catálise.

Assim, sítio de ligação e sítio ativo são são a mesma coisa.

Por que é importante identificar sítios de ligação?

Temos ainda um volume muito grande de proteínas conhecidas cuja função ainda não foi completamente elucidada. Estima-se que cerca de 22% das entradas do Uniprot sejam ainda DUFs ou Domains of Unkwnown Functions (domínios de função desconhecida). A informação sobre a estrutura de proteínas e os sítios de ligação putativos podem auxiliar muito na elucidação da função da proteína por meio de homologia com outras proteínas de função desconhecida ou da triagem de ligantes que possam interagir nesses sítios.

Como identificar uim sítio de ligação?

Idealmente, todas as proteínas deveriam ser investigadas experimentalmente e ter seus sítios de ligação conhecidos e validados. Entretanto, estudos experimentais podem ser caros e demorados.

Isso faz que com os métodos computacionais sejam considerados uma abordagem promissora para suporte à predição de função e entendimento dos sítios e suas interações.

Existem métodos baseados em sequência, baseados em estrutura e os híbridos. Como a função de proteínas é muito ligada à sua estrutura, os métodos que usam informação estrutural tem se saído melhor.

Com relação os métodos baseados em estruturas, existem abordagens baseadas da detecção de cavidades ou na sobreposição de estruturas para identificação de sítios homólogos em proteínas de função conhecida.

Outra estratégia muito interessante é o uso do enorme volume de dados que já acumulados sobre sequências, estruturas, funções e interações como entrada para a construção de modelos de aprendizado de máquina. Esses modelos buscam padrões capazes de discriminar resíduos que fazem ou não parte de sítios de ligação.

GRaSP

Nosso grupo, em colaboração com o grupo da Profa. Sabrina Silveira (DPI/UFV), participou do desenvolvimento do GRaSP que é um método baseado em grafos de interações químicas e aprendizado de máquina para predizer acuradamente resíduos de sítios de ligação putativos.

O GRaSP utiliza dados sobre propriedades fisico-químicas e topológicas para computar vetores assinatura que servem de entrada para algoritmos de aprendizado supervisionado. Em resumo, são utilizadas as seguintes características:

  • Dados sobre a acessibilidade do resíduo ao solvente
  • Dados sobre as propriedades fisico-químicas dos resíduos como carga, potencial de formação de ligação de hidrogênio, polaridade, entre outros
  • Dados sobre as interações que cada resíduo estabelece com sua vizinhança como ligações de hidrogênio, contatos apolares, pontes salinas, empilhamentos aromáticos, etc.

De posse dos vetores assinatura, o GRaSP constrói um conjunto de modelos e escolhe a classe do resíduo (sítio de ligação ou não) através de uma votação dos vários modelos.

O GRaSP tem acurácia equivalente aos métodos do estado da arte (Santana et al., 2020), é eficiente computacionalmente e não depende de sobreposição estrutural. Além disso, é possível obter uma métrica de confiança de cada previsão e uma lista das características mais importantes para a previsão.

Você pode utilizar gratuitamente a ferramenta disponível em https://grasp.ufv.br/

Figura 4 – Interface web da ferramenta GRaSP disponível em https://grasp.ufv.br/

Se preferir, este conteúdo também está disponível no nosso Canal no YouTube.

Referências

Santana, C. A., Silveira, S. D. A., Moraes, J. P., Izidoro, S. C., de Melo-Minardi, R. C., Ribeiro, A. J., … & Thornton, J. M. (2020). GRaSP: a graph-based residue neighborhood strategy to predict binding sites. Bioinformatics, 36(Supplement_2), i726-i734.

Publicado por OnlineBioinfo Bioinformática

Meu nome é Raquel Minardi, sou bacharel em Ciência da Computação e doutora em Bioinformática. Sou professora do Departamento de Ciência da Computação da UFMG desde 2010, membro afiliado da Academia Brasileira de Ciências (ABC), vice-coordenadora do Programa de Pós-graduação em Bioinformática da UFMG, coordenadora da rede BaBEL de Bioinformática aplicada a Biotecnologia, vice-coordenadora do comitê especial de Biologia Computacional da Sociedade Brasileira de Computação (SBC) e secretaria da diretoria regional centro-sudeste da Associação Brasileira de Bioinformática e Biologia Computacional (AB3C). Sou fascinada pela área de Bioinformática e pela possibilidade de desenvolver modelos e algoritmos para suporte a resolução de problemas tão desafiadores quanto os que envolvem a biologia e biotecnologia. Também amo ensinar e desenvolver conteúdos para ensino a distância.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: