Bioinformática forense

Na década de 70, os moradores da cidade de Sacramento, na Califórnia, foram aterrorizados por um criminoso que invadia casas e roubava e violentava as moradoras [1]. Ele ficou conhecido como o estuprador da área leste. No início da década de 80, o mesmo criminoso matou, no sul do mesmo estado, pelo menos nove pessoas em um intervalo de dois anos. Na ocasião, foi chamado de o perseguidor noturno. Posteriormente, soube-se que se tratava do mesmo criminoso que ficou conhecido como o assassino da Califórnia (The Golden State Killer).

Ele era um ex-policial e sabia como não deixar pistas. Usava luvas e não deixava digitais, mas seu esperma foi preservado. Entretanto, seu material genético não foi encontrado na base de dados de criminosos dos Estados Unidos. Por mais de 40 anos, o criminoso não foi identificado.

Até que o FBI procurou Barbara Rae-Venter, uma genealogista genética [3]. Na verdade, Barbara se aposentou como advogada de patentes. Mas, era formada em Biologia e doutora em genética e, como hobby, após a aposentadoria, começou a estudar sua genealogia para ajudar um membro de sua família a encontrar sua família biológica. Ah! E sim, ela foi casada e tem um filho com o famoso Craig Venter, nome central no sequenciamento no projeto genoma humano. Mas voltando ao assunto, Barbara tinha experiência em ajudar pessoas adotadas e localizar os pais biológicos.

Ela o fazia com o apoio de uma plataforma chamada GEDmatch através da qual se pode comparar trechos de DNA de pessoas que permitem o uso público de seu genoma. Essa plataforma é usada por várias empresas que prestam serviços de testes de ancestralidade. Basicamente, um indivíduo paga por um serviço de sequenciamento de seu DNA, envia os seus arquivos com os dados do seu código genético para a plataforma e obtém relatórios com várias informações resultantes da comparação de seu DNA com o de outras pessoas.

Imagine descobrir que você tem um familiar que é um criminoso procurado há décadas! A pesquisadora Barbara Rae-Venter enviou o DNA do criminoso para o GEDmatch e encontrou pessoas com o DNA tão semelhante que poderiam ser primos de terceiro ou quarto grau do assassino. Ela então criou árvores genealógicas usando dados públicos (de cartórios) e encontrou um ancestral comum entre todos eles. Apenas nove descendentes deste ancestral tinham vivido na Califórnia e um dos alelos do assassino indicava que ele tinha olhos claros. Apenas Joseph DeAngelo tinha esse fenótipo. Ele foi preso e condenado por 13 assassinatos e 50 estupros. Este foi o primeiro caso de grande repercussão que ocorreu em 2018 mas diversos outros casos tem sido relatados.

O DNA e as variantes

Os seres humanos compartilham 99,9% do DNA com outros seres humanos. A diferença entre duas pessoas está justamente nesse 0,01% que os difere e esse pequeno percentual ainda tem muitas bases de nucleotídeos. Existem trechos chamados STRs (de Short Tandem Repeats) que variam bastante de uma pessoa para outra. Usando um conjunto de 20 STRs, as chances de que dois indivíduos tenham perfis parecidos é de 1/1.000.000.000.000. Eles são usados nos testes de paternidade e também na bioinformática forense.

O problema é que usando este tipo de dados não se resolve todos os problemas, mas apenas aqueles em que o criminoso já cometeu um crime e se encontra na base de dados. Isso não ocorreu com o assassino da Califórnia. Apenas por curiosidade, nos EUA há uma base de DNAs de 19 milhões de pessoas e no Brasil, apenas 127 mil.

Acontece que existe um outro tipo de variante chamada SNP (polimorfirmos de nucletídeo único) que são letras únicas que variam de uma pessoa para outra. Os cientistas já mapearam inúmeros pontos do genoma onde essas variações acontecem. Os testes de DNA avaliam 700 mil posições aproximadamente. E o mais interessante é que é possível inferir o grau de parentesco através dessas análises. Se metade de seu DNA vem do seu pai e metade de sua mãe, você deve compartilhar cerca de:

  • 50% dos SNPs com seus irmãos
  • 25% com seus tios
  • 12,5% com seu tio-avô e primos de primeiro grau

E é assim que a genealogia genética pode ajudar a identificar criminosos que não são reincidentes e para os quais não se tem dados. É possível identificá-los através de dados genéticos de seus parentes.

Probabilidades

No caso do assassino da Califórnia, a pessoa com o maior match compartilhava cerca de o,8% dos SNPs. Normalmente, são necessários pelo menos dois matches de qualidade para se fazer uma triangulação e se chegar ao suspeito em poucas horas.

Um outro caso emblemático foi o do criminoso William Talbot II. Ele passou 30 anos impune pelo assassinato de um casal no Canadá. Seu material genético extraído de uma luva deixada por ele foi usado para localizar dois matches: um com 3,12% e outro com 4,06% de SNPs em comum. Pela árvore genealógica reconstruída com dados de cartórios, tratava-se de duas famílias diferentes. Foi localizado então um casamento que uniu essas famílias e um dos descendentes dessa união era o assassino: e só havia um descendente nesse caso!

Perspectivas

Estima-se que com dados genéticos de 2% da população seja possível encontrar primos de segundo grau para 99% da população [2]. Cerca de 28 milhões de norte-americanos já fizeram testes de ancestralidade e, no Brasil, esse número ainda é mais modesto: 100 mil brasileiros testados. Ainda há muito o que caminhar e também questões éticas importantes a serem discutidas mas a tecnologia já está disponível para uso forense.

Referências

[1] Como o FBI usa árvores genealógicas para prender criminosos. Revista Superinteressante, fevereiro de 2022. https://super.abril.com.br/ciencia/como-o-fbi-usa-arvores-genealogicas-para-prender-criminosos/

[2] Erlich, Yaniv, et al. “Identity inference of genomic data using long-range familial searches.” Science 362.6415 (2018): 690-694.

[3] Maher, Brendan. Nature’s 10 Ten people who mattered this year DNA Detective. Nature, v. 564, n. 7736, p. 332-332, 2018.

Publicado por OnlineBioinfo Bioinformática

Meu nome é Raquel Minardi, sou bacharel em Ciência da Computação e doutora em Bioinformática. Sou professora do Departamento de Ciência da Computação da UFMG desde 2010, membro afiliado da Academia Brasileira de Ciências (ABC), vice-coordenadora do Programa de Pós-graduação em Bioinformática da UFMG, coordenadora da rede BaBEL de Bioinformática aplicada a Biotecnologia, vice-coordenadora do comitê especial de Biologia Computacional da Sociedade Brasileira de Computação (SBC) e secretaria da diretoria regional centro-sudeste da Associação Brasileira de Bioinformática e Biologia Computacional (AB3C). Sou fascinada pela área de Bioinformática e pela possibilidade de desenvolver modelos e algoritmos para suporte a resolução de problemas tão desafiadores quanto os que envolvem a biologia e biotecnologia. Também amo ensinar e desenvolver conteúdos para ensino a distância.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: