Bioinformática na agricultura

A disponibilidade de enorme volume de dados de sequenciamento de nova geração (NGS do inglês Next Generation Sequencing) de hospedeiros e patógenos em domínio público tem no trazido importantes oportunidades para melhor compreensão das doenças de plantas de forma sistêmica. Com os dados produzidos, é possível identificar e caracterizar elementos funcionais no nível gênico com foco no desenvolvimento biotecnológico.

A Bioinformática nos apoia no entendimento dos processos biológicos em várias frentes desde a análise de padrões nas sequências até a prospecção de moléculas bioativas com objetivos e alvos particulares. Os esforços em Bioinformática incluem o desenvolvimento de bancos de dados, de algoritmos e de ferramentas.

Na agricultura, a Bioinformática tem um importante papel no suporte ao melhoramento genético de plantas. Este visa maior qualidade e quantidade de produção, bem como o desenvolvimento de plantas resistentes a doenças e insetos; tolerantes ao calor, salinidade do solo ou geadas; ou que apresentem tamanho, formatos e tempo de maturação adequados.

Melhoramento genético

Figura 1 – Estudo de plantas em laboratório. Fonte: Canva.

O melhoramento consiste em utilizar princípios da genética na produção de plantas mais úteis ao ser humano tendo em vista aspectos ambientais e econômicos. Ele é feito através do cruzamento de indivíduos selecionados e na seleção sucessiva daqueles com características desejáveis.

Embora o melhoramento seja um estudo milenar, as novas tecnologias de sequenciamento trouxeram um aumento significativo no volume de dados genômicos existente juntamente com uma redução considerável dos custos de geração destes dados.

Informações genômicas podem ser aplicadas no melhoramento genético de espécies vegetais (e animais) de interesse econômico, na prospecção gênica e de ativos biotecnológicos. Ferramentas de Bioinformática que permitem tanto a montagem dos genomas sequenciados de novo (a partir apenas das leituras do sequenciamento) como também pelo alinhamento com outros genomas já conhecidos e usados como referência. Este genomas podem nos auxiliar no entendimento dos mecanismos de patogenicidade bem como no desenvolvimento de testes diagnósticos.

Patologias

Há cinco principais tipos de organismos patogênicos para plantas: vírus, bactérias, fungos, protozoários e vermes/nematóides. Algumas das principais doenças de plantas no Brasil são:

  • Ferrugem asiática, mofo branco e mancha branca na soja
  • Ferrugem polissora, podridão branca da espiga e mancha foliar no milho
  • Mancha angular, mancha ramulária e tombamento de plântulas no algodão
  • entre outras
Figura 2 – Exemplo de folha com ferrugem. Fonte: Canva.

Em (Khan et al, 2021), você pode encontrar tabelas com as principais patologias de plantas associadas ao seu patógeno e também informações sobre os seus genomas sequenciados.

A disponibilidade de dados de NGS de organismos modelo de todos os reinos por métodos de larga escala tem sido bastante convenientes para o enfrentamento de problemas relacionados à saúde de plantas por auxiliarem no entendimento do relacionamento sequência x estrutura x função através de dados e ferramentas computacionais.

Com relação às patologias que afetam as plantas, de modo mais geral, a Bioinformática pode contribuir através das mais diversas técnicas: análises comparativas de sequências, identificação de genes, filogenia, análises de interações proteína-proteína, análises de expressão gênica, modelagem teórica de estruturas proteínas e docking molecular.

Vamos detalhar um pouco mais cada uma dessas frentes em que a Bioinformática pode apoiar as pesquisas relacionadas a doenças em plantas.

Análise de sequências

Através da comparação dos genomas conhecidos, é possível descobrir genes envolvidos em características fenotípicas economicamente importantes. O sequenciamento da Arabidopsis, uma planta modelo, trouxe grande impacto ao campo da biologia de plantas.

Outros métodos de Bioinformática permitem a identificação de polimorfismos do tipo SNP (polimorfismo de nucleotídeo único) e outras variações estruturais como deleções, inserções, rearranjos e variações no número de cópias de trechos do genoma.

Ainda, a análise em profundidade dos transcritomas e dos metagenomas a partir de comunidades microbianas muitas informações úteis podem gerar. Todas estas técnicas necessitam de métodos específicos de análise criados pela Bioinformática.

Filogenia

A filogenia é o estudo dos relacionamentos evolucionários entre grupos de genes homólogos de organismos (espécies ou populações). Estes relacionamentos são inferidos através de métodos estatísticos e computacionais de forma que são centrais no entendimento de relacionamentos evolucionários entre organismos e espécies. São centrais no entendimento de genomas, da diversidade e da ecologia.

Análise dos transcritos

A análise dos transcritomas através de técnicas como o RNA-Seq tem sido utilizada na análise da expressão gênica de várias plantas de importância econômica como arroz, milho, cevada, laranja doce e cana-de-açúcar.

Através das análises de expressão gênica é possível catalogar todos os transcritos identificados:

  • RNAm
  • RNAs não codificantes
  • pequenos RNAs
Figura 3 – Estresse hídrico. Fonte: Canva.

e conhecer os elementos funcionais de um genoma e os constituintes moleculares de células e tecidos particulares. No caso dos estudos em plantas, é possível, por exemplo, identificar vias biológicas alteradas em situações específicas como a infecção por um patógeno, a infestação por um parasita, a restrição hídrica entre outros tipos de estresses.

Por exemplo, pesquisadores aplicaram a tecnologia de RNA-Seq a 6 genótipos de cana-de-açúcar com diferentes teores de sacarose e identificaram SNPs exclusivos de cada que possuem associações com essa característica de interesse econômico (quantidade do açúcar). Veja que é possível buscar por marcadores capazes de indicar o aumento de produtividade, a resistência a doenças e pragas, a tolerância à seca e a melhoria geral da qualidade dos produtos.

Metagenômica

A utilização de tecnologias de NGS tem possibilitado também o conhecimento da composição de comunidades microbianas atraves da metagenômica. Esta tem se mostrado mais eficiente que outros métodos culturais por permitir a identificação de cepas, a caracterização e o monitoramento da dinâmica de comunidades microbianas, permitindo inferir o papel de cada gene na comunidade. É possível, por exemplo, inferir genes e compostos com papel inseticida e genes de resistência a herbicidas para utilização como controle de pragas.

O estudo de comunidades microbianas no solo tem grande potencial para a agricultura visto que os microorganismos deste tem um papel crítico na sua fertilidade, na saúde das plantas, na ciclagem de carbono e nitrogênio, entre outros nutrientes.

Figura 4 – Estudos de metagenômica de solo tem grande potencial no entendimento da saúde das plantas. Fonte: Canva.

Dessa forma, o melhoramento genético pode se utilizar de todas essas técnicas experimentais na geração de dados e as técnicas computacionais na análise destes dados. Esta abordagem sinérgica exige, não apenas infra-estrutura adequada, como especialistas em diversos ramos de conhecimento como biologia molecular, agronomia, estatística e ciência da computação, entre outras.

Estudos de associação genômica ampla

Outro tipo de estudo possibilitado pela Bioinformática são os de associação genômica ampla (GWAS, do inglês Genome Wide Association Studies) que buscam correlações entre genótipo e fenótipo, identificando padrões de polimorfismo que variam sistemicamente em indivíduos com diferentes valores de expressão de um determinado fenótipo.

Análise de interações proteína-proteína

Interações proteína-proteína são contatos fisicos entre duas ou mais macromoléculas com grande especificidade baseadas em eventos bioquímicos direcionados pelo efeito hidrofóbico e por forças eletrostáticas. Ser capaz de prever, modelar e analisar as interações entre proteínas do hospedeiro e do patógeno em nível atômico é essencial para o entendimento do mecanismo de patogenicidade bem como para desenvolver estratégias para tratamentos. Métodos de Bioinformática estrutural podem ser utilizados na previsão de interações entre pares de proteínas com razoável acurácia atualmente.

Modelagem de estruturas de proteínas

Muitas proteínas de organismos modelo tem suas estruturas resolvidas e disponíveis publicamente no Protein Data Bank (PDB). Outras, entretanto, precisam ser modeladas por homologia se for necessário entender sua função e interações com outras moléculas. Felizmente, avanços significativos tem sido alcançados na área de modelagem comparativa e mesmo ab initio (quando não se conhece a estrutura de uma proteína similar por vias experimentais).

Estes avanços tem se utilizado de redes de aprendizado profundo e conseguem resolver proteínas com acurácia comparável aos métodos experimentais, em alguns casos. Veja nosso post recente sobre o método AlphaFold. Tendo um modelo mesmo que teórico da estrutura de alvos importantes da planta e / ou do patógeno, inúmeras outras inferências e análises podem ser realizadas como por exemplo a análises de conservação de domínios / motivos estruturais, a predição de sítios de ligação e / ou sítios ativos e mesmo a triagem virtual por compostos ou proteínas que possam interagir com a poteína alvo.

Docking e triagem virtual

O docking computacional é a predição ou modelagem de estrutras trimensionais de um complexo biomolecular estável, partindo de estruturas das moléculas individuais em seu estado livre e não ligado.

Fazer docking ou ancoragem/atracamento molecular significa prever a orientação de duas moléculas em uma forma ligada a partir das propriedades do ligante e do receptor.

O conhecimento do sítio ativo pode ser muito útil neste processo facilitando a previsão da força de ligação e afinidade entre as moléculas receptora e ligante.

Figura 5 – Uso de pesticidas. Fonte: Canva.

Os métodos de docking molecular são proeminentes no desenvolvimento de fármacos e na triagem virtual baseados em estrutura e são essenciais no desenvolvimento de novos:

  • Pesticidas
  • Herbicidas
  • Inseticidas
  • Fungicidas

O uso de dados genômicos com o suporte de métodos de Bioinformática tem se demonstrado estratégicos no melhoramento genético de cultivares para a agricultura sustentável e segurança alimentar no Brasil e do mundo, bem como na contribuição com o o setor agrícola e a manutenção da excelência em pesquisa agrícola nacional. O sequenciamento de genomas, montagem, anotação, métodos de análise e comparação de sequências, análise de variantes, análises de expressão gênica, predição das estruturas das proteínas, análise e classificação destas estruturas, identificação de epitopos, identificação de sítios de ligação e sítios ativos e desenvolvimento de compostos, entre outras atividades, tem sido essenciais no entendimento do relacionamento sequência x estrutura x função. Técnicas in silico serão cada vez mais úteis no estudo de plantas e suas patologias com o crescente volume de dados disponíveis e especialemente o desenvolvimento de técnicas de inteligência artificial.

Referências

GIACHETTO, Poliana Fernanda; HIGA, Roberto Hiroshi. Bioinformática aplicada à agricultura. Embrapa Informática Agropecuária-Capítulo em livro científico (ALICE), 2014.

KAMOUN, Sophien; TALBOT, Nicholas J.; ISLAM, M. Tofazzal. Plant health emergencies demand open science: Tackling a cereal killer on the run. PLoS biology, v. 17, n. 6, p. e3000302, 2019.

KHAN, Aamir; SINGH, Sakshi; SINGH, Vinay Kumar. Bioinformatics in Plant Pathology. In: Emerging Trends in Plant Pathology. Springer, Singapore, 2021. p. 725-844.APA

Publicado por OnlineBioinfo Bioinformática

Meu nome é Raquel Minardi, sou bacharel em Ciência da Computação e doutora em Bioinformática. Sou professora do Departamento de Ciência da Computação da UFMG desde 2010, membro afiliado da Academia Brasileira de Ciências (ABC), vice-coordenadora do Programa de Pós-graduação em Bioinformática da UFMG, coordenadora da rede BaBEL de Bioinformática aplicada a Biotecnologia, vice-coordenadora do comitê especial de Biologia Computacional da Sociedade Brasileira de Computação (SBC) e secretaria da diretoria regional centro-sudeste da Associação Brasileira de Bioinformática e Biologia Computacional (AB3C). Sou fascinada pela área de Bioinformática e pela possibilidade de desenvolver modelos e algoritmos para suporte a resolução de problemas tão desafiadores quanto os que envolvem a biologia e biotecnologia. Também amo ensinar e desenvolver conteúdos para ensino a distância.

Um comentário em “Bioinformática na agricultura

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: