Ferramenta desenvolvida por pesquisadores da USP pode ser útil no estudo de mecanismos de doenças e da fisiologia de plantas ou na análise estrutural de metrópoles como São Paulo, entre outras aplicações (interação entre três redes construídas com dados metabolômicos da cana-de-açúcar / imagem: divulgação)
Ferramenta desenvolvida por pesquisadores da USP pode ser útil no estudo de mecanismos de doenças e da fisiologia de plantas ou na análise estrutural de metrópoles como São Paulo, entre outras aplicações
Ferramenta desenvolvida por pesquisadores da USP pode ser útil no estudo de mecanismos de doenças e da fisiologia de plantas ou na análise estrutural de metrópoles como São Paulo, entre outras aplicações
Ferramenta desenvolvida por pesquisadores da USP pode ser útil no estudo de mecanismos de doenças e da fisiologia de plantas ou na análise estrutural de metrópoles como São Paulo, entre outras aplicações (interação entre três redes construídas com dados metabolômicos da cana-de-açúcar / imagem: divulgação)
Karina Toledo | Agência FAPESP – Uma das estratégias usadas para estudar o funcionamento de um sistema biológico – seja uma simples célula, o conjunto de órgãos que forma um organismo ou mesmo um grupo de espécies de um ecossistema – é representá-lo sob a forma de uma rede complexa, composta por diversas variáveis interligadas entre si.
Desse modo é possível comparar, por exemplo, um tecido sadio e um doente, descobrir o que há de diferente nessas duas redes e em quais variáveis é recomendável intervir para restabelecer o equilíbrio do sistema.
Mas essa comparação requer ferramentas computacionais capazes de avaliar simultaneamente milhões de dados, em geral obtidos por meio de análises genômicas (sequenciamento dos genes), transcritômicas (como esses genes estão se expressando), proteômicas (identificar e quantificar as proteínas resultantes da expressão gênica) e metabolômicas (identificar e quantificar os metabólitos resultantes dos processos celulares).
Por meio de um projeto apoiado pela FAPESP e pela Microsoft Research, pesquisadores da Universidade de São Paulo (USP) desenvolveram um novo software – chamado BioNetStat – que permite analisar mais de duas redes complexas ao mesmo tempo e determinar, assim, padrões de relevância biológica.
A ferramenta, segundo os autores, pode ter aplicações variadas e que vão muito além das Ciências Biológicas. Entre os exemplos estão o estudo do mecanismo de doenças, da fisiologia de plantas e também a análise estrutural de metrópoles como São Paulo com base em dados censitários.
O trabalho, desenvolvido por cientistas do Instituto de Biociências (IB-USP) e do Instituto de Matemática e Estatística (IME-USP), foi descrito em artigo publicado na revista Frontiers in Genetics.
“A maioria dos programas existentes permite a comparação de duas redes complexas, por exemplo, a expressão gênica no tecido canceroso e não canceroso. Já o BioNetStat possibilita, por métodos estatísticos, olhar ao mesmo tempo 10 redes e determinar, por exemplo, que as redes 1 e 5 são diferentes entre si e, as demais, são todas iguais”, disse Marcos Buckeridge, professor do IB-USP e coordenador do projeto, à Agência FAPESP.
O programa pode ser baixado gratuitamente pelo site bioconductor.org/packages/release/bioc/html/BioNetStat.html.
Como explicou o pesquisador, a análise é baseada em parâmetros da teoria de redes complexas conhecidos como centralidades, que medem a importância de cada uma das variáveis (também chamadas de “nós”) e determinam sua posição na hierarquia do sistema.
“Existem vários tipos de centralidade, de acordo com o ângulo que se olha a rede. As mais conhecidas são a centralidade de grau [degree], de intermediação [betweenness] e de proximidade [closeness]”, disse.
A centralidade de grau é calculada pelo número de correlações que um nó apresenta. Quanto maior o número de ligações com outros nós da rede, maior é a centralidade de grau de uma variável. Depois de estabelecido o nó central (aquele com mais ligações), é possível determinar qual é o segundo nó na hierarquia (aquele que faz a ligação entre o central e os demais), ou seja, o que tem maior centralidade de intermediação. Já a centralidade de proximidade indica quão próximo dois nós estão em uma rede.
Em um dos experimentos feitos para validar a ferramenta, os pesquisadores usaram o BioNetStat para reanalisar dados de uma pesquisa anterior do grupo que comparou o metabolismo do sorgo (Sorghum bicolor) – o quinto cereal mais consumido no mundo – em três situações: normal (controle), seca e seca com alta concentração de dióxido de carbono (CO2). O objetivo desse estudo mais antigo foi avaliar possíveis impactos das mudanças climáticas na espécie.
Com o novo software, foram comparadas as redes metabolômicas de cinco órgãos da planta: folhas, colmo, raízes, raízes aéreas e grãos.
“Graças ao programa, descobrimos que um composto que havia passado despercebido no trabalho anterior – o α-cetoglutarato [AKG] – apresenta uma alta centralidade de grau e, a partir disso, começamos a formular uma série de novas hipóteses”, contou Buckeridge.
Em outro experimento de validação da ferramenta os cientistas compararam dados genômicos de quatro diferentes tipos de tumores cerebrais – astrocitoma, oligodendroglioma, oligoastrocitoma e glioblastoma – disponíveis em um banco público conhecido como The Cancer Genome Atlas (TCGA).
“Esses quatro tumores têm diferentes graus de agressividade e, com o software, conseguimos identificar os promotores de genes com maior centralidade de grau. Isso ajuda, por exemplo, a determinar genes-chave para a avaliação da agressividade de um tumor”, disse o pesquisador.
Segundo Buckeridge, o grupo busca parcerias com pesquisadores que trabalham com técnicas de inteligência artificial, como aprendizado de máquinas, o que permitiria usar o BioNetStat para fazer modelagem preditiva.
“Isso seria interessante para fazer engenharia de plantas, estudos epidemiológicos de doenças como dengue e zika, desenvolvimento de fármacos e até mesmo planejamento urbano. Permite descobrir, por exemplo, qual variável tem mais impacto na qualidade de vida da população de uma cidade e qual será o resultado se uma intervenção for feita nessa variável”, disse.
Atualmente, os pesquisadores trabalham no aperfeiçoamento do software, visando torná-lo mais rápido e, assim, viabilizar a análise de um número ainda maior de redes. Um segundo programa computacional em desenvolvimento pela equipe permitirá, segundo Buckeridge, analisar simultaneamente diferentes níveis de organização das várias redes que estão sendo comparadas.
“No caso de um sistema biológico, seria possível estudar ao mesmo tempo as redes de transcritômica, proteômica, metabolômica em diferentes condições e avaliar como tudo isso se relaciona com a fisiologia”, contou o pesquisador.
Para Buckeridge, a forma mais comum de se observar fenômenos relacionados a sistemas complexos – seja na economia, na política ou na biologia – ainda é focar em uma única variável considerada chave. “Talvez, se conseguirmos gradativamente mudar essa cultura, possamos resolver os problemas de forma mais eficiente e com menos consequências não previstas”, disse.
O artigo BioNetStat: A Tool for Biological Networks Differential Analysis, de Vinícius Carvalho Jardim, Suzana de Siqueira Santos, Andre Fujita e Marcos Silveira Buckeridge, pode ser lido em https://www.frontiersin.org/articles/10.3389/fgene.2019.00594/full.
A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.