Programa pode ser útil para o controle de qualidade dos dados obtidos pelo sequenciamento de amostras ambientais, técnica conhecida como metagenômica. Análise permite saber o quão completas estão as sequências mapeadas e se há contaminação por material genético de outros microrganismos (imagem: Zosia Rostomian/Berkeley Lab)
Programa pode ser útil para o controle de qualidade dos dados obtidos pelo sequenciamento de amostras ambientais, técnica conhecida como metagenômica. Análise permite saber o quão completas estão as sequências mapeadas e se há contaminação por material genético de outros microrganismos
Programa pode ser útil para o controle de qualidade dos dados obtidos pelo sequenciamento de amostras ambientais, técnica conhecida como metagenômica. Análise permite saber o quão completas estão as sequências mapeadas e se há contaminação por material genético de outros microrganismos
Programa pode ser útil para o controle de qualidade dos dados obtidos pelo sequenciamento de amostras ambientais, técnica conhecida como metagenômica. Análise permite saber o quão completas estão as sequências mapeadas e se há contaminação por material genético de outros microrganismos (imagem: Zosia Rostomian/Berkeley Lab)
Karina Toledo | Agência FAPESP – Pesquisadores norte-americanos desenvolveram uma ferramenta computacional que permite avaliar e melhorar a qualidade de genomas virais obtidos por meio de metagenômica – técnica que consiste em sequenciar todo o material genético presente em amostras ambientais (de solo ou de água, por exemplo) e depois identificar por bioinformática a quais organismos pertencem as sequências geradas.
Divulgado na revista Nature Biotechnology, o trabalho foi conduzido no Instituto Conjunto do Genoma do Departamento de Energia dos Estados Unidos, sob a coordenação de Nikos Kyrpides e Stephen Nayfach. Um dos coautores é Antônio Pedro Camargo, doutorando no Instituto de Biologia da Universidade Estadual de Campinas (IB-Unicamp) e bolsista da FAPESP.
A ferramenta, nomeada “CheckV”, está disponível para download gratuito no endereço http://bitbucket.org/berkeleylab/CheckV.
“A metagenômica possibilitou um enorme avanço no conhecimento sobre a biodiversidade microbiana. Mais de 40% das espécies de bactérias conhecidas foram descritas recentemente, graças a esse tipo de abordagem. Contudo, ainda sabemos muito pouco sobre os vírus. A maior parte dos genomas sequenciados é de patógenos humanos, mas nós queremos conhecer melhor os bacteriófagos [vírus que infectam bactérias], que representam a entidade biológica mais abundante da Terra e desempenham papel importante na regulação de ecossistemas”, conta Camargo à Agência FAPESP.
Como explicam os autores no artigo, grande parte dos microrganismos que participam da ciclagem de nutrientes, como carbono, nitrogênio e enxofre, é regulada por vírus em seus ambientes naturais. A metagenômica, dizem, pode ajudar os cientistas a recuperar os genomas desses vírus e a associá-los a seus hospedeiros microbianos.
“Mas trata-se de uma técnica passível de erros. Muitas vezes as sequências obtidas pela análise de amostras ambientais estão fragmentadas, incompletas ou contaminadas por material genético das bactérias hospedeiras. Por esse motivo, nos últimos anos, têm se buscado criar estratégias para fazer o controle de qualidade dos resultados obtidos por metagenômica”, diz o doutorando à Agência FAPESP.
Como explica Camargo, os vírus evoluem muito mais rapidamente do que os organismos celulares e possuem um genoma extremamente plástico. Com certa frequência, acontece de um bacteriófago “roubar” genes da bactéria hospedeira ou de outro vírus que a infectou simultaneamente.
“A maior parte dos bacteriófagos tem um genoma circular que se integra ao da bactéria hospedeira. Com a ferramenta, é possível mensurar o grau de contaminação das sequências virais identificadas e separar o material genético viral do bacteriano ao analisar uma amostra ambiental por metagenômica”, diz.
A CheckV também é capaz de indicar o quão completa está a sequência obtida. De acordo com Camargo, isso é possível porque o tamanho do genoma é relativamente conservado entre vírus similares, pois é limitado pelo capsídeo – invólucro proteico que protege o material genético desses microrganismos.
“A ferramenta compara o tamanho da sequência obtida por metagenômica com o padrão esperado para o grupo e, se for a metade, por exemplo, nos indica que tem 50% de completude”, conta.
Para validar a CheckV, o grupo liderado por Kyrpides e Nayfach usou dois bancos de dados que reúnem sequências de vírus não cultivados em laboratório (obtidos pelo sequenciamento de amostras ambientais): o Integrated Microbial Genomes (IMG/VR) e o Global Ocean Virome 2.0. A ferramenta identificou um total de 44.652 genomas virais completos ou quase completos em ambos os conjuntos de dados (3,6% do total analisado), separando-os da grande maioria das outras sequências que estavam fragmentadas ou incompletas.
Além disso, a CheckV foi capaz de identificar pouco mais de 17 mil sequências virais no IMG/VR que estavam integradas em genomas de bactérias hospedeiras. Assim, ao separar o material genético do vírus e do hospedeiro, foi possível identificar genes codificados pelo vírus que modulam o metabolismo bacteriano.
Micróbios do bem
Durante seu doutorado, Camargo tem se dedicado a estudar bactérias capazes de prosperar em ambientes adversos e que, de algum modo, podem ajudar plantas a sobreviver em situações nas quais os nutrientes são limitados. O projeto é coordenado pelos professores do Instituto de Biologia Marcelo Falsarella Carazzolle e Paulo Arruda, no âmbito do Centro de Pesquisa em Genômica Aplicada às Mudanças Climáticas (GCCRC) – um Centro de Pesquisa em Engenharia (CPE) constituído pela FAPESP e pela Empresa Brasileira de Pesquisa Agropecuária (Embrapa) na Unicamp.
“As plantas e os animais estão repletos de microrganismos, que criam um vínculo funcional com seus hospedeiros, podendo beneficiar o sistema de defesa, a nutrição e a sanidade dos indivíduos. Um dos grandes desafios dos estudos sobre o microbioma consiste na identificação dos mecanismos pelos quais as comunidades microbianas benéficas interagem com o organismo hospedeiro para modular seu desempenho”, conta Arruda à Agência FAPESP.
O sequenciamento massivo de metagenomas e metatranscritomas (conjunto de moléculas de RNA expressas em uma amostra ambiental) tem revelado uma grande diversidade de vírus de DNA e RNA que fazem parte da microbiota de plantas e humanos, bem como uma miríade de novas funções reguladas pelas comunidades microbianas em seus hospedeiros, relata o coordenador do GCCRC.
“Entender o papel dessas comunidades virais na função e na evolução dos organismos constitui o próximo desafio. Novas ferramentas computacionais que permitam maior acurácia e eficiência na análise do viroma dos organismos são fundamentais para o avanço dessa importante área das ciências da vida”, afirma Arruda.
O artigo CheckV assesses the quality and completeness of metagenome-assembled viral genomes pode ser lido em www.nature.com/articles/s41587-020-00774-7.
A Agência FAPESP licencia notícias via Creative Commons (CC-BY-NC-ND) para que possam ser republicadas gratuitamente e de forma simples por outros veículos digitais ou impressos. A Agência FAPESP deve ser creditada como a fonte do conteúdo que está sendo republicado e o nome do repórter (quando houver) deve ser atribuído. O uso do botão HMTL abaixo permite o atendimento a essas normas, detalhadas na Política de Republicação Digital FAPESP.