metagenômica shotgun análise de microbioma

Metagenômica Shotgun: Como Processar e Analisar?

A Metagenômica Shotgun é a abordagem livre de cultivo que permite caracterizar todo DNA presente em uma amostra. Saiba como analisar!

A Metagenômica Shotgun é uma abordagem de sequenciamento que possibilita uma análise do material genético de todos os microrganismos presentes em uma determinada amostra como fezes, líquido cefalorraquidiano, sangue sem a necessidade de cultivo.

Saiba o que é o microbioma, como são os processos e vantagens do sequenciamento metagenômico por shotgun e qual ferramenta utilizar para analisar os dados.

Metagenômica: Análise e detecção de microrganismos

Os termos microrganismos ou micróbios são comumente utilizados para descrever grupos distintos, como bactérias, vírus, arqueas, fungos, protozoários e até pequenos animais parasitas. 

Apesar dos microrganismos, principalmente bactérias e vírus serem muito conhecidos por causar doenças, eles são fundamentais em diversos processos chaves no equilíbrio do planeta e na saúde humana.  

O corpo humano possui mais células microbianas do que células humanas. Aproximadamente 100 trilhões de microrganismos vivem em simbiose com o corpo humano.

O conjunto desses organismos simbióticos é conhecido como microbiota, e o seu respectivo material genético de microbioma humano. O nosso microbioma nos protege de microrganismos patogênicos, além de desempenhar diversas funções essenciais à saúde humana.

No entanto, é estimado que mais de 90% dos microrganismos não sejam cultiváveis, ou seja, não é possível crescer e isolar esse microrganismo num meio de cultivo. Por isso, metodologias independentes de cultivo são cruciais para o estudo de microbiomas. 

O que é a Metagenômica Shotgun?

A metagenômica shotgun é a abordagem livre de cultivo que permite caracterizar todo o DNA presente em uma amostra ambiental ou clínica de modo não direcionado a um alvo específico. 

A metagenômica é uma técnica que permite recuperar o material genético total (DNA) em amostras de diferentes tipos, de solo e água do mar até amostras de fezes e urina de pacientes. Desta forma, através de análises de bioinformática é possível realizar a identificação de microrganismos patogênicos e simbióticos em uma amostra.

Com o avanço das técnicas de Sequenciamento de Nova Geração (NGS), esta metodologia vem sendo aplicada nas áreas de pesquisa e na clínica para acessar o microbioma, viroma e micobioma (fungos) associado a diferentes nichos. Além da identificação de parasitas e outros organismos patogênicos.

Quais são as etapas da técnica de Metagenômica Shotgun a partir da coleta de uma amostra biológica?

i. Extração de DNA total.
ii. Sequenciamento do DNA metagenômico.
iii. Processamento das Sequências e Análises de Bioinformática no Varsmetagen. 

etapas metagenômica shotgun

Análises de Bioinformática para dados de Metagenômica Shotgun no Varsmetagen

O Varsmetagen é uma plataforma de bioinformática rápida e eficiente para identificação precisa de patógenos associados à doenças infecciosas e para análise de microbiomas. Esta ferramenta viabiliza as análises de amostras de metagenômica shotgun de forma precisa, automatizada e escalável.

Com o Varsmetagen é possível analisar metagenomas de diferentes tipos de amostras como:

  • Plasma,
  • Secreções respiratórias (ex. swab nasal), 
  • Líquido cefalorraquidiano (LCR), 
  • Fezes, 
  • Tecidos infectados, 
  • Outros fluidos corpóreos, 
  • Amostras ambientais. 

Com isso, a Metagenômica Clínica pode ser aplicada para os exames de:

  • Detecção de patógenos: bactérias, vírus, fungos e parasitas.
  • Diagnóstico de doenças virais
  • Diagnóstico e tratamento de doenças infecciosas
  • Caracterizar o Microbioma, Viroma e Micobioma
  • Análise de Disbiose em Microbiomas
  • Predição Gênica: genes de resistência a antibióticos, e genes de resistência a antivirais.

Funcionalidades do exame de Metagenômica no Varsmetagen

O pipeline de Metagenômica do Varsmetagen foi desenvolvido seguindo um alto padrão de qualidade. As principais metodologias e as melhores ferramentas para análise de metagenômica shotgun são utilizadas, a fim de garantir os melhores resultados. 

O Varsmetagen realiza a análise de metagenomas de ponta a ponta. A seguir estão as principais funcionalidades do pipeline de Metagenômica.

metagenômica shotgun pipeline varsmetagen

Controle de Qualidade das Sequências

Os arquivos de input (ex. fastq ou fastq.gz) são submetidos a um pré-processamento para remoção das sequências de baixa qualidade, adaptadores, etc.

Remoção do DNA do Hospedeiro

Para amostras de metagenoma shotgun de um organismo hospedeiro (ex. microbioma humano, microbioma de camundongo), é possível remover as sequências de DNA do hospedeiro específico, através do mapeamento no respectivo genoma.

Caso o genoma do hospedeiro não esteja cadastrado no nosso banco, será possível adicionar um novo genoma e produzir um pipeline personalizado.

Tabela com as Métricas de Qualidade

Diversas métricas de qualidade das amostras, como número e percentual de sequências com alta qualidade (> Q30), sequências não mapeadas no hospedeiro e outras quantificações, estão disponíveis para visualização no Varsmetagen. As métricas também estão disponíveis para download em um arquivo no formato tabular (.csv) para análises fora da plataforma.

Montagem de Contigs (Assembly)

A etapa de assembly com o software SPAdes consiste em gerar sequências maiores considerando a sobreposição de reads, os chamados contigs. Também é realizado o controle de qualidade da montagem, estimando métricas, como:

  • número de contigs por faixa de tamanho,
  • N50,
  • tamanho em pares de bases,
  • conteúdo GC (guanina-citosina) e
  • gráficos para melhor visualização dos resultados.

O relatório desses dados pode ser acessado em um arquivo disponível para download. Os reads e os contigs são utilizados para a identificação de organismos nas amostras. 

Classificação Taxonômica: Kraken2

Para identificar os organismos presentes na amostra, principalmente bactérias e vírus, os pipelines de Viroma e Metagenômica contam com o classificador taxonômico Kraken2 e um banco de referência personalizado.

Classificação Taxonômica: Ccmetagen

Para uma identificação mais precisa, foi adicionado um segundo classificador no pipeline de metagenômica, o ccmetagen. Este classificador possui uma maior acurácia na identificação de fungos, protozoários, parasitas e outros organismos do grupo dos eucariotos, aperfeiçoando o diagnóstico de patógenos desses grupos.

Top Hits de Vírus e Top Hits de Bactéria

A classificação de reads e contigs pode não ser suficiente para confirmar a detecção de um patógeno. De forma a corroborar o resultado, para todas as espécies de vírus e as bactérias mais abundantes classificadas pelo Kraken2, é realizado um mapeamento direcionado no respectivo genoma de referência.

A visualização do resultado é mostrada num gráfico de tamanho do genoma pela cobertura vertical. Também são disponibilizadas as métricas de cobertura e mapeamento: Número de reads mapeadas, Cobertura horizontal, Cobertura média, Uniformidade 10X e um link para o genoma de referência com número de acesso do NCBI.

Recuperação de Genomas de Metagenomas (MAGs)  

A montagem de genomas de vírus e bactérias a partir de metagenomas (MAG: Metagenome-Assembled Genome) é mais uma ferramenta poderosa que também contribui para a detecção de microrganismos patogênicos.

Com o Varsmetagen, realizamos a binagem de contigs com três binadores de alta qualidade (Metabat2, Maxbin2 e CONCOCT). Ainda é realizada uma etapa de refinamento de bins com o metaWRAP, a fim de recuperar os MAGs com maior completude e contaminação mínima.

Classificação Taxonômica de Genomas bacterianos

Os genomas recuperados de metagenomas (MAGs) são classificados utilizando o GTDB-tk, que calcula o ANI (Average Nucleotide Identity) para os todos os genomas representativos do banco do GTDB (Genome Database Taxonomy), resultando numa identificação cepa-específica de bactérias.

Predição do Potencial Funcional do Metagenoma

O eggNOG-mapper é uma ferramenta de anotação funcional para predição de domínios de proteínas em amostras de metagenômica. Os contigs montados pelo Spades são traduzidos em proteínas e estas são buscadas contra um banco de domínios conservados no formato de Hidden-Markov Models (HMMs).

Essa função permite o reconhecimento de sequências homólogas que não apresentam alta similaridade e consequentemente, a identificação de vírus ou microrganismos inicialmente desconhecidos.

VarsData

Com o VarsData é possível visualizar a frequência de cada espécie na rotina, no pipeline, no material da amostra (ex. líquido cefalorraquidiano, fezes), e em cohorts de amostras de controle negativo. Essa função permite identificar contaminantes comuns de reagentes.

Emissão de Laudos

Com o Varsmetagen, você emitirá laudos e relatórios completos sobre os resultados encontrados, gerados a partir de análises confiáveis e que garantem a segurança e confidencialidade dos dados, de acordo com a Lei Geral de Proteção de Dados (LGPD).

Case de Sucesso do Varsmetagen com Metagenômica Shotgun

Um dos exemplos de case de sucesso da utilização do Varsmetagen é o da Identificação do parasita Taenia solium em uma amostra de líquido cefalorraquidiano (LCR) pelo exame de Metagenômica shotgun, possibilitando o diagnóstico de neurocisticercose. 

Um total de ​​14988 reads e 22 contigs foram classificados como Taenia solium pelo classificador taxonômico ccmetagen.

Veja a seguir como a plataforma Varsmetagen processou os dados de metagenômica shotgun e possibilitou a identificação do parasita:

  1. Tela de Rotina com a lista das amostras
Taenia metagenômica
  1. Tela de Métricas de Qualidade
Análise microbioma Taenia
  1. Tela de Dados da Coleta
análise Taenia - Metagenômica Shotgun
  1. Tela de Visão Geral mostrando o Krona plot da classificação taxonômica de reads pelo ccmetagen.
Análise de microbioma - Metagenômica
  1. Tela de Visão Geral mostrando o Krona plot da classificação taxonômica de scaffolds pelo ccmetagen
case de sucesso varsmetagen

6. Tela de Organismos mostrando todas as espécies identificadas na amostra.

identificação de microrganismos

Vantagens do Uso do Varsmetagen para Análise Metagenômica Shotgun

O Varsmetagen possui diversas vantagens para análise de dados metagenômicos. Entre eles:

  • Rapidez no processamento das amostras
  • Escalabilidade
  • Suporte humano para auxílio durante todo processo
  • Estatística Descritiva da Classificação Taxonômica e Gráficos de Abundância
  • Síntese de todos os resultados de classificação taxonômica na tela de organismos.
  • Resultados de todas as análises em arquivos disponíveis para download.
Quais arquivos são aceitos no Varsmetagen?

Fastq, fastq.gz, da Illumina, IonTorrent, Nanopore.

Autora: Ana Carolina Soares.
Graduada em Ciências Biológicas pela Universidade Federal do Rio de Janeiro (UFRJ), mestre em Genética também pela UFRJ, e atualmente doutoranda em Bioinformática pelo Programa Interunidades de Pós-Graduação em Bioinformática da Universidade de São Paulo. Possui experiência em desenvolvimento de pipelines de bioinformática e análises de dados de sequenciamento de nova geração (NGS), com ênfase em genômica microbiana e metagenômica.

Referências

Chiu, C.Y., Miller, S.A. Clinical metagenomics. Nat Rev Genet 20, 341–355 (2019). https://doi.org/10.1038/s41576-019-0113-7

Bankevich A, Nurk S, Antipov D, Gurevich AA, Dvorkin M, Kulikov AS, Lesin VM, Nikolenko SI, Pham S, Prjibelski AD, Pyshkin AV, Sirotkin AV, Vyahhi N, Tesler G, Alekseyev MA, Pevzner PA. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J Comput Biol. 2012 May;19(5):455-77. doi: 10.1089/cmb.2012.0021. Epub 2012 Apr 16. PMID: 22506599; PMCID: PMC3342519. 

Wood, D.E., Lu, J. & Langmead, B. Improved metagenomic analysis with Kraken 2. Genome Biol 20, 257 (2019). https://doi.org/10.1186/s13059-019-1891-0

Marcelino, V.R., Clausen, P.T.L.C., Buchmann, J.P. et al. CCMetagen: comprehensive and accurate identification of eukaryotes and prokaryotes in metagenomic data. Genome Biol 21, 103 (2020). https://doi.org/10.1186/s13059-020-02014-2

Kang DD, Li F, Kirton E, Thomas A, Egan R, An H, Wang Z. MetaBAT 2: an adaptive binning algorithm for robust and efficient genome reconstruction from metagenome assemblies. PeerJ. 2019 Jul 26;7:e7359. doi: 10.7717/peerj.7359. PMID: 31388474; PMCID: PMC6662567.

Yu-Wei Wu, Blake A. Simmons, Steven W. Singer, MaxBin 2.0: an automated binning algorithm to recover genomes from multiple metagenomic datasets, Bioinformatics, Volume 32, Issue 4, 15 February 2016, Pages 605–607, https://doi.org/10.1093/bioinformatics/btv638

Alneberg J, Bjarnason BS, de Bruijn I, Schirmer M, Quick J, Ijaz UZ, Lahti L, Loman NJ, Andersson AF, Quince C. Binning metagenomic contigs by coverage and composition. Nat Methods. 2014 Nov;11(11):1144-6. doi: 10.1038/nmeth.3103. Epub 2014 Sep 14. PMID: 25218180.

Uritskiy, G.V., DiRuggiero, J. & Taylor, J. MetaWRAP—a flexible pipeline for genome-resolved metagenomic data analysis. Microbiome 6, 158 (2018). https://doi.org/10.1186/s40168-018-0541-1

Pierre-Alain Chaumeil, Aaron J Mussig, Philip Hugenholtz, Donovan H Parks, GTDB-Tk: a toolkit to classify genomes with the Genome Taxonomy Database, Bioinformatics, Volume 36, Issue 6, 15 March 2020, Pages 1925–1927, https://doi.org/10.1093/bioinformatics/btz848

eggNOG-mapper v2: functional annotation, orthology assignments, and domain prediction at the metagenomic scale. Carlos P. Cantalapiedra, Ana Hernandez-Plaza, Ivica Letunic, Peer Bork, Jaime Huerta-Cepas. 2021. Molecular Biology and Evolution, msab293, https://doi.org/10.1093/molbev/msab293

Relacionados