Inovamos hoje para que você tenha um amanhã melhor.

NGS: O que é Sequenciamento de Nova Geração?

Saiba mais sobre o sequenciamento de DNA, o que é Sequenciamento de Nova Geração, suas categorias e para que cada tipo é indicado.

O  Projeto Genoma Humano e o constante avanço das tecnologias de sequenciamento do material genético levaram o surgimento do que chamamos de “Era Pós Genômica”. Hoje é possível sequenciar todo ou algumas partes do seu DNA de forma rápida e por um preço acessível através do Sequenciamento de Nova geração ou NGS (Next-Generation Sequencing). Assim, esta técnica vem possibilitando conquistas importantes no diagnóstico de patologias e na medicina de precisão.

Neste cenário, é importante ter em mente as diferentes técnicas e tipos de NGS para diversas finalidades.

Antes de explicar o que é NGS, vamos fazer uma breve introdução sobre o sequenciamento de DNA considerado de primeira geração.

Entenda o sequenciamento do DNA

O sequenciamento de DNA se baseia em equipamentos que leem uma amostra de DNA e geram um arquivo eletrônico. Este arquivo contém símbolos que representam a sequência de bases nitrogenadas – A, C, G, T – presentes na amostra.

Em outras palavras, o sequenciamento de DNA é a determinação exata da ordem em que os nucleotídeos se encontram.

O Sequenciamento de Primeira Geração

O primeiro método para sequenciar o DNA foi de Maxam-Gilbert. No entanto, este método só era capaz de sequenciar alguns nucleotídeos por vez. Em seguida, Frederik Sanger desenvolveu o método de sequenciamento de DNA foi o de terminação de cadeia, publicado em 1977, que se tornou popular e tem sido utilizado por centros de pesquisa ao redor do mundo até hoje.

O método conhecido como sequenciamento de Sanger, é considerado uma tecnologia de “primeira geração”. Este método é útil e eficaz no sequenciamento de fragmentos de DNA de 500-900 pares de bases.

Por isso, o sequenciamento de Sanger é bastante utilizado para sequenciar organismos que possuem sequencias curtas de DNA como plasmídeos bacterianos, ou também fragmentos de DNA amplificados por PCR (reação em cadeia da polimerase ou polymerase chain reaction).

Em 1986 foi lançado o primeiro sequenciador automático de DNA, o ABI 370, e em 1998, o primeiro sequenciador de eletroforese capilar, o ABI 3700.

Com a automatização foi possível realizar grandes projetos de sequenciamento, como o Projeto Genoma Humano completo, porém, ao custo de anos de pesquisa, bilhões de dólares e de esforço internacional de grandes centros com dezenas de máquinas instaladas.

Apesar do sucesso no sequenciamento do genoma humano completo, o Sequenciamento de Sanger, é um método caro e ineficiente para projetos de larga escala. Para tarefas como essa, as novas técnicas de NGS são mais eficientes e possuem menor custo.

O Sequenciamento de Nova Geração (NGS)

O Sequenciamento de Nova Geração (do inglês, Next-Generation Sequencing), também chamado de Sequenciamento Massivo em Paralelo (do inglês, Massive ou Massively Parallel Sequencing) ou Sequenciamento de Alta Performance (do inglês, High-throughput Sequencing) são diferentes termos que dizem respeito a um grupo de diferentes e modernas metodologias de sequenciamento do DNA.

O NGS pode ser caracterizado como um sequenciamento de DNA e RNA automatizado, paralelo e de alto rendimento. 

Essas tecnologias permitem sequenciar o DNA de forma muito mais rápida e barata em comparação com o sequenciamento de Sanger, usado anteriormente, e revolucionaram o estudo da genômica e da biologia molecular.

No entanto, diferentemente do método Sanger, o método de NGS sequencia fragmentos curtos de DNA (reads) que costumam variar de 50 a 300 nucleotídeos de comprimento.

Apesar de se diferenciarem consideravelmente entre si, todos as plataformas de sequenciamento de NGS se baseiam no processamento paralelo massivo de fragmentos de DNA. Isto é, enquanto um sequenciador de eletroforese capilar processa, no máximo, 96 fragmentos por vez, os sequenciadores de nova geração podem ler até bilhões de fragmentos ao mesmo tempo.

Com o NGS, é possível sequenciar o genoma inteiro ou apenas áreas específicas de interesse, incluindo todos os aproximadamente 20.000 genes codificadores ou um pequeno número de genes individuais.

Quais são as principais plataformas NGS?

Plataformas de NGS são os equipamentos onde ocorrem o sequenciamento. Existem diferentes plataformas disponíveis no mercado e elas se diferem na tecnologia e no método utilizado para o sequenciamento em massa. As principais plataformas de sequenciamento são:

Roche/454

Plataforma pioneira em NGS, foi lançada em 2005. Esta plataforma utiliza o método de Pirosequenciamento que é baseado na detecção de pirofosfato liberado durante a incorporação de um nucleotídeo na fita de DNA recém-sintetizada. A Plataforma pode gerar reads com comprimentos de até 1000 pares de base para DNA genômico e até 600 pb para amplicons e pode produzir cerca de 1 milhão de reads por corrida.

Ion Torrent

Esta plataforma utiliza uma metodologia similar ao da Roche, no entanto a adição de nucleotídeos é detectada através da geração de um íon de hidrogênio durante a incorporação de uma dNTP. A liberação de íons H + durante o processo muda o pH no ambiente, formando uma alta voltagem positiva que é detectada por um dispositivo. Este método é capaz de sequenciar reads de 200 a 600 pares de base.

Illumina

Esta é a plataforma mais popular de sequenciamento de nova geração pois é capaz de realizar grandes sequenciamentos com alta qualidade de reads por um valor mais acessível. A plataforma Illumina utiliza o método de sequenciamento por síntese. O processo identifica simultaneamente os nucleotídeos enquanto os incorpora em uma cadeia de ácido nucléico. Basicamente, nucleotídeos modificados quimicamente se ligam à fita molde de DNA por complementaridade. Estes nucleotídeos possuem uma etiqueta fluorescente e um terminador reversível que bloqueia a incorporação de uma próxima base. O sinal fluorescente indica qual nucleotídeo foi adicionado e o terminador é clivado para que a próxima base possa se ligar e assim completar o sequenciamento do fragmento.

Solid

Esta plataforma utiliza o método de sequenciamento por ligação que utiliza a sensibilidade de incompatibilidade de DNA ligase para determinar a sequência de nucleotídeos em um fragmento. O sistema usa quatro corantes para identificar todas as 16 possíveis combinações entre dois nucleotídeos e várias sondas modificadas. Em uma ponta da sonda fica a combinação de dois nucleotídeos e na ponta oposta o fluoróforo. Quando a sonda anela na sequencia de DNA, o sistema identifica o sinal luminoso e consequentemente a sequência de nucleotídeos.

Pacific Biosciences e o Oxford Nanopore: Sequenciamento de moléculas únicas

Estas são conhecidas como sequenciamento de terceira geração. Estas plataformas mais modernas são capazes de contornar problemas encontrados em outros métodos de sequenciamento como erros de leitura de reads curtos (short reads) ou até mesmo o trabalho de bancada para preparo das amostras.

Este método realiza a detecção de uma única molécula de DNA por reação. O princípio básico é medir mudanças nas propriedades elétricas do DNA que se transloca através de canais. Quando o fragmento atravessa o canal, a plataforma identifica a base exata de nucleotídeo por meio de variações na corrente elétrica. Este método permite sequenciar fragmentos ultralongos de forma eficaz.    

Quais são os tipos de NGS?

Existem diferenças básicas entre o tipo de NGS que pode ser requerido para pesquisa ou diagnóstico clínico a depender do que se está buscando. 

Essas diferenças não estão necessariamente baseadas na plataforma utilizada para realizar o sequenciamento, por exemplo MiSeq Illumina ou Ion Torrent, mas sim nas sequências resultantes do sequenciamento. Portanto, é necessário saber o que se deseja buscar ao final do sequenciamento antes de solicitar o tipo de NGS.

Nos tópicos a seguir vamos explicar o que é cada tipo de NGS e para que cada um é indicado.

Sequenciamento do Genoma Completo (WGS)

O sequenciamento do genoma completo (do inglês, Whole Genome Sequencing ou WGS) é como o nome já diz, o sequenciamento de todo o material genético ou DNA de um indivíduo. Esse sequenciamento irá incluir o DNA codificante e não codificante.

O WGS resulta em um arquivo muito grande com uma infinidade de informações sobre o material genético que podem ter uma interpretação clínica ou não.

No entanto, na maioria das vezes, apenas as alterações na porção codificante do DNA, que representa aproximadamente 2% de todo genoma, são permitem uma interpretação clínica. Ou seja, as alterações que ocorrem em regiões não codificantes muitas vezes não respondem informações sobre suas possíveis consequências ao indivíduo.

Além disso, o WGS tem um custo maior tanto para seu processamento quanto para o armazenamento do resultado.

Portanto, o sequenciamento do genoma completo é mais indicado em estudos científicos visando estudar as consequências de alterações em regiões ainda não estudadas ou a busca pelas alterações que causam doenças ainda sem causa elucidada, por exemplo.

Saiba mais: Variantes genéticas em regiões não codificantes WGS para diagnóstico de doenças raras no sistema de saúde

Sequenciamento do exoma completo (WES)

O sequenciamento do exoma completo (Whole Exome Sequecing ou WES) é o sequenciamento da porção codificante do DNA, ou seja, de todas as sequências de DNA que codificam os aproximadamente 21.000 genes do genoma humano.

O termo exoma se refere ao conjunto de éxons, que são as sequências do DNA que vão passar pelas etapas de transcrição e tradução até serem codificadas em proteínas.

Alterações nos genes podem causar alterações nas proteínas e consequentemente são mais prováveis de causarem doenças. Mutações no exoma são responsáveis pela grande maioria das doenças genéticas.

Assim, o WES é um exame laboratorial eficiente e mais indicado para o diagnóstico clínico principalmente em casos em que existe hipótese diagnóstica de mais de uma doença específica, ou ainda, que não se tem hipótese diagnóstica específica.

O resultado de um WES é um arquivo com as mutações encontradas em todos os genes do indivíduo, o que exige um maior tempo de análise.

Saiba mais: Exoma como ferramenta de diagnóstico clínico

Sequenciamento de genes alvo ou painel de genes

O sequenciamento de genes alvo ou painel de genes é o NGS realizado de apenas um grupo de genes de interesse.

Esse tipo de sequenciamento é semelhante ao WES, contudo, em vez sequenciar todos os genes do indivíduo, o sequenciamento é realizado em apenas um número de genes específicos: já associados a uma ou mais doenças, por exemplo. Portanto, quando se há uma hipótese diagnóstica de uma doença específica, o painel de genes é mais recomendado que o WES no diagnóstico clínico.

Atualmente os laboratórios que realizam NGS disponibilizam painéis de genes associados a diversas doenças genéticas, como câncer de mama e outros cânceres, doenças esqueléticas, musculares ou leucodistrofias, por exemplo.

As vantagens do sequenciamento de painel de genes em relação ao WES são a economia no custo do NGS, visto que menos genes serão sequenciados, e diminuição no tempo de análise.

Saiba mais: O painel NGS e seu impacto na abordagem clínica do câncer

Como os resultados de NGS são analisados?

Independentemente da plataforma utilizada e do tipo de sequenciamento, o resultado de um NGS é um arquivo contendo a leitura de até bilhões de fragmentos de DNA.

Estes arquivos precisam ser processados para ser possível realizar as análises do material genético. Para isso, são utilizadas ferramentas de bioinformática para definir posição exata de cada nucleotídeo do DNA no genoma, e a partir dele é possível analisar as mudanças nas sequências do DNA do indivíduo.

Aqui entra a bioinformática, que utiliza técnicas de informática e para análises de dados científicos. Ou seja, ferramentas que organizam e analisam informações genéticas complexas utilizando uma combinação de ferramentas de informática, matemática e estatística.

Algoritmos de bioinformática executados através de uma sequência pré-determinada para processar os dados de NGS são coletivamente denominados de pipeline de bioinformática. Um pipeline de bioinformática orienta e processa progressivamente dados de NGS através de uma série de conversões de dados, utilizando vários componentes de softwares, bancos de dados e ambientes operacionais.”

Saiba mais: Pipelines de bioinformática:  o que são e como implementar?

Portanto, os dados recebidos do sequenciamento são processados e analisados para verificar a qualidade do arquivo e em seguida são alinhados com um genoma de referência. Ou seja, uma sequência de nucleotídeos conhecida que irá servir como um guia para a montagem do genoma sequenciado.

Após ter organizado todos os fragmentos em sequencias alinhadas com a sequência de referência, as regiões genômicas podem ser analisadas em busca de alterações conhecidas como variantes.

O que são variantes genéticas?

Variantes genômicas são regiões do material genético que se diferem do genoma de referência. Estas variantes, também chamadas de mutações, podem ocorrer em todo genoma. Ou seja, podem ocorrer em regiões codificantes e não codificantes.

As alterações podem ser do tipo germinativa, ou seja, alterações genéticas que foram herdadas e que, portanto, afetam todas as células de um indivíduo ou variantes somáticas, isto é, mutações que ocorreram após o desenvolvimento, em algum momento da vida, e estão presentes em um ou mais tecidos específicos.

As mutações que ocorrem com maior frequência no genoma humano são os polimorfismos de nucleotídeo único, mais conhecidos como SNPs (do inglês Single Nucleotide Polymorphism). Como o nome diz, este tipo de alteração ocorre com a troca de um par de bases de nucleotídeo na cadeia de DNA. No entanto, principalmente quando a mutação ocorre em um gene, o SNP pode causar alterações no código da síntese de proteína e consequentemente causar patologias.

Saiba mais: SNP: pequena mutação associada a importantes doenças

Outra fonte de variação genômica é conhecida como variação de número de cópias ou CNV (do inglês, Copy number variations). Que são fragmentos genômicos maiores que 50 pares de bases que diferem em número de cópias. As CNVs se caracterizam por duplicações, também conhecidas como ganho ou aumento de conteúdo genômico, ou deleções também denominadas de perda ou diminuição de conteúdo genômico. Assim, como as CNVs envolvem maior porção do DNA, a variação pode implicar em manifestações clínicas relevantes dependendo da região envolvida.

Saiba mais: Variações de número de cópias (CNVs): como analisar?
CNVs e seu papel para o genoma clínico

Utilizando o sequenciamento de nova geração para detecção de CNVs

Banco de dados genômicos

Nesse contexto, existem diversas plataformas online que permitem identificar as variantes e estimar o possível dano que uma alteração específica pode ocasionar na proteína que codifica.

Cada plataforma faz essa predição através de métricas específicas e assim classificam se a variação tem mais chance de não ter causado nenhuma mudança na proteína (ou seja, é uma mutação benigna) ou ter causado uma mudança leve ou grave (mutação possivelmente patogênica ou patogênica).

Saiba mais: ClinVar: Como utilizar o maior banco de variantes do mundo OMIM – Banco de dados da relação entre genes e doenças hereditárias

Quais são as aplicações do NGS?

A chegada das tecnologias de NGS no mercado mudou a forma como pensamos sobre abordagens científicas em pesquisa básica, aplicada e clínica e no diagnóstico genético. 

NGS no diagnóstico clínico

Muitos distúrbios genéticos demoram para apresentar manifestações clínicas e, portanto, serem diagnosticados. Neste cenário, um diagnóstico precoce de distúrbios pode ser essencial para evitar ou atrasar o desenvolvimento de sintomas e desta forma, melhorar de forma significativa a qualidade de vida.

Neste cenário, os O NGS é altamente eficiente no diagnóstico molecular de doenças genéticas e cânceres hereditários ou não hereditários. Através do sequenciamento, o exame genético procura identificar variantes de genes conhecidos por estarem associados a pré-disposição do desenvolvimento de distúrbios.

Um exemplo disto é o câncer de mama que é associado a variantes dos genes BRCA1, BRCA2 e PALB2. A chance de cura do câncer de mama quando identificado precocemente é de 95%, o que demonstra a importância do diagnóstico genético.

Saiba mais: Análise genômica para direcionamento de diagnóstico e tratamento de câncer de mama PALB2: Novo guia orienta a gestão de pacientes

Além do diagnóstico de câncer, o sequenciamento também é recomendado para o diagnóstico de doenças congênitas e em caso de outros distúrbios hereditários. No entanto, como existem diferentes tipos de NGS, é necessário buscar um profissional de aconselhamento genético para indicar o melhor encaminhamento.

Saiba mais: Aconselhamento genético: o que é e qual o objetivo?

A identificação de variantes em exames genéticos é baseada em bancos de dados genômicos, como dito anteriormente. Como os dados são constantemente atualizados com o desenvolvimento da pesquisa, em alguns casos é necessário realizar uma reavaliação dos exames.

Saiba mais: Exame genético: Como e quando reinterpretar variantes?

GWAS: estudos de associação genômica ampla

O sequenciamento do material genético de diversos organismos permitiu a identificação de diversas regiões codificantes e seu papel nas características destes organismos.

O Estudo de associação genômica ampla ou GWAS (do inglês Genome Wide Association Studies) realiza o sequenciamento de genoma completo de grupos de organismos para identificar associações entre regiões genômicas e traços fenotípicos.

Indivíduos são selecionados de acordo com a caraterística de interesse, então o DNA dos indivíduos que apresentam a característica de interesse é comparado aos indivíduos que não apresentam, chamados de controle, em busca de variantes.

O GWAS é responsável pela identificação de diversos distúrbios de importância clínica, além de traçar semelhanças genéticas entre populações.

Saiba mais: GWAS: estudos de associação genômica ampla

NGS na Metagenômica

A utilização do sequenciamento vai muito além do estudo em humanos. A metagenômica por exemplo, possibilita a identificação de microrganismos que apresentam alto potencial biotecnológico, assim como a estudar patologias emergentes e suas rotas de transmissão.

A Metagenômica é o estudo da diversidade, taxonomia e do potencial funcional de uma comunidade microbiana coexistindo em um ambiente. Em outras palavras, este estudo se baseia na análise da composição microbiana em diferentes ecossistemas, através da extração do DNA total de uma amostra. 

Anteriormente a identificação de novos microrganismos era realizada em bancada através do isolamento e cultivo em meio de cultura. Com o sequenciamento de nova geração se tornou possível sequenciar bilhões de fragmentos de DNA simultaneamente, permitindo então obter toda a informação genética de diversos microrganismos de uma só vez

A metagenômica pode ser utilizada nas mais diversas aplicações. Como na análise do microbioma do intestino humano para realizar estudos de associação a doenças, assim como o estudo do solo para identificar microrganismos que favorecem o crescimento de plantas.

Saiba mais em: Metagenômica: novo estudo global de microbioma urbano Análise de microbioma a partir de sequências de 16Sr RNA: ASV ou OTU?

NGS para viromas

Outra estratégia que está ganhando destaque no campo de diagnósticos médicos é o viroma.

Muitas vezes os tratamentos viroses são generalizados já que a identificação do vírus causador da infecção necessita de diversos exames.

 Neste cenário, o viroma permite diagnosticar com maior precisão e em um único teste o vírus específico causador da infecção. Isto se dá pela possibilidade de sequenciar milhares de fragmentos de vírus de uma só vez através do sequenciamento de nova geração e assim identificar o que está presente na amostra.

O viroma também pode ser utilizado para identificar novas variantes de vírus, como é o caso do novo coronavírus.

Saiba mais: Viroma: medicina de precisão para doenças infecciosas virais
Por que RT-PCR não é suficiente para o diagnóstico de COVID-19?

A nova geração do sequenciamento de DNA

Por fim, a evolução constante das tecnologias de sequenciamento genético permite, permite estudos cada vez mais aprofundados do material genético dos mais diversos organismos. Assim, será possível melhorar progressivamente a qualidade de vida através da medicina de precisão, obter novos produtos biotecnológicos e desenvolver culturas com maior produtividade. A história do sequenciamento genômico está só está começando.

Principais referências:

Besser J, Carleton HA, Gerner-Smidt P, Lindsey RL, Trees E. Next-generation sequencing technologies and their application to the study and control of bacterial infections. Clin Microbiol Infect. 2018;24(4):335-341. doi:10.1016/j.cmi.2017.10.013

Chiara M, D’Erchia AM, Gissi C, et al. Next generation sequencing of SARS-CoV-2 genomes: challenges, applications and opportunities. Brief Bioinform. 2021;22(2):616-630. doi:10.1093/bib/bbaa297

Goodwin S, McPherson JD, McCombie WR. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 2016;17(6):333-351. doi:10.1038/nrg.2016.49

Gu W, Miller S, Chiu CY. Clinical Metagenomic Next-Generation Sequencing for Pathogen Detection. Annu Rev Pathol. 2019;14:319-338. doi:10.1146/annurev-pathmechdis-012418-012751

Maljkovic Berry I, Melendrez MC, Bishop-Lilly KA, et al. Next Generation Sequencing and Bioinformatics Methodologies for Infectious Disease Research and Public Health: Approaches, Applications, and Considerations for Development of Laboratory Capacity. J Infect Dis. 2020;221(Suppl 3):S292-S307. doi:10.1093/infdis/jiz286

McCombie WR, McPherson JD, Mardis ER. Next-Generation Sequencing Technologies. Cold Spring Harb Perspect Med. 2019;9(11):a036798. Published 2019 Nov 1. doi:10.1101/cshperspect.a036798

Suárez Moya A. Microbioma y secuenciación masiva [Microbiome and next generation sequencing]. Rev Esp Quimioter. 2017;30(5):305-311.

1 comment
Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Relacionados