Sequenciamento Sanger: história, prática e impacto do método

Você já domina tudo sobre o Sequenciamento Sanger? Nesse artigo, você descobre da teoria à prática sobre esse método tão importante.
código de codificação DNA

No DNA reside a chave do entendimento fundamental das propriedades bioquímicas dos seres vivos, bem como da sua capacidade de transmissão de informações genéticas. E ainda que a genética tenha surgido no final do século XIX, o primeiro método de sequenciamento genético veio a ser elaborado somente em 1976, por Maxam e Gilbert, de forma paralela ao método de sequenciamento de Sanger. Posteriormente, acabou tornando-se o método mais utilizado durante  décadas. 

Apesar de já existirem novos métodos de sequenciamento, as técnicas desenvolvidas por Sanger são, ainda hoje, consideradas apropriadas para muitas aplicações nas quais não se faz necessário sequenciar volumes massivos de material genético.

Foram esses avanços que permitiram a determinação das sequências de nucleotídeos que compõem um gene (ou mesmo o genoma de um organismo). O sequenciamento Sanger foi essencial para a caracterização genética dos seres vivos, possibilitando uma compreensão mais adequada sobre as condições necessárias para seu equilíbrio fisiológico e o que pode ser utilizado para contornar a situação quando há desequilíbrio, inclusive quando gerado por um patógeno. 

E é sobre a história, o método, a prática e influência da tecnologia no sequenciamento atual, que vamos abordar nesse post. Boa leitura!

Como era antes do Sequenciamento Sanger?

Durante a década de 1940 foi convencionado que o DNA, descoberto ainda no século XIX, seria constituído por uma sequência repetitiva de quatro unidades, os chamados desoxirribonucleotídeos. Os pesquisadores da época já possuíam o conhecimento sobre a existência do RNA e também de suas diferenças em relação ao DNA, como:

  • A presença de bases nitrogenadas do tipo Uracila no lugar daquelas do tipo Timina, presentes no DNA.
  • Somente no DNA as quantidades de Timina eram sempre iguais às de Adenina, bem como as quantidades de Citosina eram iguais às quantidades de Guanina.

Estes conhecimentos foram essenciais para que, em 1953, Watson e Crick, munidos de imagens obtidas por Franklin e Wilkins, confirmassem a hipótese (levantada por Linus Pauling alguns anos antes) de que a estrutura do DNA seria helicoidal, além de proporem que essa hélice seria formada por duas fitas antiparalelas, constituídas, por sua vez, de cadeias polinucleotídicas. 

Posteriormente, o trabalho de ambos os pesquisadores (em relação às hipótese de como o DNA permite e direciona a formação de proteínas nos seres vivos) foi amplamente influenciado por Frederick Sanger. Na década de 1950, Sanger tentava determinar a sequência completa de aminoácidos presentes nas duas cadeias (A e B) de insulina bovina: uma proteína relativamente curta e, naquele tempo, de fácil obtenção.  O método de sequenciamento de Sanger para essa finalidade consistia em: 

  • Hidrolisar a insulina para fragmentá-la em cadeias peptídicas menores; 
  • Utilizar dinitrofluorbenzeno (FDNB) para marcar o aminoácido em posição terminal; 
  • Fracionar os fragmentos, primeiro usando eletroforese e, em seguida, utilizando-se cromatografia de partição. 

Foi a partir disso que Sanger percebeu que o tamanho dos fragmentos de aminoácidos dependia do tempo de exposição ao ácido da hidrólise, permitindo que ele marcasse, separasse, e comparasse com fragmentos maiores. Ao saber onde cada um desses fragmentos terminava, devido à cor do FDNB, era possível sobrepô-los e elucidar a sequência correta de cada um dos fragmentos da proteína.

Então, bastava realizar a identificação química de cada fragmento para saber quais aminoácidos estavam em quais posições: o que efetivamente foi feito, tornando Sanger e sua equipe as primeiras pessoas a sequenciar corretamente uma cadeia polipeptídica. Sanger recebeu um Prêmio Nobel por suas descobertas, que permitiram o entendimento de que proteínas não são estruturas amorfas, mas sim de que possuem uma identidade química única e bem definida. 

A partir desse estudo, tinha-se as bases para que Crick desenvolvesse a hipótese de que a sequência de nucleotídeos contidos no DNA, determinaria uma sequência de aminoácidos unidos por ligações peptídicas, e que essa sequência definiria a estrutura e função da proteína. 

Após o grande sucesso do Sequenciamento de Sanger a partir da insulina bovina, Crick e seus colaboradores convidam-no, em 1962, para fazer parte do recém inaugurado Laboratório de Biologia Molecular da Universidade de Cambridge, cujo cerne de pesquisas residia em descobrir os mecanismos com que o DNA poderia especificar a estrutura de proteínas. 

Sanger escreveu mais tarde, em um documento de memórias, que o trabalho com ácidos nucleicos possuía um ônus e um bônus:

  • Trabalhar com apenas quatro monômeros diferentes seria mais difícil, pois sobrepor fragmentos na ordem correta exigiria um esforço maior.
  • Justamente por não precisar trabalhar com vinte aminoácidos diferentes, a análise final seria mais fácil.

O Sequenciamento Sanger na prática

Após alguns anos trabalhando e experimentando com diferentes técnicas de purificação, marcação e sequenciamento de RNAs, Sanger e seus colaboradores conseguiram, com sucesso, correlacionar uma sequência nucleotídica de RNA com uma proteína específica. Com tal experiência, Sanger pôde iniciar sua pesquisa com DNAs, mas, devido à presença da dupla fita, seria necessária uma nova abordagem para um novo sucesso.

Inicialmente, Sanger voltou sua atenção para aquilo que chamou de “método do mais e menos” que, embora tenha sido útil no sequenciamento do genoma completo de um bacteriófago (contendo aproximadamente cinco mil bases nitrogenadas), era trabalhoso e demorado. Entretanto, ele serviu como alicerce para aquilo que Sanger e seus colegas introduziram em 1977 e chamaram de “método do didesóxi”: o que hoje é conhecido como Sequenciamento/Método de Sanger e que foi, posteriormente, utilizado para sequenciar o genoma humano em sua totalidade.

Este método consiste no fato de que é a presença da hidroxila na posição 3’ da desoxirribose do DNA que permite a adição, por meio de ligações fosfodiéster, de novos nucleotídeos à fita. Sanger percebeu, então, que um nucleotídeo radiomarcado e modificado para não possuir hidroxilas (um didesóxinucleotideo, portanto), interromperia o elongamento promovido pela DNA-polimerase.

Ao utilizar a configuração correta, seria possível gerar fitas filhas (de um DNA molde) com todos os comprimentos possíveis. Sendo assim, utilizando a técnica da eletroforese em gel, seria possível inferir a ordem correta das bases nitrogenadas presentes na fita de DNA a ser sequenciada. 

Representação de ddNTP e dNTP

 

Quais são as etapas do Sequenciamento Sanger?

De maneira específica, a técnica elaborada por Sanger consistia, originalmente, nas seguintes etapas:

1- Ao DNA molde, de fita dupla (dsDNA), adiciona-se um ácido ou uma base, a fim de quebrar as ligações de hidrogênio presentes entre cada uma das bases nitrogenadas, gerando fitas simples de DNA (ssDNA).

2- Estes ssDNAs de interesse eram adicionados à quatro tubos diferentes (um para cada base), juntamente com quantidades suficientes de: iniciadores (primers), DNA-polimerases, dNTPs (desóxinucleotideos de cada uma das bases) e ddNTPs radiomarcados.

3-Posteriormente, realizava-se uma eletroforese em gel de poliacrilamida, o qual era dividido em quatro pistas, uma para cada base, permitindo que os diferentes fragmentos, interrompidos em diferentes posições pelos ddNTPs, fossem separados.

4- Ao final da área do gel, o analito era recolocado em um novo gel para que a separação pudesse continuar ou, de maneira análoga, um novo primer era construído, iniciando o sequenciamento a partir de onde o anterior havia parado.

5- Ao término da separação, realizava-se uma auto-radiografia, de tal forma a permitir a visualização e leitura de cada um dos fragmentos.

Uma vez que a eletroforese separa fragmentos em detrimento de seu tamanho, sabia-se que o menor fragmento (ou aquele que mais “correu”), correspondia ao começo da fita (desconsiderando-se o primer, cuja sequência é conhecida), enquanto o maior, ao final.

Sequenciamento Sanger
Representação esquemática do Sequenciamento de Sanger. Fonte: Menck, 2017

Sequenciamento Sanger: manual x automatizado

Uma das razões pelas quais o sequenciamento de Sanger continuou a se provar útil por tanto tempo, foram as modificações e melhorias realizadas nos anos seguintes à sua criação. Um dos primeiros avanços foi realizado por Smith et al ao demonstrar que, ao utilizar um computador para coletar os dados do sequenciamento, era possível economizar tempo e eliminava-se a necessidade da auto-radiografia. 

Ao marcar cada um dos ddNTPs com diferentes pigmentos, se tornava possível a condução da eletroforese em um tubo, mimetizando técnicas cromatográficas. Com auxílio de um detector próximo do final do tubo, essa técnica reduziu custos e permitiu que grandes projetos pudessem acontecer ainda na década de 1980. 

Outra importante melhoria introduzida por Jorgensen, ainda na década de 1980, foi a eletroforese capilar como alternativa à eletroforese em gel. Seu método consiste na utilização de um detector de laser, posicionado ao final de capilar, possibilitando captar sinais fluorescentes emitidos pelos ddNTPs adequadamente marcados. O grande avanço reside no material com que o capilar é construído: sílica de alta pureza, o que reduz o calor produzido a níveis insignificantes, permitindo uma maior velocidade de separação e também automatizada

Essa invenção abriu portas para avanços ainda mais promissores, como o emprego da PCR, da Taq-polimerase e da eletroforese capilar com arranjo de diodos e cubetas de fluxo; o que permitiu o sequenciamento genético em paralelo de múltiplos analitos centenas de vezes maiores que aquele analisado por Sanger, incluindo o genoma humano inteiro.

Representação de Sequenciamento de Sanger automatizado, utilizando eletroforese capilar, detectores de laser e computadores para a coleta e análise de dados.

Sanger ou NGS?

Apesar de ainda ser amplamente utilizado em laboratórios de pesquisa e também no contexto clínico, o Sequenciamento de Sanger é capaz de sequenciar somente um DNA molde por vez, além de que o nível de sensibilidade o torna incapaz para algumas aplicações: como para alelos mutantes de baixo nível ou para análise de regiões altamente polimórficas (que é o caso do MHC/HLA). 

Foi dentro desse contexto que surgiram as tecnologias de Sequenciamento de Segunda Geração (como o NGS), que viabilizaram o sequenciamento individual de milhões de fitas molde de maneira simultânea, em um processo conhecido como sequenciamento paralelo em massa, capaz de:

  • Sequenciar o genoma humano inteiro em questão de poucos dias;
  • Custo mais baixo: hoje, é possível realizar o sequenciamento por valores centenas de vezes menores que a cifra dos cem milhões de dólares empregados para o realizar em 2001. 

Ainda assim, o Sequenciamento de Sanger continua sendo um método de escolha para diversos empregos e laboratórios, especialmente quando não existe a necessidade de processar grandes volumes de dados e também na verificação de sequenciamentos. Isso se deve ao fato desta técnica permitir a obtenção de dados de até 700 pares de bases, sem grandes dificuldades de leitura e análise. 

Portanto, ainda que esta metodologia tenha sido inventada há mais de quarenta anos, ainda hoje existem aplicações onde o Sequenciamento de Sanger é tido como padrão ouro, como quando o interesse é sequenciar um único gene, ou sequenciar amplicons com o menor custo possível, por exemplo. 

E você? Já pensou como seria decodificar o futuro? Como sempre, a Varsomics te explica! Inscreva-se na nossa newsletter e faça parte da família para não perder mais conteúdos geniais como esse! Até a próxima!

BIBLIOGRAFIA

SANGER, F. Sequences, sequences and sequences. Annual Review of Biochemistry.n. 57, p. 1-28, 1988.

SANGER, F. Determination of nucleotide sequences in DNA. Nobel Lecture. 1980.

GARCIA-SANCHO, M. The rise and fall of the idea of genetic information. Genomics, society and policy. v. 2, n. 3, p. 16-36, 2006.

HEATHER, J.M.; CHAIN, B. The sequence of sequencers: The history of sequencing DNA. Genomics. v. 107, p. 1-8, 2016.

SLATKO, B.E.; GARDNER, A.F.; AUSUBEL, F.M. Overview of Next-Generation Sequencing Technologies. Current Protocols in Molecular Biology. n. 122, v. 59, 2018.

TIPU, H.N.; SHABBIR, A. Evolution of DNA sequencing. Journal of the College of Physicians and Surgeon. n. 25, p. 210-215, 2015.

VERMA, M.; KULSHRESTHA, S.; PURI, A. Genome Sequencing. Methods in Molecular Biology. n. 1525, p. 3-33, 2017.

GARRIDO CARDENAS, J. et al. DNA Sequencing Sensors: An Overview.  Sensors. n. 588, v. 17, 2017.

JUNQUEIRA, L.C.; CARNEIRO, J. Biologia Celular e Molecular. 9ª ed. Rio de Janeiro – RJ: Gen, 2015.

MENCK, C. F. Genética Molecular Básica: dos genes aos genomas, 1ª ed. Rio de Janeiro – RJ: Gen, 2017.

GENOME. The cost of sequencing a human genome. National Human Genome Research Institute, 2021. Disponível em: <https://www.genome.gov/about-genomics/fact-sheets/Sequencing-Human-Genome-cost>. Acesso em: 23 mar. 2022.

Relacionados