T2T sequenciamento genoma humano completo

Genoma Humano Completo: de Telômero a Telômero

O consórcio T2T (telômero a telômero) teve o objetivo de sequenciar regiões do genoma humano ainda desconhecidas através de novas técnicas de sequenciamento. Entenda!

O Genoma Humano Completo foi possibilitado em 2022, quando especialistas o sequenciaram preenchendo inúmeras lacunas anteriormente existentes.

O genoma obtido em 2003 pelo Projeto Genoma Humano possuía indeterminações, ‘gaps’ em que as bases nitrogenadas presentes eram incorretas ou simplesmente faltantes. Para lidar com esse problema, pesquisadores do Telomere-to-Telomere Consorcium realizaram uma nova montagem, que inclui os 8% de dados faltantes no genoma de referência anterior.

Quer entender as limitações do genoma de referência anterior, como montar um genoma humano completo e quais as implicações disso? Acompanhe!

Limitações do genoma de referência hg38 (2013)

Cerca de 8% do genoma de referência obtido em 2013 (através do Genome Reference Consortium e intitulado GRCh38hg38) era composto por lacunas (gaps), especialmente em regiões heterocromáticas, como nos telômeros.

Este genoma de referência possui 151 Mpb não resolvidos, que se constituíam em lacunas genômicas distribuídas em regiões de ocorrência de duplicações segmentares, de rDNA e mesmo em posições subteloméricas. 

Mesmo em seu penúltimo patch, além das regiões não resolvidas, outras regiões eram modelos gerados computacionalmente, como era o caso dos arranjos de alfa satélites presentes em regiões centroméricas.

Em função das barreiras tecnológicas, tais lacunas eram comuns mesmo em genomas de referência, o que impedia que cientistas investigassem, com precisão, muitos processos importantes para o correto funcionamento da célula.

sequenciamento completo do genoma: representação de eucromatina e heterocromatina
Representação de heterocromatina e eucromatina em esquema

O que é o Telomere-to-Telomere Consortium (T2T)

Diante das imprecisões enfrentadas, cientistas de diversas instituições fundaram o Telomere-to-Telomere (T2T) Consortium. O objetivo do T2T era eliminar as lacunas presentes no genoma de referência disponível na época, inclusive no cromossomo X, utilizando as tecnologias recentes de sequenciamento de reads ultralongos.

As tecnologias de sequenciamento de terceira geração possibilitaram a  leitura de reads com mais de 1000pb e , desta forma, estes cientistas montaram um genoma humano sem lacunas, que abrange todos os cromossomos, com exceção do Y.

Genoma humano completo: como montar?

Os cientistas do consórcio T2T começaram selecionando uma linhagem de células de Mola Hidatiforme Completa (CHM), pois o genoma deste tipo de célula é formado com a perda do complemento materno e com a duplicação do complemento paterno em um estágio pós fertilização.

O sequenciamento deste genoma (de cariótipo 46, XX) foi realizado múltiplas vezes por shotgun, com o uso de diferentes tecnologias de sequenciamento:

  • 30x PacBio HiFi;
  • 120x Oxford Nanopore;
  • 100x Illumina PCR-Free seq.;
  • 70x Illumina Hi-C.

A montagem deste novo genoma de referência, chamado de T2T-CHM13, foi inicialmente realizada por grafos planos para montagem de alta resolução, construídos diretamente dos reads de alta fidelidade (HiFi). 

Posteriormente, este “rascunho” foi validado e polido. Para isso, os pesquisadores mapearam todos os reads obtidos a partir de cada um dos métodos de sequenciamento utilizados, permitindo que visualizassem e corrigissem erros. 

Sendo assim, após a realização de tais procedimentos, os integrantes do T2T Consortium obtiveram o primeiro genoma humano completo, ou seja. sem lacunas, o qual inclui montagens para todos os 22 cromossomos autossômicos e também para o cromossomo sexual X.

Genoma Humano completo em 2022: implicações

Um genoma humano de referência, sequenciado de telômero-a-telômero traz implicações substanciais para o entendimento e a representação genética de nossa própria espécie. Com isso, o T2T-CHM13 pavimenta o caminho para uma medicina personalizada mais robusta e também para melhores análises e edições genômicas.

Antes inviabilizadas por questões tecnológicas, respostas para perguntas importantes na genômica podem finalmente ser obtidas. Esse é o caso na investigação de duplicações segmentares, de sequências centroméricas e ribossomais e também de arranjos satélite.

O estudo de duplicações segmentares, por exemplo, viabiliza novas descobertas sobre desordens do neurodesenvolvimento, uma vez que a ocorrência recorrente destes rearranjos está implicada em condições como o autismo.

Próximos passos

Apesar da concretização de um grande feito para a genômica, algumas questões permanecem em aberto. Uma delas é o fato de que este genoma não inclui o cromossomo Y em virtude da natureza da linhagem celular utilizada (CHMs homozigóticas são inviáveis com o cromossomo Y).

Além disso, apesar do genoma em questão representar um haplótipo humano completo, ele não representa a totalidade da diversidade genética humana, o que pode gerar vieses durante sua utilização, por exemplo, na medicina genômica.

Para a solução do primeiro problema, os autores indicam que é possível buscar por uma linhagem celular obtida de um homem, para que o cromossomo Y seja sequenciado e suplementado ao genoma de referência.

Por fim, a demanda por um genoma de referência representativo já está sendo trabalhada pelos próprios autores do T2T-CHM13. Em conjunto com o Consórcio do Pangenoma Humano de Referência, os cientistas buscam construir uma coleção de haplótipos de referência de alta qualidade, derivada de múltiplas amostras.

Conclusão

Os esforços do Projeto Genoma Humano, bem como os do Consórcio do Genoma de Referência, trouxeram novas formas de olhar para a genética humana. Os genomas obtidos por esses projetos, entretanto, não demonstravam o genoma humano em sua totalidade. 

Mesmo o último patch do genoma de referência GRCh38 contém milhões de bases nitrogenadas representadas pela letra N, implicando o desconhecimento daquelas realmente ali contidas.

O genoma montado pelo Consórcio T2T trouxe 200 milhões de pares de bases “novas”, substituindo aquelas sequenciadas incorretamente ou simplesmente não sequenciadas. Com isso, pode-se predizer cerca de dois mil novos genes.

Este novo genoma de referência poderá solucionar questões complexas, como por exemplo aquelas envolvendo DNA satélite. Além disso, as implicações para a medicina genômica são extensas, incluindo-se aí a temática do autismo.

Referências

Nurk S et al. The complete sequence of a human genome. Science. 2022 Apr;376(6588):44-53. doi: 10.1126/science.abj6987.
Church DM. A next-generation human genome sequence. Science. 2022 Apr;376(6588):34-35. doi: 10.1126/science.abo5367.

Deixe um comentário

O seu endereço de e-mail não será publicado.

Relacionados