Pangenoma: o futuro do genoma de referência

O Pangenoma é uma representação da coleção de sequências genômicas encontrada em toda uma espécie ou uma população. Entenda!
capa ilustrativa de pessoas compondo a representação de uma molécula de DNA - pangenomica

Na busca por uma visão integrada dos diferentes genomas de uma espécie, a genômica oferece uma solução: o Pangenoma, uma representação da união de coleções genômicas de uma espécie ou população, que inclui genes compartilhados, genes acessórios e genes únicos.

Ficou curioso? Acompanhe nosso texto para entender melhor o que é a pangenômica, quais são as partes de um pangenoma e como um pangenoma humano pode ser construído!

O que é pangenômica e pangenoma?

A pangenômica é a área da genética que estuda a coleção de todas as sequências de DNA disponíveis em um clado, que é normalmente segmentado por uma espécie. A representação de toda a coleção de sequências genômicas encontradas em uma população ou espécie é chamada de Pangenoma.

O pangenoma da bactéria Escherichia coli, por exemplo, corresponde ao conjunto de todos os genomas existentes (e disponíveis) entre as várias cepas desta mesma espécie.

O termo foi utilizado pela primeira vez em 2005 por Tettelin e colaboradores durante o sequenciamento do genoma de diferentes sorotipos de Streptococcus agalactiae que, na época, era a principal causa de infecções neonatais no Reino Unido.

Na busca por uma vacina, estes pesquisadores acabaram por confrontar a definição taxonômica de “espécie microbiana” existente naquele momento, que era provinda da década de 1980, uma era pré-genômica.

A definição da época propunha que microrganismos que tivessem o material genético idêntico em mais de 70% da sua totalidade deveriam ser considerados pertencentes à mesma espécie

Entretanto, com a obtenção de um pool gênico, entendeu-se que diferentes microrganismos, pertencentes à mesma espécie, devem compartilhar o chamado “genoma core”.

Quais são as partes de um pangenoma?

As partes de um pangenoma são: core, shell e cloud. O genoma core é a porção genômica compartilhada por todos os organismos de uma mesma espécie. Nele, estão contidos genes responsáveis pelo metabolismo e pelas características fenotípicas mais importantes.

Por sua vez, o genoma shell é identificado como a porção do pangenoma compartilhada por alguns dos genomas sequenciados, mas não por todos. Os genes contidos no genoma shell são também conhecidos como ‘genes acessórios’, que muitas vezes apresentam-se agrupados sob a forma de ilhas genômicas.

Estes genes acessórios podem conferir vantagens adaptativas (e geralmente o conferem quando são preservados por muitas cepas diferentes), abrindo a possibilidade de ação de novas vias bioquímicas e também funções adicionais àquelas executadas pelos genes do genoma core.

O genoma cloud, por sua vez, contém genes únicos. Dessa forma, estes genes estão contidos em apenas um dos genomas que compõem o pangenoma e, semelhante àqueles presentes nos genomas shell, são chamados de “genes dispensáveis”. 

partes do pangenoma - esquema ilustrativo da composição do tema

Pangenomas abertos e fechados

Além das definições acima, um pangenoma pode ser classificado como aberto ou fechado. 

Um pangenoma aberto é caracterizado pela grande quantidade de novos genes adicionados ao pangenoma quando um novo genoma é sequenciado. Em outras palavras, um pangenoma aberto tende a crescer à medida que novos genomas são adicionados ao pangenoma.

Isso é particularmente observável entre bactérias da mesma espécie capazes de colonizar diferentes meios e de trocar material genético com relativa facilidade. Bactérias do gênero Streptococcus sp. e também E. coli são exemplos de microrganismos cujo pangenoma é aberto.

Por outro lado, um pangenoma fechado é definido pela baixa quantidade de genes extras a serem adicionados ao pangenoma quando um novo genoma é sequenciado. Ou seja, o número de novos genes tende a zero conforme novos genomas são adicionados ao pangenoma.

Um pangenoma humano?

No contexto da genômica humana, o pangenoma representa a coleção dos genomas de uma espécie, ao invés da união de todos os genomas dela.

Os seres procariontes, como as bactérias, em geral têm cerca de 90% do seu genoma composto por genes. Por outro lado, as células eucariontes, como as dos humanos, tendem a conter uma proporção de genes muito menor: no caso do ser humano, cerca de 2% de seu DNA corresponde a regiões exônicas.

Dessa forma, o sequenciamento exclusivamente de regiões exônicas forneceria pouca informação sobre as diferenças existentes entre uma mesma espécie.

Por isso, além do genoma core e dos genes acessórios e únicos (no contexto da genômica humana chamados de “singletons”), os autores da área costumam fazer menção também às regiões intergênicas, responsáveis pela maior parte da variabilidade encontrada nos genomas de seres eucariontes. 

No último ano, Wang e colaboradores têm trabalhado na construção de um pangenoma humano de referência. Em adição ao recém construído genoma humano de referência telômero-a-telômero, estes pesquisadores objetivam um feito semelhante, porém com milhares de haplótipos observados em 26 regiões diferentes do planeta.

Sendo assim, o Human Pangenome Reference Consortium (HPRC) trará novas perspectivas sobre a identidade genética das diferentes populações humanas, elevando a medicina de precisão a um novo patamar.

(Texto escrito em 23 de agosto de 2022).

O primeiro Pangenoma Humano

Em maio de 2023 os cientistas do Consórcio de Referência do Pangenoma Humano publicaram o primeiro rascunho de um pangenoma humano, que contempla, até o momento, os genomas de 47 pessoas. Os indivíduos cujos genomas foram sequenciados vêm da África, das Américas, da Ásia e Europa (um judeu ashkenazi).

Em linhas gerais, este pangenoma contem montagens diplóides em fase, obtidos por meio de estudos de coorte. Estes estudos deram origem a assemblies que cobrem mais de 99% dos genomas sequenciados e que foram alinhados de tal forma a gerar um rascunho daquilo que virá a se tornar um pangenoma humano, com informação genômica de 350 pessoas.

Adicionalmente, os autores identificaram novos 119 milhões de pares de bases de sequências polimórficas em relação ao atual genoma de referência (GRCh38), dos quais 90 milhões derivam de variações estruturais. Como resultado, ao empregar o rascunho de pangenoma na análise de dados de reads curtos, os pesquisadores do consórcio identificaram uma redução de 34% nos erros de descoberta de variantes pequenas, além de um aumento de 104% de variantes estruturais detectadas por haplótipo.

A descoberta de novos alelos em loci complexos, por fim, é uma pequena demonstração do poder de um pangenoma. Ao final do projeto, espera-se que o pangenoma estruturado pelos pesquisadores sirva como uma vasta referência de dados para futuras descobertas na genômica e na medicina de precisão, de forma mais igualitária para as pessoas de diferentes regiões do planeta.

Conclusão

A pangenômica é a área da genômica interessada em abordar o repertório inteiro de genomas disponíveis em um clado, no qual o ancestral comum normalmente pertence à própria espécie investigada.

O pangenoma é composto por um genoma compartilhado entre todos os genomas investigados, chamado de genoma core. Além disso, o pangenoma também é composto por genes acessórios, presentes em apenas alguns genomas, e também genes únicos, presentes no genoma de seres individuais.

Conforme novos genomas são adicionados ao pangenoma, ele acaba por ser classificado entre aberto ou fechado. Um pangenoma aberto é caracterizado pelo grande número de novos genes adicionados a ele conforme novos genomas são incorporados.

Normalmente descrito dentro do contexto procarionte, novas pesquisas tratam de elaborar a construção de um pangenoma de referência humano, o que trará maior representatividade das diferentes populações humanas para a medicina personalizada.

Referências

Sherman RM, Salzberg SL. Pan-genomics in the human genome era. Nat Rev Genet. 2020

Tettelin H, Medini D, editors. The Pangenome: Diversity, Dynamics and Evolution of Genomes [Internet]. Cham (CH): Springer; 2020

Tettelin H et al. Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: implications for the microbial “pan-genome”. Proc Natl Acad Sci U S A. 2005

Relacionados