Índice
A diversidade genética é uma característica importante da evolução das espécies, bem como um fenômeno que observamos diariamente ao olharmos para outras pessoas. Além das diferenças físicas que a diversidade genética traz para os seres humanos, ela também traz consigo uma enorme gama de questões de saúde.
Por isso, entender particularidades presentes em indivíduos de diferentes ancestralidades é importante para entendermos a saúde humana em toda sua complexidade.
Ficou interessado? Entenda o que é a diversidade genética e qual sua relevância para os estudos genômicos e para a compreensão de nossa saúde.
O que é a diversidade genética?
A diversidade genética é entendida como a combinação das variações existentes no material genético de uma espécie. Em outras palavras, a diversidade genética é a extensão com que o genótipo de indivíduos da mesma espécie varia.
Em seres humanos, a diversidade genética é marcadamente observada em traços como, por exemplo, a cor dos olhos, do cabelo e nos padrões de nossas digitais.
Outros fenótipos, entretanto, também compõem a diversidade genética humana, sendo alguns deles implicados em questões relativas à saúde, como é o caso dos genes do HLA e daqueles que constituem riscos poligênicos.
Além das implicações físicas e fisiológicas, a diversidade genética é uma característica essencial para a evolução das espécies, permitindo que traços diversos sejam selecionados com base nas melhorias adaptativas que proporcionam aos seres.
Uma adequada representação desta diversidade genética em estudos genômicos é imprescindível, portanto, para o entendimento genético das características acima nos diferentes populações.
Como é o genoma de referência atual?
O atual genoma humano de referência (GRCh38) foi construído a partir de um número limitado de genomas (mosaico), todos originários de uma mesma localidade nos Estados Unidos. Além disso, cerca de 70% de todo este genoma advém de um único indivíduo.
Sendo assim, é evidente que este genoma não representa a diversidade genética existente na população humana, de tal forma que muitas sequências únicas são encontradas em múltiplos indivíduos, mas não são capturadas pelo genoma de referência.
Variantes podem ocorrer em toda a extensão do genoma, entretanto, algumas delas estão presentes em regiões codificantes. Isso significa que a anotação funcional destes genes pode ser afetada, levando-nos a crer que determinado gene desempenha um papel diferente daquele que possui de fato.
Adicionalmente, algumas regiões do genoma humano são repetitivas (como o DNA satélite) e altamente variáveis. Consequentemente, a configuração dessa variação tende a não ser corretamente refletida quando o genoma a ser analisado é sequenciado por leituras curtas e alinhado com o genoma de referência.
Por fim, é importante ressaltar que, embora o genoma GRCh38 sofra constantes atualizações para que gaps e erros sejam corrigidos, estas atualizações não lidam com a questão da falta de diversidade genética representada por ele.
Falta de diversidade genética na ciência
Apesar do genoma humano de referência concentrar boa parte da problemática da falta de representação da diversidade genética, uma segunda questão deve ser conjuntamente trabalhada para solucionar o problema como um todo.
Um estudo recente, publicado por Fatumo e colaboradores, indica que mais de 85% dos estudos genômicos foram conduzidos sob a óptica de genomas provenientes de indivíduos com descendência européia.
Além disso, grande parte dos estudos conduzidos com indivíduos que não aqueles de descendência européia são realizados com o genoma de populações que passaram por diásporas.
Um exemplo disso é encontrado nos estudos com indivíduos de ancestralidade africana (que representam menos de 2% dos estudos genômicos), nos quais a maioria dos participantes são afro-americanos, muito embora a população da África represente quase 20% da população global.
Este problema, entretanto, não se restringe apenas a esses indivíduos, uma vez que um cenário não muito diferente é observado com latino-americanos, asiáticos e com populações da Oceania.
As implicações trazidas por essa perspectiva são diversas e bem documentadas por muitos autores, que descrevem um panorama de mudanças lentas e que recebem menos atenção do que o necessário.
Como a baixa diversidade dos estudos genômicos afeta a medicina de precisão?
Os estudos de associação genômica ampla nos revelam que todos os seres humanos possuem algum risco genético de desenvolver determinadas doenças. E é a partir deste tipo de estudo que associações entre variações no genoma e risco de desenvolvimento de doenças podem ser feitas.
Com a baixa representação da diversidade genética, entretanto, a habilidade dos cientistas de compreender a arquitetura genética das doenças humanas em diferentes grupos populacionais fica limitada, o que pode gerar vieses clínicos.
Se, por um lado, algumas doenças possuem uma relação causal genética que se aplica de maneira universal a todos os seres humanos, por outro sabe-se que doenças poligênicas afetam indivíduos diferentes de maneiras e relações genéticas distintas.
Consequentemente, a sub-representação genômica de indivíduos de diferentes ancestralidades levanta preocupações éticas e práticas sobre as excelentes oportunidades que a medicina genômica pode oferecer para estas populações.
Isto é especialmente relevante para casos em que a frequência alélica é variável entre pessoas com diferentes descendências.
Um exemplo disso é observado com genes de fibrose cística. Esta doença mendeliana é associada com o gene F508del em 70% dos casos em europeus, enquanto em indivíduos da diáspora africana este gene está atrelado a menos de um terço dos casos da doença.
Diversidade genética brasileira
Recentemente, Naslavsky e colaboradores investigaram a possibilidade de que indivíduos brasileiros com ancestralidades diferentes pudessem ter frequências diferentes de anotação de variantes patogênicas.
A partir de um conjunto de dados do sequenciamento de genoma completo de aproximadamente 1.100 indivíduos, os pesquisadores descobriram ser quase 3 vezes menos provável que uma anotação de variantes associadas com perda de função gênica aconteça para indivíduos sem ancestralidade europeia.
Estas anotações não foram avaliadas pelos pesquisadores e acredita-se que a maior parte delas não seja deletéria. Apesar disso, o estudo é um passo importante no entendimento da variação de correlação entre genomas de ancestralidades mistas (uma realidade no Brasil) e a proporção com que variantes patogênicas são anotadas.
Como melhorar a representação da diversidade genética humana na ciência?
A inclusão de indivíduos com ancestralidades diferentes nos estudos genômicos é uma medida que ajuda a refletir a diversidade genética presente nos seres humanos e também a aprimorar as habilidades de cuidado da medicina personalizada.
A estratificação de risco genético é uma parte importante dessa estratégia da medicina. Desse modo, a representação adequada das diferentes populações é crucial para que a identificação de variantes de risco seja feita de maneira precisa.
Para ajudar a resolver este problema, muitos cientistas têm trabalhado em cima deste tema. Um exemplo disso é o Projeto Pangenoma Humano, que busca construir um pangenoma humano de referência, capaz de compreender melhor a diversidade genética global.
Incluem-se também entre os projetos com esse mesmo objetivo::

Por fim, é importante ressaltar a relevância de estudos que investigam doenças raras e outras manifestações genéticas em populações sub-representadas nos estudos genômicos, mesmo que a lidar com a questão da diversidade não seja seu objetivo primário.
Conclusão
A diversidade genética é a soma das diferentes características apresentadas pelos genomas de seres da mesma espécie. Ela é responsável pelas peculiaridades físicas encontradas em todos os seres humanos e também por melhorias adaptativas selecionadas ao longo da existência da espécie.
O atual genoma de referência humano é um mosaico construído a partir de poucos indivíduos, todos advindos de uma mesma localidade. Além de conter variantes pouco presentes na maior parte da população, ele não é capaz de refletir a diversidade genética humana, afinal de contas, trata-se de um único genoma.
Outro problema encontrado pela ciência diz respeito à baixa representação de indivíduos não europeus em estudos genômicos. Até o ano de 2021, somente 15% de todos os estudos genômicos envolviam indivíduos de outras regiões, embora a população européia represente cerca de apenas 10% da população mundial.
Lidar com essa questão é um passo imprescindível para melhorar a compreensão dos seres humanos como um todo e também para melhorar a nossa habilidade de analisar genomas e quantificar riscos genéticos. Consequentemente, esta é uma questão que concerne à comunidade científica e aos profissionais de saúde que trabalham com medicina de precisão.
Referências
Sirugo G, Williams SM, Tishkoff SA. The Missing Diversity in Human Genetic Studies. Cell. 2019
Fatumo S. et al. A roadmap to increase diversity in genomic studies. Nat Med. 2022
Hindorff, L. et al. Prioritizing diversity in human genomics research. Nat Rev Genet 19, 175–185. 2018
Wong, K.H.Y. et al. Towards a reference genome that captures global genetic diversity. Nat Commun. 2020
Bentley, A.R.; Callier, S.; Rotim,i C.N. Diversity and inclusion in genomic research: why the uneven progress? J Community Genet. 2017
Yang, X. et al. One reference genome is not enough. Genome Biol 20, 104. 2019
Ballouz, S., Dobin, A.; Gillis, J.A. Is it time to change the reference genome?. Genome Biol 20, 159. 2019
Naslavsky, M.S. et al. Biased pathogenic assertions of loss of function variants challenge molecular diagnosis of admixed individuals. Am J Med Genet C Semin Med Genet. 2021