Índice
Algumas heranças genéticas são capazes de desenvolver doenças em 100% de seus portadores, como é o caso da Coréia de Huntington. Por outro lado, muitas das patologias observadas em nosso dia-a-dia, como o Diabetes Tipo II, são resultado de múltiplas variantes genômicas interagindo com o ambiente no qual o indivíduo está inserido.
Você sabia que o risco proveniente destas variantes genômicas pode ser calculado? Entenda a diferença entre doenças monogênicas, poligênicas e o que é o Escore de Risco Poligênico!
Qual a diferença entre doenças monogênicas e poligênicas?
Doenças monogênicas são causadas pela variação patológica de um único gene normal, enquanto as doenças poligênicas são geradas pela interação do ambiente com múltiplas alterações herdadas por um genoma.
Heranças monogênicas, também conhecidas como heranças mendelianas, são adquiridas por cromossomos autossômicos e possuem grande relevância clínica.
Um de seus exemplos patológicos mais marcantes é o de Coréia de Huntington, uma doença autossômica dominante na qual a repetição excessiva do códon CAG no Gene de Huntington leva à formação de uma proteína irregular.
Entretanto, a herança monogênica sozinha não é capaz de explicar a complexidade da herança genética como um todo. A estatura de um indivíduo, por exemplo, não é resultado de um “gene da altura”, mas sim de uma mistura complexa de heranças.
Leia o artigo: Herdabilidade perdida: Um mistério sem solução? para entender mais sobre este fenômeno.
Heranças e doenças poligênicas
A totalidade das diferenças anatômicas e fisiológicas observadas numa população não pode ser explicada de maneira monogênica.
Tomemos a íris como exemplo: suas cores não são definidas por um “gene do olho verde” ou um “gene do olho castanho” e sim pelas diferenças genômicas de diferentes indivíduos. Sendo assim, a cor dos olhos de um indivíduo é um traço fenotípico poligênico.
A herdabilidade (e, consequentemente, o desenvolvimento) de patologias de origem monogênica, como a Coréia de Huntington, pode ser calculada através do mesmo raciocínio desenvolvido por Gregor Mendel ao estudar ervilhas.
Entretanto, no caso de doenças de origem poligênica (também chamadas de multifatoriais), a herdabilidade de variantes genômicas não pode ser tão facilmente traduzida como risco absoluto de desenvolvimento da patologia.
Isso acontece porque a contribuição de dois alelos diferentes para o desenvolvimento de uma mesma doença não é idêntica, sendo necessário que o risco oferecido por um alelo específico seja especificamente quantificado.
Por fim, o ambiente em que vivemos também é capaz de regular a expressão de nossos genes. Isto torna o desenvolvimento de doenças multifatoriais uma soma entre riscos derivados do ambiente e riscos provenientes de variações genômicas.


Risco poligênico
Estudos Genômicos de Associação Ampla (GWAS) permitiram que pesquisadores elucidassem “as proporções da variação fenotípica que podem ser explicadas pela variação genética”, reforçando a noção de que a proporção com que diferentes variantes genéticas contribuem para um determinado fenótipo pode ser calculada a fim de se estimar um risco.
Sendo assim, o tratamento dos dados obtidos em tais estudos viabiliza a associação entre grupos de pessoas com a mesma doença e as variações genômicas mais presentes nessas pessoas quando em comparação com um grupo controle (estudo de caso-controle).
Por exemplo, cerca de 60 variantes genômicas já foram identificadas por cientistas e implicadas no risco de desenvolvimento da Doença Arterial Coronariana (DAC). Isso significa que, nas populações portadoras de DAC estudadas, estas variantes genômicas foram encontradas com maior frequência quando em comparação com a população geral.
A susceptibilidade de um indivíduo ao desenvolvimento de uma doença em função de suas variações genômicas é chamada de Risco Poligênico. Uma das maneiras mais comuns de mensuração de riscos poligênicos é através do Escore de Risco Poligênico.
Escore de risco poligênico
Um Escore de Risco Poligênico é uma pontuação comparativa, obtida a partir do conjunto de variantes de risco associadas com alguma doença. Ou seja, ele mede a susceptibilidade genética de um indivíduo a uma certa condição.
Em outras palavras, um PRS é um valor numérico, capaz de estimar o risco genético de desenvolvimento de um determinado traço por parte de um indivíduo. Como veremos na sequência, este valor é obtido pela soma dos tamanhos de efeito dos alelos de risco deste indivíduo.
A obtenção deste valor numérico é realizada pela soma do número de alelos de risco, aos quais são atribuídos pesos em função da extensão de seus efeitos (soma ponderada).
Embora o conceito de Escore de Risco Poligênico não seja novo, seu estudo ganhou força em 2018, quando pesquisadores do MIT e da Universidade de Harvard desenvolveram algoritmos capazes de combinar diferentes dados obtidos em Estudos de Associação Genômica Ampla (ou GWAS na sigla em inglês).
Esta combinação de dados se mostrou eficiente em um estudo subsequente realizado pelo mesmo grupo de cientistas. Ao empenharem seu algoritmo na análise de dados genéticos de aproximadamente 300.000 pessoas, eles identificaram um risco três vezes maior de desenvolvimento de Doença Arterial Coronariana em 8% da população estudada.
Um segundo aspecto relevante do Escore de Risco Poligênico é o de que ele é capaz de calcular riscos relativos e riscos absolutos. Lembre-se: doenças multifatoriais desenvolvem-se a partir de mecanismos complexos, não restritos à simples presença ou ausência de certas variantes genéticas.
Então, se por um lado podemos quantificar riscos em função de variantes genéticas previamente associadas com estados patológicos, por outro não é possível fazer cálculos de risco semelhantes para outros aspectos da vida do sujeito, como sua alimentação, por exemplo.
Por exemplo, dois indivíduos com idades diferentes (e inseridos em ambientes diferentes) que possuam o mesmo escore para uma determinada doença, provavelmente terão diferentes histórias naturais da doença caso ela apareça.
Como calcular o Escore de Risco Poligênico (PRS)?
O Escore de Risco Poligênico para um determinado fenótipo é calculado somando-se dados relativos ao tamanho do efeito de cada uma das variantes encontradas, bem como o número de cópias de cada uma dessas variantes genéticas.
Além de indicar se há significância estatística na associação entre as variantes genéticas estudadas e a doença, os Estudos de Associação Genômica Ampla também fornecem informações sobre o tamanho do efeito dessas variantes.
Em outras palavras, eles informam sobre a força da influência de determinadas variantes genéticas no surgimento de uma doença, calculando uma estatística conhecida como razão de chances (odds ratio, OR em inglês).
Após a descoberta inicial, os dados acima devem ser validados, o que envolve encontrar resultados semelhantes em uma nova amostra, ou seja, em indivíduos diferentes daqueles estudados previamente.
Com isso, é possível avaliar o poder de predição do PRS para um determinado traço.
Vejamos agora, na prática, como calcular o PRS de um indivíduo qualquer. Vamos supor que Ana esteja interessada em conhecer seu risco pessoal de desenvolver Doenças Cardiovasculares.
O primeiro passo é o sequenciamento genético. A partir dele, é possível identificar o conjunto de variantes genéticas associadas ao desenvolvimento de Doenças Cardiovasculares presentes no genoma de Ana.
Com este conjunto de dados em mão, a seguinte equação pode ser empregada:


Onde: N é o número de variantes genéticas empregadas na soma; Bi é o tamanho do efeito da variante i segundo um GWAS prévio; NCiAna é o número de cópias da variante i encontradas no genoma de Ana.
O somatório deve ser aplicado para todas as variantes genéticas, presentes no genoma de Ana, que conhecidamente afetam o risco de desenvolvimento de Doenças Cardiovasculares (somatório dos termos). O resultado final é o próprio PRS de Ana para o traço investigado.
É importante notar que esta equação não leva em consideração parâmetros que podem ser fundamentais para a interpretação do PRS, como a idade, por exemplo.
Estes parâmetros trazem novas camadas de complexidade para o cálculo e podem ser adicionados à equação, desde que tenham sido explorados durante a realização do GWAS que produziu a lista de variantes cujos alelos são usados no cálculo.
Por fim, os Escores de Risco Poligênico são normalmente calculados para indivíduos, entretanto, é possível inferir o Escore de Risco Poligênico populacional para uma determinada condição através de estudos de coorte.
Nestes casos, são encontrados thresholds que podem ser utilizados para sinalizar que um indivíduo possui um risco maior para o desenvolvimento de uma determinada doença quando em comparação com a média populacional.
Conclusão
O desenvolvimento de uma doença poligênica não pode ser explicado de maneira tão linear quanto a de uma doença monogênica em virtude de sua natureza multifatorial.
Não apenas a variação genômica existente na população gera sinais de risco complexos, mas o ambiente no qual um indivíduo está inserido também produz efeitos sobre o surgimento de doenças monogênicas.
Para agregar informações de risco obtidas a partir da comparação caso-controle do genoma de indivíduos saudáveis e de indivíduos acometidos por determinada doença, cientistas inventaram o Escore de Risco Poligênico.
O Escore de Risco Poligênico é uma pontuação obtida pela soma ponderada de dados acerca de variantes genômicas e pode indicar a suscetibilidade de um indivíduo ao desenvolvimento de determinadas patologias.
Em uma população, este Escore é distribuído de maneira normal, de tal forma que a maior parte dos indivíduos possui um risco próximo da média.