Inovamos hoje para que você tenha um amanhã melhor.

GWAS: estudos de associação genômica ampla

Estudos de associação genômica ampla (GWAS) são métodos matemáticos que identificam associações entre regiões genômicas e traços fenotípicos

Os estudos de genética permitiram entender que diferentes características observadas nos organismos estão associadas ao nosso material genético. Com o avanço no conhecimento, novas ferramentas são desenvolvidas para desvendar os segredos do genoma. Uma das ferramentas que revolucionou a ciência nos últimos anos é conhecida como GWAS, sigla em inglês para estudos de associação genômica ampla. Esses estudos já permitiram identificar milhares de regiões do DNA associadas à susceptibilidade a doenças e ao entendimento de características genéticas complexas.

O que são GWAS?

Genome Wide Association Studies (GWAS) são métodos matemáticos que identificam associações entre regiões genômicas e traços fenotípicos e é utilizado principalmente no estudo de doenças.

Em suma, GWAS se baseia na hipótese de que um traço comum entre indivíduos está associado a uma variação genética comum entre estes indivíduos. Ou seja, esses estudos levam em consideração a similaridade genética entre indivíduos que dividem a mesma característica. Nesse sentido, certas variantes genéticas são encontradas com maior frequência em pessoas que apresentam o fenótipo do que pessoas que não apresentam.

Como GWAS funciona?

Para realizar o GWAS, primeiramente indivíduos são selecionados de acordo com a caraterística de interesse. Por exemplo, pessoas com Alzheimer, com depressão ou que desenvolveram algum tipo específico de câncer. Do mesmo modo, o estudo também pode ser realizado dentro de populações, como indivíduos de um determinado país, ou também entre familiares. Após selecionar o fenótipo desejado, o DNA dos indivíduos que apresentam a característica de interesse é comparado aos indivíduos que não apresentam, chamados de controle.

Uso de marcadores SNP em GWAS

A variação entre regiões genômicas no estudo de associação é analisada principalmente através de marcadores SNP, sigla em inglês para polimorfismo de nucleotídeo único, ou seja, alteração de um só nucleotídeo em uma sequência de DNA. Além de serem amplamente distribuídos pelo genoma, esses marcadores representam a maior colaboração para a variabilidade genética, em uma frequência de uma ocorrência a cada 1000 pares de base. SNPs são amplamente utilizados em diferentes organismos para identificar variantes de genes relacionados a doenças e outras características de interesse.

Principais técnicas de genotipagem

A genotipagem dos indivíduos analisados em estudos GWAS pode ser realizada em duas principais formas:

  • SNP Array: é uma técnica capaz de detectar alterações genéticas em todo o genoma em um único ensaio. Nesse método é realizada a hibridização de fragmentos de DNA de fita simples em matrizes (array) contendo centenas de milhares de sonda (probes) com sequencias exclusivas de nucleotídeos. Cada sonda é desenvolvida para se ligar a uma sequência alvo de DNA. Após a hibridização, é utilizado um equipamento que mensura a intensidade do sinal de cada sonda e seu DNA alvo. A intensidade do sinal depende da quantidade de DNA alvo na amostra e a afinidade entre o alvo e a sonda. Com esse ensaio é possível detectar duplicação ou deleção de nucleotídeos, variação no número de cópias gênicas (CNVs), entre outros.
  • Sequenciamento de genoma completo (WGS): técnica que sequencia o genoma completo dos indivíduos em um só ensaio. WGS permite maior quantidade de informação sobre o genoma do que SNP array.

Desequilíbrio de ligação

Independente da técnica de genotipagem utilizada, GWAS analisa até milhões de SNPs para encontrar regiões do genoma relacionados com uma doença ou outro traço importante. O sucesso do GWAS usando SNPs como marcadores genéticos em parte depende do Desequilíbrio de ligação (LD) como um conceito de população. LD é uma propriedade que se refere ao grau em que um alelo de um SNP é herdado ou correlacionado com um alelo de outro SNP dentro de uma população. LD é importante para GWAS, pois permite a identificação de marcadores genéticos que marcam as variantes causais reais para doenças humanas complexas.

Correções estatísticas

Como dito anteriormente, nesse estudo é esperado que variantes associadas a característica de interesse apareçam em maior quantidade no grupo de indivíduos que apresentam a característica do que o controle.

Os resultados obtidos no GWAS requerem rígidas correções estatísticas para evitar associações erradas entre variantes e as características. O P-value, por exemplo, indica a significância da diferença na frequência do alelo testado entre casos e controles, ou seja, a probabilidade de que o alelo esteja associado à característica. A seleção de um limiar (threshold) de significância estatística apropriada em GWAS é fundamental para diferenciar os verdadeiros positivos dos falsos positivos e falsos negativos.

Além disso, cada SNP gera uma razão de probabilidade (Oddis Ratio- OD), que representa o tamanho do efeito da variante para a característica, ou seja, quanto é o efeito do alelo sobre o fenótipo.

Na maioria dos casos, os resultados obtido em GWAS são demonstrados em um gráfico de Manhattan. Esse gráfico tem no eixo vertical (y) log10 do P-value e a posição dos SNPs (cromossomos) no eixo horizontal (x). Cada ponto representa um SNP analisado e os pontos mais altos, que estão acima do threshold, são referentes aos SNPs que são significantemente associados ao fenótipo analisado, chamados de hits.  

GWAS no estudo de câncer

Como GWAS é uma das ferramentas mais eficazes da atualidade para associar doenças a variantes, o método vem sendo amplamente utilizado para encontrar regiões do genoma que estão associadas com a susceptibilidade ao câncer. Alguns dos muitos exemplos de estudos que conquistaram resultados interessantes foram:Pulmão: Pesquisadores identificaram 18 regiões de câncer de pulmão nos quais múltiplas mutações gênicas (OFBC1 e RTEL1) associadas à função dos telômeros apresentam efeito na indução de adenocarcinoma de pulmão;

Fígado: 18 genes de susceptibilidade e 10 candidatos foram associados ao gene supressor de tumor TP53, relacionado

Pâncreas:  5 regiões de susceptibilidade a câncer de pâncreas foram identificadas. Esses genes desempenham um papel importante no desenvolvimento pancreático e na estabilidade ambiental do ácino pancreático e podem explicar os mecanismos subjacentes desses locais;

Câncer de mama: GWAS já identificaram mais de 100 regiões do genoma associadas a fatores de risco ao câncer de mama. Os genes C21orf58 e ZNF526, por exemplo, apresentam um importante papel no controle de crescimento de células cancerígenas de câncer de mama.

Limitações dos estudos de associação

Embora GWAS seja uma excelente ferramenta para identificar regiões associadas a importantes características, outras análises são necessárias para confirmar os resultados do estudo. Além disso, alguns parâmetros podem influenciar na eficácia dos resultados obtidos em GWAS. Por exemplo, algumas doenças muito prevalentes estão associadas a vários genes que causam baixo tamanho de efeito no fenótipo. Como cada gene representa um pequeno efeito, é necessário um grande tamanho amostral (casos e controles) para conseguir identificar as regiões associadas a doença.

Além disso, o controle da estratificação populacional em GWAS é outro importante parâmetro da metodologia. Isso porque, dependendo da diversidade populacional da amostragem, a diferença de frequência de alelos pode ser confundida com a ancestralidade genética. Em outras palavras, em uma amostragem que contêm diferentes populações, as variantes podem se destacar apenas pelo fato de serem populações diferentes e não por estarem associadas à característica de interesse.

Embora a amostragem com diferentes populações pode causar uma interpretação errada dos resultados, a diversidade genética da amostra é de extrema importância. A maioria dos estudos de GWAS divulgados foram realizados com indivíduos europeus sem a representação de outras populações. Quando o estudo é realizado com uma população muito homogênea, o resultado da associação pode não ser aplicado para outras populações.

Herdabilidade perdida

Com GWAS se tornou possível estimar a herdabilidade, ou seja, a proporção da variância genética em relação a fenotípica de características. Até então, o cálculo de herdabilidade era feito somente através do estudo de gêmeos, já em GWAS a estimativa é baseada nos SNPs. No entanto, GWAS explica muito pouco da herdabilidade em relação ao estudo de gêmeos. A parte não identificada da herdabilidade nos estudos genéticos é chamada de herdabilidade perdida. Várias são as hipóteses que procuram explicar o sumiço dessa informação, você pode conferir no texto: Herdabilidade perdida: Um mistério sem solução?

Em suma, GWAS representam um grande passo na procura por associações entre características genéticas e fenotípicas. Embora o método ainda apresente algumas limitações, GWAS permite identificar novas associações entre variantes e traços, permite um melhor entendimento do mecanismo biológico de diversas doenças, os dados obtidos nos estudos são facilmente compartilhados e além disso, possibilita o desenvolvimento de tratamentos personalizados e melhor manejo de pacientes.

Referências

Altmüller, J et al. “Genomewide scans of complex human diseases: true linkage is hard to find.” American journal of human genetics vol. 69,5 (2001): 936-50. doi:10.1086/324069

Barsh, Gregory S et al. “Guidelines for genome-wide association studies.” PLoS genetics vol. 8,7 (2012): e1002812. doi:10.1371/journal.pgen.1002812

Liang, Baiqiang et al. “GWAS in cancer: progress and challenges.” Molecular genetics and genomics : MGG vol. 295,3 (2020): 537-561. doi:10.1007/s00438-020-01647-z

Tam, Vivian et al. “Benefits and limitations of genome-wide association studies.” Nature reviews. Genetics vol. 20,8 (2019): 467-484. doi:10.1038/s41576-019-0127-1

Uricchio, Lawrence H. “Evolutionary perspectives on polygenic selection, missing heritability, and GWAS.” Human genetics vol. 139,1 (2020): 5-21. doi:10.1007/s00439-019-02040-6

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Relacionados