CNVs e seu papel para o genoma clínico

A genômica e o papel das CNVs no diagnóstico de doenças complexas: Entenda a função dessas variantes e as metodologias utilizadas.

A diversidade genética humana é composta por polimorfismos de bases únicas (SNPs), pequenas inserções e variantes deletérias, polimorfismos de pequenas repetições em tandem, inserções de elementos retrotransponíveis, variantes de inserção, e variantes no número de cópias (CNVs).

As CNVs são inserções e deleções em maior escala, e referem-se a diferenças na dosagem de segmentos genômicos, variando em tamanho de 1 kilobases (kb) para muitas megabases (Mb). Até recentemente, a maioria dos estudos genômicos tinha como foco principal a descrição de pequenas variantes, como as SNVs (Variação de nucleotídeo único), já que a detecção de CNVs era mais limitada. No entanto, devido ao seu tamanho, as CNVs abrangem mais bases que as SNVs e podem ter maior influência na expressão e estrutura de um determinado gene.

Por muitos anos, as CNVs foram analisadas pela metodologia de microarray cromossômico (CMA) partindo de uma alta resolução de detecção em comparação com metodologias de citogenética convencional. No entanto, o aumento significante da descoberta de alterações genômicas complexas possíveis necessita de testes que possam identificar simultaneamente alterações citogenéticas e SVs menores.

Recentemente, com os avanços nas metodologias de microarray e principalmente de sequenciamento genômico como as técnicas de NGS, as análises de CNVs têm sido amplamente realizadas na prática clínica através de testes como por exemplo o sequenciamento do genoma, do exoma, ou mesmo o sequenciamento de painéis específicos.

Como surgem as CNVs?

O nosso genoma é dinâmico, tanto entre gerações, quando durante a vida de um determinado indivíduo, e essas constantes movimentações podem levar ao surgimento de muitas variantes no nosso código genético.

As CNVs surgem a partir de variações estruturais que ocorrem no nosso genoma, podendo ser deleções, duplicações, inserções, ou ainda translocações e inversões não balanceadas. Todas essas alterações podem levar a perda ou ganho de segmentos genômicos, e daí o impacto significante das CNVs no nosso genoma.

Interessantemente, as CNVs podem ser um mecanismo de variabilidade entre indivíduos, já que elas são encontradas “espalhadas” entre o genoma de indivíduos saudáveis sem uma associação aparente com fenótipos de doenças. Dessa forma, as CNVs contribuem mais para a variabilidade entre indivíduos do que as SNVs e indels combinados, pensando em um total de números de pares de bases envolvidos.

O papel evolutivo e funcional das CNVs

Análises cada vez mais precisas para identificação de CNVs têm estimado que pelo menos 12% do genoma humano é alvo de variações no número de cópias. Apesar dos SNPs serem mais frequentes, pois afetam apenas um par de nucleotídeo, as CNVs são menos numerosas mas podem afetar porções enormes do DNA, representando uma porção significante do genoma.

Nem sempre é possível estabelecer uma relação direta entre CNVs e alterações do padrão de expressão gênica. No entanto, sabe-se que de fato as CNVs podem influenciar o RNA mensageiro e os níveis de expressão gênica,consequentemente afetando os fenótipos.

Além disso, as CNVs têm uma contribuição muito importante para a variação genética do genoma humano, auxiliando inclusive na genotipagem e possibilitando traçar perfis de ancestralidade a partir dos conjuntos de CNVs detectados em diferentes indivíduos.

CNVs e sua associação com doenças genéticas

Em média, um ser humano apresenta aproximadamente 1000 CNVs em todo o genoma, o que representa aproximadamente 4 milhões de pares de bases. Uma CNV pode envolver um ou múltiplos genes, e pode ser apresentada como um alelo recessivo ou dominante, que vai alterar a região codificante ou alterar a dosagem gênica.

Pelo menos dois modelos diferentes têm sido propostos para associação de CNVs com doenças. O primeiro envolve grandes variante, geralmente ganhos ou perdas de grandes porções do genoma), e que são individualmente raros na população (<1%) mas coletivamente corroboram para uma parcela da doença, como observado em muitos casos de doenças neurológias ou neurocognitivas. Já o segundo modelo envolve muitas cópias de famílias de genes, que podem sofrer alterações no número de copias e que sabidamente contribuem para a susceptibilidade a algumas doenças.

CNVs como deleções e duplicações têm sido reconhecidas como fonte de mutações em algumas doenças genéticas e síndromes. O papel patogênico das CNVs é conhecido desde a elucidação da etiologia da neuropatia Charcot-Marie-Tooth tipo 1. Apesar de serem descritas mutações pontuais em genes relacionados a doenças, hoje sabe-se que a grande maioria dos pacientes com doenças genéticas apresentam alterações no número de cópias ao invés de mutações pontuais, sugerindo que a frequência desses eventos de novo para esse tipo de alterações, e a prevalência populacional, diferem significantemente favorecendo os rearranjos cromossômicos.

Alguns bancos de dados, como o DECIPHER tem sido fundamentais para revelar as alterações genômicas estruturais envolvidas com alterações clínicas importantes, e aparentemente, um número considerável de doenças mendelianas podem ocorrer por causa de CNVs. Além disso, assim como as CNVs podem afetar traços relacionados a doenças monogênicas, também são susceptíveis de fundamentar a etiologia de doenças comuns como resultado da variação na dosagem gênica causada por esse tipo de variante.

É importante pensar que, devido a sua própria natureza, uma boa parte das CNVs estão relacionadas mais precisamente a consequências funcionais do que diretamente relacionadas a apenas uma doença ou traço genético específico.

ebook ngs - CNVs

Principais metodologias para detecção de CNVs

Arrays para detecção de alterações no número de cópias

As plataformas de microarray tem sido a principal abordagem na detecção e genotipagem de CNVs, inicialmente representadas pelas metodologias de hibridização genômica comparativa por array (CGH – comparative genomic hybridization) e SNP microarrays. Ambas as metodologias inferem perdas ou ganhos no número de cópias de segmentos genômicos em comparação a uma amostra ou população referência:

  • CGH array: plataforma baseada no princípio de hibridização comparativa de duas amostras marcadas (amostra teste e amostra referência) para os alvos desejados de hibridização. A razão do sinal emitido pelas sondas, em relação a amostra utilizada como referência, é utilizada para calcular um valor aproximado de número de cópias. Dessa forma, é fundamental ter uma amostra referência bem caracterizada para garantir a interpretação adequada do CGH array. A principal vantagem dessa plataforma é a disponibilidade de sondas de alta densidade, customizáveis de acordo com a necessidade do teste. Essa possibilidade tem levado ao amplo uso dessa metodologia para o diagnóstico clínico como padrão ouro para detecção de alterações do número de cópias, principalmente entre crianças com atraso do desenvolvimento.
  • SNP array: essa plataforma também é baseada em hibridização, com algumas diferenças em relação a tecnologia de CGH. A hibridização ocorre em uma amostra única por microarray, e a clusterização de cada sonda entre múltiplas amostras é mensurada, gerando razões logarítmicas para a intensidade das sondas para cada um desses clusters. Além disso, as plataformas de SNP array tem como vantagem o desenho de sondas específicas para diferenças de um único nucleotídeo entre sequências de DNA. As primeiras plataformas de SNP array demonstravam pouca cobertura de regiões de CNV, no entanto, ensaios recentes tem incorporado melhores critérios de seleção de SNPs para regiões complexas do genoma, melhorando a sensibilidade de detecção de CNVs. Dessa forma, muitos estudos tem utilizado uma abordagem diagnóstica envolvendo plataformas de CGH e SNP em combinação, para oferecer maior confiabilidade na detecção de CNVs.

Utilizando o sequenciamento de nova geração para detecção de CNVs

As metodologias de sequenciamento de DNA, especialmente o NGS, tem prometido revolucionar os estudos de detecção de CNVs, e possivelmente, substituir plataformas de array na detecção e genotipagem dessas variantes.

Testes como o sequenciamento do genoma completo (WGS) tem auxiliado significantemente na detecção e análise de CNVs, uma vez que essa metodologia permite uma leitura mais ampla do DNA, aumentando a amplitude de regiões sequenciadas e, portanto, conferindo maior capacidade de detecção de eventos estruturais que possam abranger grandes porções do genoma.

Apesar de promissor, o NGS para detecção de CNVs ainda requer importantes avanços, especialmente em relação aos desafios computacionais e de bioinformática para análise desses dados. Talvez, uma das questões principais para detecção de variantes estruturais é a origem do dado, uma vez que as sequências (reads) gerados pelas plataformas de NGS são consideravelmente menores.

Outra preocupação importante é a cobertura das sequências geradas, já que é fundamental que seja obtida uma alta cobertura para alcançar a sensibilidade e especificidade necessária na detecção de CNVs.

Inúmeros avanços têm sido feitos na busca pela otimização do NGS para detecção de CNVs. Algoritmos específicos estão sendo desenvolvidos, e que estão sendo capazes de detectar de maneira cada vez mais precisa e específica as CNVs. Uma das grandes vantagens da utilização dessa tecnologia é a possibilidade de detecção de uma enorme gama de variantes utilizando apenas uma metodologia.

O que concluir e esperar para os próximos anos?

As CNVs podem oferecer pistas muito importantes sobre o enigma das doenças genéticas complexas, já que essas variantes podem abranger genes ou elementos funcionais desses genes que causam predisposição a determinados fenótipos. A análise dessas variantes para detectar ganhos ou perdas genômicas é hoje amplamente recomendada para avaliação de indivíduos com doenças do neurodesenvolvimento e/ou anomalias congênitas.

O sequenciamento do genoma humano, e a busca por compreender cada vez mais a informação contida no nosso código genético e sua relação com o fenótipo, tem sido alvo de grandes investimentos nos últimos anos. Avanços importantes estão sendo feitos em grande velocidade, e a genotipagem de variantes estruturais já é possível em grande escala.

Hoje é possível compreender, por exemplo, que as CNVs são relativamente comuns na população como um todo, e que o padrão dessa variação é significantemente diferente em indivíduos com doenças neuropsiquiátricas e neurocognitivas.

A aplicação de metodologias de NGS para detecção de CNVs tem aumentado o espectro das variações genômicas estruturais conhecidas, e principalmente, a especificidade e a abordagem dinâmica oferecidas pelo NGS oferecem uma acurácia fundamental em termos de predição do número de cópias absoluto. Ainda há um longo caminho a ser percorrido, e a utilização na rotinia clínica de metodologias de array e NGS para detecção de CNV s vai cada vez mais expandir o conhecimento sobre os tipos de CNV s presentes no genoma, bem como a compreensão do seu impacto para a prática clínica.

Referências

  • Iafrate, A. J. et al. Detection of large-scale variation in the human genome. Nature Genet. 36, 949–951 (2004).
  • Sebat, J. et al. Large-scale copy number polymorphism in the human genome. Science 305, 525–528 (2004).
  • Sebat, J. et al. Strong association of de novo copy number mutations with autism. Science 316, 445–449 (2007)
  • Beckmann, J., Estivill, X. & Antonarakis, S. Copy number variants and genetic traits: closer to the resolution of phenotypic to genotypic variability. Nat Rev Genet 8, 639–646 (2007).
  • Miller, D. T. et al. Consensus statement: chromosomal microarray is a first-tier clinical diagnostic test for individuals with developmental disabilities or congenital anomalies. Am. J. Hum. Genet. 86, 749–764 (2010).
Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Relacionados