Algumas variantes genéticas ocorrem durante o splicing que é o processo de formação do mRNA, no qual os introns (região não codificante) são removidos e os exons (região codificante) são alinhados e ligados formando o mRNA (RNA maduro que será exportado para o citoplasma e traduzido em proteína). Neste processo, algumas anormalidades como pular exons ou reter introns são responsáveis por até 15% de todas as doenças hereditárias.
As doenças causadas por variações genéticas têm como foco da pesquisa as regiões codificadoras de proteínas. Porém, há uma grande parte não codificadora no genoma humano, que é funcional e pode ser relacionada com algumas doenças.
As regiões não codificadoras do genoma humano estão presentes em Domínios Topológicos Associados (TADs), que são domínios do cromossomo que apresentam alta interação. Portanto, o rearranjo estrutural que altera essa interação, resulta em um importante impacto na expressão gênica.
- 5’UTR e 3’UTR
Do inglês untranslated region, a região UTR são regiões não codificantes do mRNA (RNA mensageiroO). Sequencias flanquadoras localizadas no início e no final da sequência codificadora. A sequência UTR é transcrita em mRNA mas não é traduzida em proteína, apresentando papéis pós transcricionais como estabilidade do mRNA, auxílio na estrutura secundária e na tradução. Junto aos introns representam cerca de 35% do genoma humano e modificações podem causar impactos resultando em um mRNA alterado ou níveis de proteínas alteradas.
- Promotores
Junto aos enhancers são considerados elementos cis-reguladores, que estão espalhados em regiões não codificantes regulando a transcrição genética com o auxílio dos fatores de transcrição (TFs). Os promotores são regiões do DNA que recrutam TFs e RNA polimerase para iniciar o processo transcrição de um determinado gene. Poucas doenças mendelianas foram identificadas com variantes patogênicas em promotores, mas algumas alterações foram identificadas em genes de predisposição de câncer.
- Enhancer
Sequencias que regulam promotores em até 1Mb de distância que podem se ligar a proteínas que alteram os níveis de transcrição gênica. Alguns estudos de variantes nessa região mostram a alteração na ligação dos FTs resultando em expressão do gene alvo alterada. Além disso, como o enhancer pode interagir com mais de um promotor de genes, variantes de enhancer podem impactar a expressão de mais de um gene.
Entenda mais no texto: Enhancer: elemento genético associado a progressão de doenças
RNA não-codificante (ncRNA)
As moléculas de RNA que não são traduzidas em proteína são os ncRNA. Alterações nessas moléculas têm sido relatadas em estudos mostrando que a alteração da expressão está envolvida em doenças. Os ncRNAs ainda estão sendo identificadas e suas diversas funções dificultam os estudos.
Os ncRNAs podem ser:
- miRNA: são micro RNAs com comprimento entre 21 a 25 nucleotódeos que atuam como silenciadores pós-transcricionais, regulando a tradução.
- sRNA: pequenos RNAs não-codificantes com menos de 200 nucleotídeos que atuam como silenciadores de RNA.
- lncRNA: longos RNAs não-codificantes com mais de 200 nucleotídeos. Estão envolvidos em vários processos celulares como transcrição, organização da cromatina e processamento de RNA.
Repetições em tandem
Repetições em tandem são uma região com cópias de pequenas sequências de DNA posicionadas uma após a outra. Alterações nessas regiões podem ter efeitos como a modulação de transcrição e na arquitetura celular. Atualmente, é possível identificar alterações de repetições em tandem em várias doenças mendelianas, como: síndrome do X frágil, doença de Huntington e ataxia espinocerebelar. É importante ressaltar que a dificuldade de sequenciamento limita a detecção de variantes dentro das repetições em tandem e o avanço do sequenciamento pode superar esse tipo de problema.


Desafios e progressos das variantes genéticas
Muitos elementos funcionais são específicos de cada tipo de tecido e célula. Portanto, testar os tipos de células corretos que estão relacionadas ao fenótipo é essencial para esse tipo de estudo. Para uma grande proporção de variantes genéticas, é provável que muitas características são mediadas por vários tipos celulares.
Para muitos tipos de cânceres, o sistema imunológico apresenta papel fundamental no desenvolvimento do tumor. Nesse caso, é possível que algumas variantes de risco de câncer atuem especificamente nos tipos de células imunológicas, e não no tipo de célula do qual o tumor foi derivado.
As regiões não codificantes foram ignoradas por muitos anos, e é provável que outros elementos ainda sejam descobertos. Além disso, o impacto das variantes genéticas ainda precisa ser testado in vivo, o que oferece novos desafios. Como elementos não codificantes geralmente não são bem conservados, muitas vezes não é possível utilizar organismos modelos. Assim, estudos funcionais se limitam frequentemente a modelos derivados de humanos, como células cultivadas e modelos organóides.
A tecnologia baseada em CRISPR pode fornecer respostas para superar alguns desafios técnicos. Essa tecnologia identificou com sucesso elementos funcionais e variantes e as plataformas de edição já estão sendo projetadas para modificar os transcritos de RNA.
Métodos emergentes podem ajudar a descobrir o papel das variantes associadas a doenças em células selecionadas. A tradução dessas informações para a clínica é o objetivo desses estudos e com a diminuição do custo do sequenciamento, o WGS é apresentado como a próxima opção clínica, sendo necessário recursos para a interpretação dessas informações.
Variações de regiões não codificantes também podem ser importantes para redirecionar terapias medicamentosas novas ou já existentes. Vários projetos de sequenciamento, como o projeto 100.000 genomas, alimentam as descobertas de variantes, facilitando a catalogação mais precisa das variantes genéticas do genoma humano. O aumento dos estudos e da ligação entre variantes e fenótipos transformará a capacidade de entendimento de mecanismos, diagnósticos, descobertas e melhores tratamentos para doenças raras e comuns.
Referências bibliográficas
[1] CHATTERJEE, Sumantra; AHITUV, Nadav. Gene regulatory elements, major drivers of human disease. Annual review of genomics and human genetics, v. 18, p. 45-63, 2017. [2] FRENCH, J. D.; EDWARDS, S. L. The Role of Noncoding Variants in Heritable Disease. Trends in Genetics, 2020. [3] HANNAN, Anthony J. Tandem repeats mediating genetic plasticity in health and disease. Nature Reviews Genetics, v. 19, n. 5, p. 286, 2018. [4] KARNUTA, Jaret M.; SCACHERI, Peter C. Enhancers: bridging the gap between gene control and human disease. Human molecular genetics, v. 27, n. R2, p. R219-R227, 2018. [5] LAPPALAINEN, Tuuli et al. Transcriptome and genome sequencing uncovers functional variation in humans. Nature, v. 501, n. 7468, p. 506-511, 2013. [6] SAKHARKAR, Meena Kishore; CHOW, Vincent TK; KANGUEANE, Pandjassarame. Distributions of exons and introns in the human genome. In silico biology, v. 4, n. 4, p. 387-393, 2004. [7] SAKHARKAR, Meena Kishore; CHOW, Vincent TK; KANGUEANE, Pandjassarame. Distributions of exons and introns in the human genome. In silico biology, v. 4, n. 4, p. 387-393, 2004. [8] STERI, Maristella et al. Genetic variants in mRNA untranslated regions. Wiley Interdisciplinary Reviews: RNA, v. 9, n. 4, p. e1474, 2018. [9] TURNBULL, Clare et al. The 100 000 Genomes Project: bringing whole genome sequencing to the NHS. Bmj, v. 361, 2018.