Short Tandem Repeats: regiões repetitivas do genoma

Entenda mais sobre as repetições em Tandem (STR) e como elas impactam os genes e a saúde humana.
SSR short tandem repeats

A repetição de segmentos do DNA está presente em todos os domínios da vida, podendo ocorrer de modo disperso (como em LINEs) e também de maneira sequencial. As repetições em sequência de até 6 pares de base são chamadas de Short Tandem Repeats.

Ficou interessado? Acompanhe para saber mais sobre como Short Tandem Repeats podem ser utilizadas na área forense e também quais são suas implicações na saúde humana!

O que são Repetições em Tandem?

Repetições em tandem são padrões de repetição sequencial de bases nitrogenadas, geralmente presentes em regiões não codificantes de um genoma. Estas repetições são utilizadas como marcadores moleculares em análises de parentesco e em análises forenses.

Uma curta sequência de nucleotídeos qualquer pode ser utilizada como um exemplo de repetição em tandem: GAG-GAG-GAG-GAG. Neste caso, o chamado motif é composto por três nucleotídeos, que se repetem quatro vezes em sequência.

O número de repetições em tandem é variável, bem como a quantidade de nucleotídeos repetidos (motif). Esta segunda característica é utilizada para classificar as repetições em tandem:

  • Repetições Curtas em Tandem (STR – Short Tandem Repeats): também chamados de microssatélites e Short Single Repeat (SSR), possuem motifs de 2 a 06 pares de base.
  • Repetições Maiores em Tandem: também chamados de minissatélites, possuem motifs com 07 a 100 pares de base.
  • DNA Satélite: cujos motifs são maiores que 100 pares de base.
Short tandem repeats - SSR exemplo

Short Tandem Repeats: implicações nos genes

As Short Tandem Repeats são um tipo de DNA repetitivo encontrado principalmente (~92%) em regiões não codificantes de um genoma. Apesar de serem mais comuns em eucariotos, as STR também são encontradas em menor escala em procariotos.

Um mesmo motif de STR pode se repetir até cem vezes e, no caso dos humanos, a soma destes microssatélites é responsável pela composição de aproximadamente 3% de nosso genoma.

Os loci formados por estas repetições são reconhecidos pelos cientistas como sendo regiões altamente polimórficas, com taxas de mutação de 10 a 100.000 vezes maiores do que aquelas encontradas em média no resto do genoma.

Além disso, uma vez que um indivíduo herda STRs de tamanhos diferentes de seu pai e de sua mãe, dificilmente dois indivíduos sem relações de parentesco terão repetições de tamanhos iguais no mesmo locus.

Uma vez classificados como inúteis do ponto de vista transcricional e como não exercendo funções biológicas, hoje os cientistas compreendem que a presença de Short Tandem Repeats serve não apenas como classificador populacional mas também como reguladores da transcrição de genes em sua vizinhança.

Por fim, os microssatélites também estão implicados na recombinação genética, no posicionamento do nucleossomo e também na organização espacial da cromatina.

A investigação de STRs na prática

A utilização de Repetições Curtas em Tandem encontra, muitas vezes, uma dificuldade relacionada ao método de sequenciamento. Em virtude de sua natureza repetitiva e altamente polimórfica, montagens genômicas podem sobrepor algumas destas sequências, acusando um número menor de STRs do que realmente existe naquele locus.

Apesar disso, a análise desta forma de DNA repetitivo é utilizada na prática forense como uma forma de rastrear indivíduos a partir do material genético deixado na cena do crime. Além disso, as STR estão implicadas em algumas doenças raras, inclusive de ordem neurodegenerativa.

Adicionalmente, as STRs são utilizadas como marcadores populacionais em diferentes áreas, como na microbiologia, na botânica e na zoologia.

Short Tandem Repeats (STR) e a perícia forense

Algumas pessoas podem imaginar que um banco de dados genético para fins forenses armazena o genoma completo (ou mesmo o exoma) de muitas pessoas, entretanto, esta não é a realidade. Para efeito de comparação, um genoma completo possui cerca de 3 bilhões de pares de base e o armazenamento de tantos dados seria altamente custoso.

Para contornar essa situação, pesquisadores desenvolveram formas de identificação genética de indivíduos a partir de uma quantidade muito menor de dados. Um exemplo disso é o Sistema Combinado de Índices de DNA (CODIS), desenvolvido pelo Departamento Federal de Investigação dos Estados Unidos, o FBI.

Este banco de dados de DNA utiliza STRs como alvos de amplificação. Atualmente, é empregada a análise de 20 loci nos quais as repetições estão presentes, o que permite que mais de 14 milhões de indivíduos possam ser identificados com um custo relativamente baixo.

Apesar disso, estes STRs são utilizados apenas como identificadores de um determinado indivíduo e, por estarem localizados em regiões não codificantes, eles não fornecem dados sobre características fenotípicas do investigado.

A implicação de Short Tandem Repeats(STR) na saúde humana

Com o desenvolvimento das tecnologias de Sequenciamento de Nova Geração na última década, pesquisadores puderam correlacionar a presença de algumas STRs em regiões codificantes com doenças humanas.

O trinucleotídeo CAG é traduzido no aminoácido Glutamina. A presença da Short Tandem Repeats de CAG em algumas regiões do genoma pode levar ao aparecimento das chamadas ‘doenças de poliglutaminas’ (PolyQ), geradas pelo excesso de aminoácidos Glu em determinadas proteínas.

Estas doenças são, em geral, de natureza neurodegenerativa, como é o caso da Coréia de Huntington e das Ataxias Espinocerebelares. A Coréia de Huntington é uma patologia monogênica, o que significa que a expansão desta STR (que é herdada) em um indivíduo até então saudável é suficiente para dar início à doença.

Além disso, uma vez que a maior parte das STRs estão localizadas em loci não codificantes, sua implicação na regulação da expressão de genes e também na modificação de histonas também é alvo de estudos. 

Apesar de não causarem doenças de maneira direta, a expansão de repetições presentes nestas regiões está correlacionada com o surgimento de doenças como a Distrofia Miotônica (motif CTG); a Ataxia de Friedreich (motif GAA) e Síndrome do X Frágil (motif CGG). 

Conclusão

Sequências repetitivas de DNA ocorrem de maneira difusa no genoma de organismos de todos os tipos. Uma das formas de repetição de sequências é a Repetição Curta em Tandem, também conhecida como microssatélite.

Tratada por muito tempo como uma figura secundária na construção da vida, as Short Tandem Repeats são, hoje, reconhecidas por suas funções como marcadores genéticos e também por estarem implicadas em diferentes doenças.

Dado seu caráter repetitivo, as implicações na saúde humana geradas por microssatélites ainda não são completamente elucidadas e, portanto, são objeto de profunda dedicação de muitos cientistas interessados por doenças raras. 

Referências

ALBERTS, B. et al. Biologia molecular da célula. 6. ed. Porto Alegre: Artmed, 2017.

WILLARD, H. et al. Thompson & Thompson genética médica. 8. Ed. Editora Guanabara, 2016.

SNUSTAD, P.; SIMMONS, M. J. Fundamentos de Genética. 7. Ed. Editora Guanabara, 2017. 

TØRRESEN, O.K. et al. Tandem repeats lead to sequence assembly errors and impose multi-level challenges for genome and protein databases. Nucleic Acids Res. 2019 Dec 2;47(21):10994-11006. doi: 10.1093/nar/gkz841.

TANG, H. et al. Profiling of Short-Tandem-Repeat Disease Alleles in 12,632 Human Whole Genomes. Am J Hum Genet. 2017 Nov 2;101(5):700-715. doi: 10.1016/j.ajhg.2017.09.013. 

JAKUBOSKY, D. et al. Discovery and quality analysis of a comprehensive set of structural variants and short tandem repeats. Nat Commun 11, 2928 (2020). https://doi.org/10.1038/s41467-020-16481-5

FAN H.; CHU J.Y. A brief review of short tandem repeat mutation. Genomics Proteomics Bioinformatics. 2007 Feb;5(1):7-14. doi: 10.1016/S1672-0229(07)60009-6.

Relacionados