rna-seq

RNA-seq: ferramenta para estudos de expressão gênica

O RNA-seq é uma técnica que analisa padrões da expressão gênica através do sequenciamento de larga escala do RNA presente em uma amostra.
Ouça esse conteúdo

Embora os estudos genéticos através do sequenciamento do genoma ou exoma forneçam importantes informações sobre as regiões gênicas dos organismos, é necessário também entender a função destes genes nas células. O RNA-seq é uma ferramenta que possibilita a análise da expressão dos genes nas células ou tecidos, oferecendo assim dicas importantes sobre seu funcionamento.

O papel do RNA na síntese de proteínas

O genoma dos organismos contém sequências de DNA, moléculas que possuem a informação necessária para a síntese de proteína que realizam diferentes funções nas células.

Saiba mais em: Genética: o que é o DNA, o genoma e o que são genes?

Para que a síntese de proteína aconteça, ocorre um processo chamado de transcrição, em que uma molécula de RNA é sintetizada a partir das informações contidas neste DNA. Neste processo, a cadeia simples de RNA (RNA mensageiro- RNAm) sintetizada, possui sequência complementar a sequência de DNA de qual foi transcrita. Ou seja, quando um gene é expresso para produzir uma proteína, uma sequência de RNA com as informações genéticas complementares à sequência do gene é sintetizada.

O RNAm é a molécula responsável por carregar a informação, codificada pelo gene, para a síntese de uma proteína. Porém, além do RNAm outros tipos de RNA participam deste processo como o

  • RNA polimerase (RNAp), que auxilia na síntese de RNA,
  • RNA transportador (RNAt), responsável por transportar aminoácidos e
  • RNA ribossômico (RNAr), principal constituinte dos ribossomos, organela onde ocorre a síntese da proteína.

Em humanos e outros organismos, praticamente todas as células contém a mesma informação genética. No entanto, nem todos os genes estão sendo expressos, ou seja, estão ativos em todas elas. Essa diferença no padrão de expressão gênica é responsável pela diferença de comportamento de cada célula.

Neste sentido, enquanto os exames genéticos como genoma completo ou exoma analisam as sequencias presentes no DNA de um organismo, o chamado transcriptoma analisa o padrão de transcritos em determinada célula ou tecido.

Embora o RNAm, transcrito do DNA, seja normalmente o de maior interesse em estudos de expressão gênica, outros tipos de RNAs vem ganhando destaque. Um exemplo são os microRNAs, que desempenha um importante papel na regulação da expressão gênica ao nível pós-transcricional, impedindo a tradução dos RNAm em proteínas.

Existem diferentes formas de realizar o estudo de transcriptoma. Atualmente, uma das técnicas mais utilizadas é conhecida como RNA-seq, que oferece importantes informações sobre a expressão de genes.

O que é o RNA-seq?

O RNA-seq é uma técnica capaz de analisar padrões da expressão gênicas através do sequenciamento de larga escala (Sequenciamento de Nova Geração – NGS) do RNA presente em uma amostra.

ebook ngs

Quais são os processos do RNA-seq?

Cada plataforma de sequenciamento possui um procedimento específico para o preparo do sequenciamento. Em geral, as seguintes etapas são realizadas:

Preparo da biblioteca

  1. Isolar o RNA total da amostra
  2. Fragmentar o RNA em pequenas sequencias de aproximadamente 200-300 nucleotídeos
  3. Converter RNA em cDNA. Ou seja, transformar a sequência de uma fita para fita dupla. O cDNA é mais estável do que o RNA devido as pontes de hidrogênio ligando as duas fitas, portanto pode ser mais facilmente manipulado e amplificado.
  4. Adicionar adaptadores. Os adaptadores são sequências curtas conhecidas de nucleotídeo que se anelam as extremidades dos fragmentos. Isto permite que o sequenciador reconheça os fragmentos e que mais de uma amostra seja sequenciada em uma mesma corrida.
  5. Amplificar os fragmentos da biblioteca. Apenas os fragmentos que possuem os adaptadores serão amplificados (enriquecimento da biblioteca) através da PCR e, portanto, aparecerão em maior quantidade do que os fragmentos não amplificados.
  6. Controlar a qualidade da biblioteca. Verificar a concentração e o comprimento dos fragmentos da biblioteca.   

Sequenciamento

Após a preparação da biblioteca, os fragmentos são sequenciados. O sequenciamento gera centenas de milhares de leituras (reads) e os seguintes passos são realizados:

  • Processar os reads para a exclusão de fragmentos com baixa qualidade e dos adaptadores
  • Alinhar a um genoma de referência, quando disponível, para mapear a posição do fragmento no genoma.
  • Estimar o nível de expressão para cada transcrito (em cada gene, por exemplo) e normalizar os dados para evitar erro de interpretação.

Análise dos dados do RNA-seq

Análises estatísticas são realizadas para identificar os transcritos diferencialmente expressos. Aqui são utilizados programas de bioinformática que organizam o padrão de expressão de forma visual, por exemplo o heatmap, que agrupa genes e amostras com base na semelhança de seu padrão de expressão. Este tipo de visualização pode ser utilizada para identificar a expressão associadas a uma condição particular em comparação a uma condição normal, por exemplo uma célula com uma variante genética e uma sem alteração.

Os dados são exibidos em um gráfico onde cada linha representa um gene e cada coluna representa uma amostra. A cor e a intensidade dos quadrados são usadas para representar as mudanças (não os valores absolutos) da expressão do gene. Por exemplo, uma cor representa genes mais expressos (up-regulated) e a outra cor representa os expressos em menor quantidade (down-regulated).

RNA-Seq heatmap
Exemplo de heatmap em estudo de transcriptoma. Sharma-Kuinkel BK, et al. 2015 disponível em: https://pubmed.ncbi.nlm.nih.gov/26213692/ [acessado em 23 Agosto, 2021]

Quais são as aplicações do RNA-seq?

Desde o desenvolvimento das primeiras técnicas de sequenciamento, mais de 20 mil genes foram identificados no genoma humano. No entanto, a função da maioria dos genes ainda não é conhecida.

Compreender o transcriptoma é a chave se quisermos conectar as informações em nosso genoma com sua expressão de proteína funcional. Portanto, o RNA-seq é utilizado para determinar quais genes são ativados em uma célula ou tecido, seu nível de expressão e em qual momentos eles são ativados ou desativados. Ou seja, o RNA-seq é utilizado para analisar a expressão de um gene em diferentes células ou tecidos, fornecendo pistas sobre sua possível função.

Identificar possíveis padrões de expressão gênica relacionados a determinadas células também podem ser utilizados para estudos de patologias. Por exemplo, quando um gene está sendo diferencialmente expresso na célula com câncer em relação a uma célula normal, é possível que este gene esteja associado aos padrões de crescimento desta célula.

O RNA-seq também pode ser utilizado para outros organismos como o padrão de expressão gênica em plantas em determinado ambiente como estresse hídrico ou térmico, para determinar os genes relacionados com resistência ou tolerância. Assim como em microrganismos com potencial biotecnológico ou para o entendimento do padrão de infecções causadas por eles.

RNA-seq ou microarray (microarranjo)?

Microarray, ou microarranjo, são lâminas também conhecidas como chips de DNA, impressas com milhares de pequenos pontos, em posições definidas, contendo uma sequência de DNA ou gene conhecido.

Esta técnica utiliza os princípios de hibridação que permite a detecção de sequências específicas de RNA, em uma determinada célula ou tecido, utilizando sequências complementares as de interesse. Ou seja, as moléculas de DNA anexadas a cada lâmina atuam como sondas para detectar a expressão gênica.

Após a hibridação, o nível de expressão para cada gene é medido ao se comparar com uma referência. Por exemplo, se a expressão da amostra alvo for maior que a da amostra de referência, é observado um ponto azul na área correspondente. Se a expressão para a amostra de referência for mais alta, um ponto vermelho é observado.  Se o nível de expressão for igual entre as duas amostras, um ponto roxo é observado.

dna microarrays
Exemplo de chip microarray

No entanto, com o desenvolvimento das tecnologias de sequenciamento de alto rendimento, a técnica de RNA-seq demonstrou maior potencial nos estudos de transcriptoma.

Quais são as vantagens do RNA-seq em relação ao microarray?

Capacidade de detectar novos transcritos: Diferentemente do microarray e outras tecnologias baseadas em hibridização, o RNA-seq não necessita de sondas específicas. Desta forma, o RNA-seq pode detectar transcritos em organismos com sequências genômicas ainda desconhecidas.

Maior sensibilidade e especificidade: RNA-seq utiliza sequências de cDNA que podem ser mapeadas para regiões-alvo no genoma, o que facilita na remoção de ruídos experimentais.

Detecção de transcritos raros e de baixa expressão: Enquanto os dados de microarray são demonstrados como valores relativos aos sinais detectados no array, os de RNA-seq são quantificáveis. Desta forma, o RNA-seq evita os problemas que os microarranjos têm na detecção de níveis de expressão muito altos ou muito baixos e, portanto, a técnica pode detectar uma porcentagem maior de genes expressos diferencialmente, inclusive genes com baixa expressão.

Referências:

Jiang Z, Zhou X, Li R, et al. Whole transcriptome analysis with sequencing: methods, challenges and potential solutions. Cell Mol Life Sci. 2015;72(18):3425-3439. doi:10.1007/s00018-015-1934-y

Rao MS, Van Vleet TR, Ciurlionis R, et al. Comparison of RNA-Seq and Microarray Gene Expression Platforms for the Toxicogenomic Evaluation of Liver From Short-Term Rat Toxicity Studies. Front Genet. 2019;9:636. Published 2019 Jan 22. doi:10.3389/fgene.2018.00636

Sharma-Kuinkel BK, Mongodin EF, Myers JR, et al. Potential Influence of Staphylococcus aureus Clonal Complex 30 Genotype and Transcriptome on Hematogenous Infections. Open Forum Infect Dis. 2015;2(3):ofv093. Published 2015 Jun 24. doi:10.1093/ofid/ofv093

Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009;10(1):57-63. doi:10.1038/nrg2484

Deixe um comentário

O seu endereço de e-mail não será publicado.

Relacionados