Expressão diferencial de genes e funções biológicas

A expressão de um gene está ligada à produção e função de proteínas, essa análise é crucial para entender alguns fenômenos biológicos.

O gene é uma unidade básica fundamental para organismos. Nele, temos as informações necessárias para replicar e garantir a sobrevivência das células. O DNA presente nos genes, contém sequências codificantes e não codificantes cada uma com sua funcionalidade. Porém, são nas sequências codificantes que iremos determinar a atividade de um gene através da expressão gênica.

Entender o controle da expressão gênica é essencial para compreendermos como a relação entre o genótipo e fenótipo ocorre. As propriedades dos produtos de expressão dão origem ao fenótipo do organismo.

Saiba mais no texto A expressão gênica e seu papel para as doenças genéticas

Tudo se resume ao dogma da biologia molecular, escrito por Francis Crick em 1958 com o objetivo de relacionar as interações entre DNA, RNA e proteína.

  1. Transcrição: É o primeiro passo da expressão. O gene duplica sequências codificantes e não codificantes de DNA e as transcreve em RNA.
  2. Tradução: É o processo de síntese de proteínas a partir do RNA.
Esquema representando o dogma da biologia molecular. Representação da estrutura de um gene e processamento do RNA transcrito.

A operação de regulação de um único gene pode dar origem a milhares de RNAs mensageiros que codificam proteínas funcionalmente distintas. Podemos estimar que cera de 30 mil genes do genoma humano expressam milhares de proteínas, cada um desempenhando sua função específica.

Microarray

Com o advento de tecnologias NGS, a lista de sequenciamento de genomas completos vem aumentando assim como o volume de dados. Para entendermos o que esses dados significam, precisamos utilizar ferramentas computacionais para compreender as implicações das variações genéticas nos organismos e seus mecanismos evolutivos funcionais e de regulação.

A necessidade de estudar a abundância de transcritos em amostras biológicas levou ao desenvolvimento do microarray (ou microarranjo) de DNA, um dos principais métodos de análise de expressão gênica. Essa tecnologia emprega o uso de sondas de ácido nucleico ligadas a lâminas de vidro. As sequências alvo são então marcadas com fluorescência, hibridizadas com as sondas e escaneadas.

Podemos dizer que os genes que fazem par com a molécula complementar do array estão ativados e o seu nível de expressão pode ser identificada através da fluorescência. Imagens geradas desse processo são convertidas e processadas usando softwares específicos para essa aplicação. A partir daí podemos extrair dados utilizando análises computacionais.

Com o rápido avanço da tecnologia de microarray, os dados de expressão gênica estão sendo gerados em grande capacidade. O aspecto importante da análise da expressão gênica é encontrar o gene, analisá-lo e extrair as informações relevantes para determinado fenótipo.

RNA-seq

Apesar do grande avanço que o microarray trouxe para a análise do transcriptoma (conjunto completo dos transcritos e, portanto, reflexo direto da expressão gênica), limitações também surgiram.

Por outro lado, novas tecnologias NGS surgem como alternativa para avaliação da expressão global dos genes. Com o RNA-seq, conseguimos analisar a expressão diferencial dos genes, mapear leituras e quantificar transcritos com alto rendimento, de forma quantitativa e precisa.

Também podemos destacar a possibilidade identificação de isoformas resultantes de splicing; a descoberta de novos transcritos, como RNAs não codificantes longos (lncRNAs), microRNAs e expressão específica de alelo. Todas essas possibilidades permitem entender melhor a complexidade da organização do genoma com todos os seus mecanismos regulatórios.

Para realização do RNA-seq, o mRNA necessita passar por uma extração, purificação e fragmentação em tamanho curto para ser convertido no cDNA (DNA complementar) através da transcriptase reversa. Esse cDNA será sequenciado com tecnologias NGS.

Entenda melhor sobre a análise de RNA-seq em: RNA-seq: ferramenta para estudos de expressão gênica

Microarray ou RNA-seq?

Quando comparamos, apesar do microarray possuir uma capacidade de análise mais limitada, ele continua fornecendo dados importantes e de qualidade para análises em bioinformática. No entanto, o RNA-seq é mais versátil. Não só conseguimos usar os mesmos dados para detectar RNA não codificante, polimorfismos de nucleotídeo único e genes de fusão, com o também reavaliar um conjunto de dados já existentes à medida que novas sequências e novas informações vão surgindo.

Os Microarrays até podem detectar essas mesmas informações desde que os arranjos sejam projetados para esse fim. Outra limitação é que chips de microarray precisam ser atualizados com frequência para conter as informações de sequência mais atualizadas.

Por outro lado, o RNA-seq tem um limite de detecção de expressão muito mais baixo que um microarray quando queremos enxergar o panorama completo de um genoma. Apesar do microarray ser usado a bastante tempo, é possível que na prática clínica o RNA-Seq acabe sendo usado mais rotineiramente do que o microarray por conseguir dados mais completos além da análises de expressão.

Dito isso, é necessário ressaltar que microarrays não se tornarão obsoletos. É possível apenas que sejam destinados a usos em ocasiões específicas.

Por que o estudo de expressão é importante?

Como a expressão de um gene está diretamente ligada à produção e função de proteínas, essa análise é crucial para entender alguns fenômenos biológicos.

Inicialmente, a expressão dos genes era avaliada individualmente. Porém, devido a complexidade do funcionamento biológico, se torna necessário uma abordagem utilizando redes de genes de coexpressão, para avaliar como a expressão de um gene afeta a expressão de outro gene e como isso interfere no panorama biológico geral.

Nessa análise, assumimos que todos os genes estão conectados, e sua força de conexão é quantificada pela correlação da expressão entre eles. Assim, podemos detectar grupos de genes que compartilham uma função biológica em comum ou uma associação em alguma via metabólica.

Detectando esses grupos, podemos então investigar a associação dessa rede de genes conectados que se relacionam de alguma forma com determinados fenótipos. Existem softwares exclusivos para análise de coexpressão como o WGCNA.

Aproveitando as informações geradas em experimento, utilizando ferramentas de bioinformática, modelos matemáticos e armazenando-as em bancos de dados e aplicando ferramentas de código aberto, conseguimos prever interações entre as moléculas de DNA, RNA e proteínas, o que pode economizar custos operacionais e tempo.

Abordagem computacional para descobrir ou prever interações de RNA entre diferentes biomoléculas. A primeira estratégia é pesquisar em ferramentas da web ou bancos de dados de RNA. Outra maneira de descobrir as interações de RNA é usar recursos baseados em aprendizado profundo e outras ferramentas baseadas em aprendizado de máquina. Finalmente, diferentes métodos matemáticos e de teoria de rede podem ser usados para pesquisar as interações de RNA. Disponível em: <https://www.mdpi.com/1422-0067/22/21/11397/htm>

Revelar as interações entre as moléculas citadas acima, é um ponto crucial para entender a função celular. Experimentos de interação molecular são muito caros, por isso destaco a importância da aplicação de metodologias in sílico, utilizando da bioinformática para prever essas interações moleculares com eficácia.

Os avanços nas capacidades de geração e análise de dados, bem como na interpretação dos resultados, têm apontado para um futuro promissor. As análises de expressão genética podem expandir a nossa compreensão do funcionamento do corpo. Porém, à medida que as dúvidas são respondidas, mais perguntas são geradas.

Por outro lado, a integração de dados e análises de sistemas de coexpressão é apenas o início. Novas descobertas e hipóteses estão sendo geradas a todo momento e, com isso, grandes avanços na área da saúde serão obtidos. Como o uso desses dados de expressão para medicina de precisão e terapia genética.

Sobre o autor:

Iasmin Moreira é graduanda em Biotecnologia pela Universidade Federal da Bahia. Atualmente, é bolsista CNPq de Iniciação Científica, desenvolve análises genômicas para estudo do Transtorno do Espectro Autista. Também é membro da empresa júnior de Informática Biomédica da Universidade de São Paulo.

Referências

  • RAUT, Shital A.; SATHE, S. R.; RAUT, Adarsh. Bioinformatics: Trends in gene expression analysis. In: 2010 International Conference on Bioinformatics and Biomedical Technology. IEEE, 2010. p. 97-100.
  • ANSELMO, Michele de Siqueira. Modelo didático sobre o dogma central da biologia molecular. 2014.
  • MANTIONE, Kirk J. et al. Comparing bioinformatic gene expression profiling methods: microarray and RNA-Seq. Medical science monitor basic research, v. 20, p. 138, 2014.
  • RINCÓN-RIVEROS, Andrés et al. Bioinformatic tools for the analysis and prediction of ncrna interactions. International journal of molecular sciences, v. 22, n. 21, p. 11397, 2021.
  • DINIZ, W. J. D. S.; CANDURI, F. Bioinformatics: an overview and its applications. Genet Mol Res, v. 16, n. 1, p. 10.4238, 2017.
Relacionados