Simulação metabólica e modelos em escala genômica (GEMs)

Os modelos em escala genômica (GEMs) são representações matemáticas de redes reconstruídas que facilitam a previsão de fenótipos. Entenda!

O conhecimento sobre o metabolismo é uma arte. O metabolismo nada mais é que o conjunto de todas as reações bioquímicas dentro de uma célula. Além disso, é sabido que a maioria das reações metabólicas são catalisadas por enzimas, e os dados sobre elas podem ser aproveitados de diversas formas, como, por exemplo, a partir de dados de proteômica.

Mas o metabolismo não para por aí. Em suas diversas funções, gostaria de destacar as que envolvem a conversão de alimentos/combustíveis em energia (ATP), a conversão de alimentos/combustíveis em proteínas, lipídios, ácidos nucléicos, etc., e eliminação de resíduos.

Muitos dos estudos base do metabolismo é de fato entender os mecanismos de acesso a tais enzimas, quantificação dos metabólitos e realizar simulação in-vitro sobre os papéis de diferentes processos, vias e enzimas em todo este ambiente. É aqui que eu entro, onde mostrarei um pouco desta arte. 

Um desafio central no desenvolvimento da biologia de sistemas é a integração de dados, que inclusive já falamos sobre isso no blog: Biologia de sistemas: ferramenta integrativa sobre o sistema biológico.

Foi o avanço das tecnologias de alto rendimento que fizeram surgir os diferentes tipos de dados ômicos, nos quais fornecem dados quantitativos para milhares de componentes celulares em várias escalas:

  • A Genômica fornece dados sobre a sequência de DNA de uma célula,
  • Transcriptômica sobre a expressão de mRNA das células,
  • Proteômica sobre a composição proteica de uma célula e
  • Metabolômica sobre a abundância de metabólitos de uma célula.

Sendo assim, métodos computacionais são necessários para reduzir essa dimensionalidade em todo o amplo espectro de dados ômicos para melhorar a compreensão dos processos biológicos subjacentes.

Um desses métodos computacionais ligados ao processo do metabolismo celular é a simulação metabólica utilizando modelos em escala genômica (GEMs). As reconstruções de rede em escala genômica são construídas a partir de conhecimento curado e sistematizado que lhes permite descrever quantitativamente a relação genótipo-fenótipo.

O que são os modelos em escala genômica (GEMs)?

Os GEMs são representações matemáticas de redes reconstruídas que facilitam a previsão de fenótipos multiescala através da otimização de uma função objetivo de interesse. Muitas das vezes essa função objetiva em haver com a função de biomassa. 

O desenvolvimento de um GEM requer meta-bases de conhecimento e possui cinco grandes passos:

  • Primeira etapa: o genoma anotado de um organismo é usado para gerar um rascunho de reconstrução.
  • Segunda etapa: o projeto de reconstrução é curado em um longo processo que envolve o estudo de muitas fontes de dados altamente específicas.
  • Terceira etapa: a reconstrução é convertida em um modelo matemático e simulações baseadas em modelos podem ser comparadas com dados fenotípicos.
  • Quarta e última etapa: os dados de alto rendimento podem ser integrados ao modelo, permitindo a descoberta biológica e o refinamento do modelo interativo.

Após a conclusão do modelo, ele pode ser usado para diversos fins, tais como estudos de processos evolutivos, análise de propriedades de rede, interpretação de screening fenotípicos, descoberta dirigida por modelo e engenharia metabólica.

Entenda o processo com a imagem abaixo:

reconstrução metabólica escala genômica
As fases e dados utilizados na geração de uma reconstrução metabólica. O processo de reconstrução metabólica em escala genômica pode ser resumido em quatro fases principais, cada uma das últimas fases construindo a anterior. A quinta fase é o uso da reconstrução completa para fins práticos. A característica do processo de reconstrução é o refinamento interativo do conteúdo de reconstrução que é conduzido por dados experimentais e ocorre nas fases 2 a 4. Para cada fase, tipos de dados específicos são necessários e variam de tipos de dados de alto rendimento, por exemplo, metabolômica, para estudos detalhados caracterizando componentes individuais, como, por exemplo, dados bioquímicos para uma determinada reação. Na anotação do genoma pode se fornecer uma lista de partes de uma célula, enquanto os dados genéticos podem fornecer informações sobre a contribuição de cada produto gênico para um fenótipo quando removido ou mutado. O produto gerado a partir de cada fase de reconstrução pode ser utilizado e aplicado para examinar um número crescente de questões com o produto final tendo as aplicações mais amplas. Figura extraída de Orth, Jeffrey D. et. al., 2010 [1].

Em termos de história, o primeiro modelo metabólico em escala genômica foi gerado em 1995 para Haemophilus influenzae. O primeiro organismo multicelular, C. elegans, foi reconstruído em 1998. Desde então, muitas reconstruções foram formadas.

Como se resolve uma simulação metabólica utilizando um modelo em escala genômica?

Aqui, meus amigos, é o momento em que a matemática aparece e muda todo o aspecto do jogo. Penso até no filme do Brad Pitt intitulado “O homem que mudou o jogo” ou “Moneyball”. Sem dúvida o ferramental faz diferença. O nome desse método é a análise de balanço de fluxo, ou flux balance analysis (FBA). 

A análise de balanço de fluxo (FBA), uma abordagem de modelagem baseada em restrições, pode ser usada para sondar essas reconstruções de rede, prevendo taxas de crescimento fisiologicamente relevantes em função das redes bioquímicas subjacentes. Para tanto, a FBA envolve delinear restrições na rede de acordo com princípios físico-químicos, ambientais, regulatórios e termodinâmicos. Após a aplicação de restrições, o espaço de solução de possíveis fenótipos se estreita, permitindo uma caracterização mais precisa da rede metabólica reconstruída, como na imagem abaixo. Os dados ômicos, por exemplo, podem ser usados ​​para restringir ainda mais o espaço de solução possível e aumentar os poderes preditivos do modelo.

Formulação de um problema FBA. (a) A reconstrução da rede metabólica consiste em uma lista de bioquímicos estequiométricamente balanceados reações. (b) Esta reconstrução é convertida em um modelo matemático formando uma matriz (rotulada S), em que cada linha representa um metabólito e cada coluna representa uma reação. O crescimento é incorporado na reconstrução com uma reação de biomassa (coluna amarela), que simula metabólitos consumidos durante a produção de biomassa. Reações de eliminação (colunas verdes) são usadas para representar o fluxo de metabólitos, como glicose e oxigênio, dentro e fora da célula. (c) Em estado estacionário, o fluxo através de cada reação é dado por Sv = 0, que define um sistema de equações lineares. Tão grande modelos contêm mais reações do que metabólitos, há mais de uma solução possível para estas equações. (d) Resolvendo as equações para prever a taxa de crescimento máxima requer a definição de um objetivo função Z=ct v  (c é um vetor de pesos indicando quanto cada reação (v) contribui para a função objetiva). Na prática, quando apenas uma reação, com como a produção de biomassa, é desejado para a maximização ou minimização, c é um vetor de zeros com um valor de 1 na posição da reação de interesse. No exemplo de crescimento, a função objetivo é Z=vbiomassa (ou seja, c tem um valor de 1 na posição do reação de biomassa). (e) A programação linear é usada para identificar uma distribuição de fluxo que maximize ou minimize a função objetivo dentro do espaço de fluxos permitidos (região azul) definido pelo restrições impostas pelas equações de balanço de massa e limites de reação. A seta vermelha grossa indica a direção de aumento de Z. Como a solução ótima ponto está o mais longe possível nesta direção, as setas vermelhas finas representam o processo de programação linear, que identifica um ponto ótimo em uma borda ou canto do espaço da solução. Figura extraída de Orth, Jeffrey D. et. al., 2010 [2].

Existem inúmeras ferramentas que executam a simulação metabólica a partir do modelo em escala genômica. Muitas vezes este modelo aparece no formato .xml, e contém todos os metabólitos e reações reconstruídas. É incrível ver como a evolução dos modelos é constante. Um ótimo repositório de modelos é o BiGG Models. 

Sobre as ferramentas que realizam a simulação, eu particularmente gosto do Cobrapy. Sem a menor dúvida a integração com Python da leitura dos modelos em XML fazem toda a diferença. Você ainda pode executar diferentes simulações e métodos diferentes, inserir novas reações, deletar (knockout) e integrar com mapas interativos. 

Como integramos novos dados com os modelos em escala genômica? 

As reconstruções de redes metabólicas realmente são uma plataforma vantajosa para a integração de dados ômicos. Montada em parte a partir de genomas anotados, bem como dados bioquímicos, genéticos e de fenótipo celular, uma reconstrução de rede metabólica é uma estrutura computacional com curadoria manual que permite a descrição de relações gene-proteína-reação. 

Dada a riqueza de dados transcriptômicos, os esforços para integrar dados de expressão de mRNA com reconstruções de redes metabólicas, em particular, vem realizando progressos significativos ao usar FBA como plataforma analítica.

No entanto, apesar dessa abundância de dados, a integração de dados de expressão enfrenta desafios únicos, como ruído biológico experimental e inerente, variação entre plataformas experimentais, viés de detecção e a relação pouco clara entre expressão gênica e fluxo de reação. Especificamente, foram introduzidos vários algoritmos orientados por FBA que usam níveis de transcrição de mRNA derivados experimentalmente para modificar as reações da rede, inativando-as completamente ou restringindo seus níveis de atividade. Tais algoritmos demonstraram sua aplicabilidade, por exemplo, classificando a atividade metabólica específica do tecido na rede humana e identificando novos alvos de drogas em Mycobacterium tuberculosis e até câncer pancreático.

De modo geral, como introduzido por aqui, modelos em escala genômica se desenvolveram ao longo de 20 anos, começando com o metabolismo e depois expandindo no escopo para incluir transcrição, tradução e funções de estresse. Eles continuarão a crescer em seus alcance e precisão na representação de funções celulares.

Esse processo continuará a melhorar nossa compreensão de como as células microbianas funcionam e evoluem e provavelmente um dia ajudará com o desenho de genomas sintéticos. Além disso, a integração de dados ômicos para melhorar o modelo para a simulação metabólica vem ganhando força essencialmente com as melhoras dos algoritmos por eles utilizados. 

Só para deixar com um gostinho de quero mais, existem algoritmos que integram metodologias de machine learning, dados ômicos, FBA e GEMs para melhorar a simulação metabólica, e são lindos de se ver. Mas isso é assunto para um próximo texto. 

Referências

[1] Orth, Jeffrey D., Ronan MT Fleming, and Bernhard Ø. Palsson. “Reconstruction and use of microbial metabolic networks: the core Escherichia coli metabolic model as an educational guide.” EcoSal plus 4.1 (2010).

[2] Orth, J. D., Thiele, I., & Palsson, B. Ø. (2010). What is flux balance analysis? Nature Biotechnology, 28(3), 245–248. doi:10.1038/nbt.1614

[3] Blazier, Anna S., and Jason A. Papin. “Integration of expression data in genome-scale metabolic network reconstructions.” Frontiers in physiology 3 (2012): 299.

[4] Shlomi, T., Cabili, M. N., Herrgard, M. J., Palsson, B. O., and Ruppin, E. (2008). Network-based prediction of human tissue-specific metabolism. Nat. Biotechnol. 26, 1003–1010.

[5] Roy, Mahua, and Stacey D. Finley. “Computational model predicts the effects of targeting cellular metabolism in pancreatic cancer.” Frontiers in physiology 8 (2017): 217.

Relacionados