O conhecimento sobre o metabolismo é uma arte. O metabolismo nada mais é que o conjunto de todas as reações bioquímicas dentro de uma célula. Além disso, é sabido que a maioria das reações metabólicas são catalisadas por enzimas, e os dados sobre elas podem ser aproveitados de diversas formas, como, por exemplo, a partir de dados de proteômica.
Mas o metabolismo não para por aí. Em suas diversas funções, gostaria de destacar as que envolvem a conversão de alimentos/combustíveis em energia (ATP), a conversão de alimentos/combustíveis em proteínas, lipídios, ácidos nucléicos, etc., e eliminação de resíduos.
Muitos dos estudos base do metabolismo é de fato entender os mecanismos de acesso a tais enzimas, quantificação dos metabólitos e realizar simulação in-vitro sobre os papéis de diferentes processos, vias e enzimas em todo este ambiente. É aqui que eu entro, onde mostrarei um pouco desta arte.
Um desafio central no desenvolvimento da biologia de sistemas é a integração de dados, que inclusive já falamos sobre isso no blog: Biologia de sistemas: ferramenta integrativa sobre o sistema biológico.
Foi o avanço das tecnologias de alto rendimento que fizeram surgir os diferentes tipos de dados ômicos, nos quais fornecem dados quantitativos para milhares de componentes celulares em várias escalas:
- A Genômica fornece dados sobre a sequência de DNA de uma célula,
- Transcriptômica sobre a expressão de mRNA das células,
- Proteômica sobre a composição proteica de uma célula e
- Metabolômica sobre a abundância de metabólitos de uma célula.
Sendo assim, métodos computacionais são necessários para reduzir essa dimensionalidade em todo o amplo espectro de dados ômicos para melhorar a compreensão dos processos biológicos subjacentes.
Um desses métodos computacionais ligados ao processo do metabolismo celular é a simulação metabólica utilizando modelos em escala genômica (GEMs). As reconstruções de rede em escala genômica são construídas a partir de conhecimento curado e sistematizado que lhes permite descrever quantitativamente a relação genótipo-fenótipo.
Os GEMs são representações matemáticas de redes reconstruídas que facilitam a previsão de fenótipos multiescala através da otimização de uma função objetivo de interesse. Muitas das vezes essa função objetiva em haver com a função de biomassa.
O desenvolvimento de um GEM requer meta-bases de conhecimento e possui cinco grandes passos:
- Primeira etapa: o genoma anotado de um organismo é usado para gerar um rascunho de reconstrução.
- Segunda etapa: o projeto de reconstrução é curado em um longo processo que envolve o estudo de muitas fontes de dados altamente específicas.
- Terceira etapa: a reconstrução é convertida em um modelo matemático e simulações baseadas em modelos podem ser comparadas com dados fenotípicos.
- Quarta e última etapa: os dados de alto rendimento podem ser integrados ao modelo, permitindo a descoberta biológica e o refinamento do modelo interativo.
Após a conclusão do modelo, ele pode ser usado para diversos fins, tais como estudos de processos evolutivos, análise de propriedades de rede, interpretação de screening fenotípicos, descoberta dirigida por modelo e engenharia metabólica.
Entenda o processo com a imagem abaixo:
Em termos de história, o primeiro modelo metabólico em escala genômica foi gerado em 1995 para Haemophilus influenzae. O primeiro organismo multicelular, C. elegans, foi reconstruído em 1998. Desde então, muitas reconstruções foram formadas.
Como se resolve uma simulação metabólica utilizando um modelo em escala genômica?
Aqui, meus amigos, é o momento em que a matemática aparece e muda todo o aspecto do jogo. Penso até no filme do Brad Pitt intitulado “O homem que mudou o jogo” ou “Moneyball”. Sem dúvida o ferramental faz diferença. O nome desse método é a análise de balanço de fluxo, ou flux balance analysis (FBA).
A análise de balanço de fluxo (FBA), uma abordagem de modelagem baseada em restrições, pode ser usada para sondar essas reconstruções de rede, prevendo taxas de crescimento fisiologicamente relevantes em função das redes bioquímicas subjacentes.
Para tanto, a FBA envolve delinear restrições na rede de acordo com princípios físico-químicos, ambientais, regulatórios e termodinâmicos. Após a aplicação de restrições, o espaço de solução de possíveis fenótipos se estreita, permitindo uma caracterização mais precisa da rede metabólica reconstruída, como na imagem abaixo.
Os dados ômicos, por exemplo, podem ser usados para restringir ainda mais o espaço de solução possível e aumentar os poderes preditivos do modelo.
Existem inúmeras ferramentas que executam a simulação metabólica a partir do modelo em escala genômica. Muitas vezes este modelo aparece no formato .xml, e contém todos os metabólitos e reações reconstruídas. É incrível ver como a evolução dos modelos é constante. Um ótimo repositório de modelos é o BiGG Models.
Sobre as ferramentas que realizam a simulação, eu particularmente gosto do Cobrapy. Sem a menor dúvida a integração com Python da leitura dos modelos em XML fazem toda a diferença. Você ainda pode executar diferentes simulações e métodos diferentes, inserir novas reações, deletar (knockout) e integrar com mapas interativos.
Como integramos novos dados com os modelos em escala genômica?
As reconstruções de redes metabólicas realmente são uma plataforma vantajosa para a integração de dados ômicos.
Montada em parte a partir de genomas anotados, bem como dados bioquímicos, genéticos e de fenótipo celular, uma reconstrução de rede metabólica é uma estrutura computacional com curadoria manual que permite a descrição de relações gene-proteína-reação.
Dada a riqueza de dados transcriptômicos, os esforços para integrar dados de expressão de mRNA com reconstruções de redes metabólicas, em particular, vem realizando progressos significativos ao usar FBA como plataforma analítica.
No entanto, apesar dessa abundância de dados, a integração de dados de expressão enfrenta desafios únicos, como ruído biológico experimental e inerente, variação entre plataformas experimentais, viés de detecção e a relação pouco clara entre expressão gênica e fluxo de reação.
Especificamente, foram introduzidos vários algoritmos orientados por FBA que usam níveis de transcrição de mRNA derivados experimentalmente para modificar as reações da rede, inativando-as completamente ou restringindo seus níveis de atividade.
Tais algoritmos demonstraram sua aplicabilidade, por exemplo, classificando a atividade metabólica específica do tecido na rede humana e identificando novos alvos de drogas em Mycobacterium tuberculosis e até câncer pancreático.
De modo geral, como introduzido por aqui, modelos em escala genômica se desenvolveram ao longo de 20 anos, começando com o metabolismo e depois expandindo no escopo para incluir transcrição, tradução e funções de estresse. Eles continuarão a crescer em seus alcance e precisão na representação de funções celulares.
Esse processo continuará a melhorar nossa compreensão de como as células microbianas funcionam e evoluem e provavelmente um dia ajudará com o desenho de genomas sintéticos. Além disso, a integração de dados ômicos para melhorar o modelo para a simulação metabólica vem ganhando força essencialmente com as melhoras dos algoritmos por eles utilizados.
Só para deixar com um gostinho de quero mais, existem algoritmos que integram metodologias de machine learning, dados ômicos, FBA e GEMs para melhorar a simulação metabólica, e são lindos de se ver. Mas isso é assunto para um próximo texto.