Biologia de sistemas: ferramenta integrativa sobre o sistema biológico

A Biologia de Sistemas é o estudo do comportamento de sistemas biológicos complexos que se torna capaz de prever características sistêmicas.
biologia de sistemas - ilustração

Muitas vezes as pesquisas realizadas ao redor do mundo apenas exploram um tipo de dado em específico. Os famosos “dados ômicos” envolvem a descoberta sobre muitos aspectos do sistema biológico. Cada vez mais avanços tecnológicos fazem com que sejam gerados dados e mais dados. A evolução da transcriptômica é notável, segundo o avanço das tecnologias NGS e long reads. A proteômica é cada vez mais abrangente em sua descoberta por equipamentos high-end cada vez melhores. A metabolômica e a descoberta das frações dos metabólitos nunca esteve tão utilizada em diversos estudos, principalmente na medicina.

Mas como, onde e porquê juntar estes dados? Serão eles de fato informativos? Se você pretende observar os seus dados ômicos de uma perspectiva quantitativa e integrativa, estamos falando da Biologia de Sistemas, que visa o estudo do comportamento de sistemas biológicos complexos até o ponto em que se é capaz de prever características sistêmicas. 

Como mencionado, a biologia de sistemas é uma análise quantitativa abrangente da maneira pela qual todos os componentes de um sistema biológico interagem funcionalmente ao longo do tempo. Mas esse tempo leva em consideração não apenas um aspecto temporal, como o relógio no seu pulso, mas também a disponibilidade da célula. O tempo aqui em questão é definido por equações diferenciais que dependem das quantidades dos reagentes nas células, que é processado, e gera o próximo passo da nossa cadeia ômica.

O dogma central da biologia entra em questão (DNA – RNA – Proteína), mas outras ômicas e diferentes análises integrativas também são essenciais para elucidar esse comportamento sistêmico da célula. A Figura abaixo mostra o processo encadeado de cada camada ômica até atingir o fenótipo. E aqui, além do tempo, estamos falando de estaticidade, onde a genômica é menos dinâmica que a transcriptômica e metabolômica, por exemplo. 

Biologia de sistemas - camadas ômicas
O fenótipo observável de uma célula é resultado de interações complexas e loops de feedback entre várias camadas ômicas, cada uma influenciada por perturbações ambientais. Em ordem de “distância” do fenótipo celular, são epigenômica (marcadores epigenéticos que afetam a atividade e expressão gênica), genômica (DNA contendo o código genético da célula), transcriptômica (o RNA codificado pelo genoma), proteômica (o conjunto de proteínas produzidas como resultado da expressão gênica e subsequentes modificações pós-traducionais) e metabolômica (o conjunto de metabólitos e reações metabólicas que ocorrem na célula). Adaptado de Angione, C., 2019. 

Mas você acha que tudo são flores, incluindo a Biologia Computacional e a Bioinformática? Bem, não. Parece haver um delicado equilíbrio entre aspectos opostos, como:

  1. Devo observar todo genoma ou apenas uma pequena parte de sua rede?
  2. O método de estudo é computacional ou experimental?
  3. Devo fazer uma análise determinística ou probabilística? 

De fato, precisamos observar que o método aplicado na Biologia de Sistemas é um grande começo. Vemos muitos métodos sendo desenvolvidos, principalmente na integração dos dados, o que leva a criação de profissionais multidisciplinares, que entendem de Biologia, Biotecnologia, Matemática, Estatística, Química, entre outros. Ao meu ver, são três as grandes ideias para caminhar sobre a Biologia de Sistemas, e está presente na bíblia do bioinformata em letras garrafais, sendo elas:

1. Aplicarás técnicas high-throughput e de genoma completo;

2. Investigarás os componentes das redes celulares e suas interações;

3. Integrarás métodos computacionais e teóricos com métodos experimentais.

Vamos falar um pouco sobre cada mandamento, e as informações que podem ser geradas a partir de cada processo e método, mas não sem definir primeiro o modelo a ser utilizado no seu trabalho.  

1. O modelo 

Aqui eu penso em discorrer sobre a identidade de fato da investigação. Muitas investigações em Biologia de Sistemas acabam executando modelos matemáticos para elucidar um funcionamento celular e, com os dados ômicos, os validando. Mas o modelo em si é um pouco mais abrangente.

A modelagem dos processos biológicos podem ser descritos em termos matemáticos, mas ele acaba sendo investigado por diferentes métodos experimentais, que acabam exigindo diferentes modelos matemáticos. E podem ter certeza, a escolha de um modelo matemático ou um algoritmo depende do problema, do propósito e da intenção do investigador.

Eu mesmo já modelei diferentes tipos de situações celulares usando apenas equações diferenciais, ou utilizei Petri Nets como fundamento de dinâmica estocástica. A modelagem deve refletir as propriedades essenciais do sistema, já que diferentes modelos podem destacar diferentes aspectos da mesma instância. 

Mas como mencionei, a criação do modelo parte não de uma ideia da matemática, mas sim da investigação. Para este fim, você deve identificar as perguntas específicas que devem ser respondidas, juntamente com o background, problemas e hipóteses. Fica até mais fácil decidir sobre quais ômicas o seu projeto de pesquisa deve gerar. E o grande conselho é: antes de responder qualquer questão, verifique nos bancos de dados se algo já não foi depositado, como no GEO, NCBI, SRA, e outros específicos para a sua problemática. 

2. Dados ômicos 

As tecnologias Omics são definidas como ensaios bioquímicos de alto rendimento que medem de forma abrangente e simultânea moléculas do mesmo tipo de uma amostra biológica. Por exemplo, o estudo do DNA através do perfil genômico; a transcriptômica medindo transcrições; a proteômica e metabolômica quantificando proteínas e metabólitos, respectivamente. Você consegue gerar muitos dados hoje em dia, mas claro, com dinheiro disponível. Onde podemos buscar informações sobre o sistema biológico é, de fato, um ato de boa fé, mas pense sempre no seu modelo estruturado, e verás que poderia ter feito de outra maneira, possivelmente. 

Cada ômica é como se fosse uma casa das tantas casas do Senhor dos Anéis. Você acha que Frodo teria conseguido levar o anel a Mordor sem que cada casa agisse de forma organizada e conjunta? Cada ômica é um pilar, assim como os humanos, elfos e anões foram na grande trilogia ganhadora de 17 estatuetas do Oscar. Mas, se você notar, Sam sempre esteve ao lado de Frodo, o ajudando em suas horas mais difíceis, não o deixando sucumbir às tentações, e lhe mostrando o verdadeiro caminho. Aqui, caro leitor e leitora, Sam é o bioinformata. 

3. Redes de interação

A biologia de rede é uma área de pesquisa em rápido desenvolvimento e reflete a visão atual de que fenótipos complexos, como suscetibilidade a doenças, não são o resultado de mutações em um único gene que agem isoladamente, mas sim devido à perturbação do contexto de rede de um gene (Charitou, T., et. al., 2016). Nesse tipo de abordagem muitos métodos são propostos e consolidados. Podemos elaborar diversos tipos de redes de interação entre os componentes celulares e adicionar informações ômicas à rede. 

Até este ponto, se você não estudou grafos, deverás (também presente na bíblia do bioinformata). Uma modelagem de componentes celulares, como proteína-proteína, gene-gene, gene-metabólito ou metabólito-proteína, requer aspectos de grafos. Um nó pode representar um gene, proteína ou metabólito, e a aresta que ligam os nós a uma interação descrita entre eles. Se você deseja saber um pouco mais, entre no site do STRING e aproveite esse banco de dados de interação gigantesco. 

Existem redes que podem ser geradas de forma booleana, de forma estocástica, de regulação, apenas interações físicas e estatísticas, diversos tipos. As redes proteína-proteína, gerada pela maioria dos bancos de dados, trazem informações de diversas fontes das interações propostas. Já as redes de regulação, que estão sendo bastante utilizadas, podem dizer sobre o aspecto regulatório do seu sistema apenas com um dado ômico, principalmente a transcriptômica, e focando nos fatores de transcrição. Como leitura das inferência das redes de regulação gênica deixo os trabalhos de Van den Broeck, L., et. al., 2020 e Chen, S., & Mar, J. C., 2018.

Mas, além da regulação incluída sobre a sua rede, como podemos agregar “valores ômicos” a elas, já que a Biologia de Sistemas se baseia em uma análise quantitativa? Imaginemos que temos a nossa rede final. Tomando como base uma rede proteína-proteína, os valores do fold-change vindo dos dados ômicos podem ser adicionados e, do mesmo modo, essa integração funcionaria também para uma rede gene-gene. Fica um visual bem claro de clusters enriquecidos pelos fatores up e down. Além disso, a divisão por enriquecimento, grupo de funções, ou componente celular podem ser feitos sobre a rede. É uma análise simples que pode ser realizada no Cytoscape (vulgo CytoDeus dos bioinformatas). 

Uma das minhas redes preferidas é quando se conecta mutações de genes (SNPs) a genes, mas de diferentes fenótipos. Nesse caso específico de rede, você precisa analisar tanto a parte da associação gene-fenótipo, por exemplo utilizando-se de GWAS, e também a análise de SNPs em relação a cada fenótipo. Um ótimo exemplo de estudo está resumido na Figura a seguir, extraída de Weighill, D., et. al., 2019. 

Exemplo de SNP-fenótipo, redes gene-fenótipo e redes gene-SNP-fenótipo. (A) As redes bipartidas de fenótipo SNP simplesmente conectam SNPs a fenótipos com os quais eles têm uma associação significativa e não fornecem informações sobre assinaturas de MPA (Multi-phenotype associations) dentro de genes. (B) As redes gene-fenótipo contêm conexões entre genes e fenótipos. Uma aresta será desenhada entre um gene e um fenótipo se esse gene contiver um SNP associado a esse fenótipo. As redes de fenótipos de genes não fornecem informações sobre qual tipo de assinatura de MPA é exibida. (C) As redes de fenótipo de gene-SNP são redes de fenótipo de SNP com os SNPs conectados aos genes em que residem. Essas redes são mais complicadas, e as assinaturas MPA podem ser deduzidas de sua estrutura através de uma análise mais aprofundada, no entanto, a rede não está em uma forma na qual as assinaturas MPA podem ser extraídas facilmente usando medidas de topologia de rede padrão, como grau. 

De fato a utilização de redes de interação, de qual tipo for, é uma grande aliada ao estudo da Biologia de Sistemas para elucidar esse grande funcionamento sistêmico. Eu mesmo utilizo diversos tipos de rede no dia-a-dia, e me surpreendo por sempre identificar análises novas nas literatura. 

4. Métodos integrativos

Como citado eu tive diversas abordagens de integração com redes. Mas os métodos integrativos são muito bem elaborados para direcionar as respostas de cada ômica para o bem maior. Muitas vezes no cinema, inclusive, já vimos diferentes grupos se juntando para chegar a um bem maior. Aqui não é diferente. 

A observação de fenômenos biológicos está restrita à precisão das técnicas experimentais disponíveis. Como mencionei, nem sempre o dinheiro sobra. Um forte impulso para o desenvolvimento de uma abordagem sistemática nos últimos anos foi dado pelas novas tecnologias de alto rendimento. Já foram gerados técnicas de sequenciamento de genomas humanos e outros (genômica); avaliação da expressão gênica (transcriptômica); e a descoberta de interações proteína-proteína e -DNA (proteômica). Mas, estes diferentes tipos de informações precisam ser integrados. Na integração dos dados, a capacidade de utilizar diversas técnicas, métodos e bancos de dados disponíveis acaba facilitando todo o aspecto do resultado. 

Comecemos pelas representações e armazenamento. Você pode sempre integrar os seus dados com resultados de enriquecimento (GO e KEGG), além das informações presentes no banco do Reactome e até do PDB. As diversas representações sistêmicas são apresentadas em linguagens de anotação semelhantes ao XML, como o SBML e CellML. Até mesmo os modelos de escala genômica, que sumarizam reações metabólicas celulares, trazem formatos nestes tipos. 

Pela análise quantitativa, a correlação de dados é importante. Diversas vezes na Biologia de Sistemas verificamos a presença de métodos computacionais e matemáticos para integrar informações. Você pode encontrar a correlação entre fenótipos e perfis genômico/proteômico, utilizando-se de aspectos de rede ou até co-expressão. Já na análise estatística, a mineração de dados, análise de padrões, clustering e PCA são essenciais para integrar qualquer resposta ou até dados ômicos. 

De tantas maneiras que verificamos esses métodos de integração, ando observando o surgimento de várias “Systems” a partir da Systems Biology, como a Systems Medicine, que pretende substituir a medicina de precisão, além de outras. Leia um pouco mais por Schleidgen, S., e colaboradores, 2017.

Como entender a biologia de sistemas?

Para entender a biologia no nível do sistema, devemos examinar a estrutura e a dinâmica da função celular e do organismo, em vez das características de partes isoladas de uma célula ou organismo. Propriedades dos sistemas, como robustez, surgem como questões centrais, e a compreensão dessas propriedades pode ter impacto no futuro da medicina, biotecnologia e diversas áreas. No entanto, muitos avanços em dispositivos experimentais, software avançado e métodos analíticos são necessários antes que as conquistas da biologia de sistemas possam atingir seu potencial máximo. De fato, construir algo integrativo a nível multi-ômico requer muita colaboração, paciência, habilidade e conhecimento. 

Referências:

Angione, C. (2019). Human systems biology and metabolic modelling: a review—from disease metabolism to precision medicine. BioMed research international, 2019.

Charitou, T., Bryan, K. & Lynn, D.J. Using biological networks to integrate, visualize and analyze genomics data. Genet Sel Evol 48, 27 (2016). 

Chen, S., & Mar, J. C. (2018). Evaluating methods of inferring gene regulatory networks highlights their lack of performance for single cell gene expression data. BMC bioinformatics, 19(1), 1-21.

Conesa, Ana, and Stephan Beck. “Making multi-omics data accessible to researchers.” Scientific data 6.1 (2019): 1-4.

Schleidgen, S., Fernau, S., Fleischer, H., Schickhardt, C., Oßa, A. K., & Winkler, E. C. (2017). Applying systems biology to biomedical research and health care: a précising definition of systems medicine. BMC health services research, 17(1), 1-16.

Van den Broeck, L., Gordon, M., Inzé, D., Williams, C., & Sozzani, R. (2020). Gene regulatory network inference: connecting plant biology and mathematical modeling. Frontiers in Genetics, 11, 457.

Weighill, D., Jones, P., Bleker, C., Ranjan, P., Shah, M., Zhao, N., … & Jacobson, D. (2019). Multi-phenotype association decomposition: unraveling complex gene-phenotype relationships. Frontiers in genetics, 10, 417.

Relacionados