Inovamos hoje para que você tenha um amanhã melhor.

Bioinformática: união entre ciência e tecnologia

A Bioinformática é uma ciência multidisciplinar que usa ferramentas computacionais para organizar, armazenar e interpretar dados biológicos.

Os resultados de pesquisas científicas geram dados e, pensando na evolução da tecnologia e da ciência em si, é difícil imaginar a quantidade gigantesca de dados gerados diariamente. Além disso, muitas vezes analisar e interpretar os resultados é a parte mais desafiadora dos estudos quando pensamos também na complexidade dos dados obtidos. Neste cenário, surgiu a bioinformática, a união entre a tecnologia computacional e a ciência.

O que é a bioinformática?

A Bioinformática é uma ciência multidisciplinar que usa de tecnologia e ferramentas computacionais para organizar, armazenar, interpretar, visualizar e disseminar dados biológicos.

Na maioria das vezes, a bioinformática é utilizada para estudar a determinação de funções de genes e proteínas, estabelecer relações evolutivas e prever formas tridimensionais das proteínas.

Quando surgiu a bioinformática?

O termo bioinformática foi utilizado pela primeira vez por Paulien Hogeweg e Ben Hesper em 1970 como “O estudo dos processos informáticos em sistemas bióticos “. No entanto, a pesquisadora Margaret Dayhoff foi quem ficou conhecida como a mãe da bioinformática.

A pesquisadora foi a pioneira no desenvolvimento de computadores capazes de determinar a sequência de peptídeo, programas para exibir estruturas tridimensionais de proteínas e métodos computacionais para comparação de sequência. Além disso, em 1965 Dra. Dayhoff participou da criação do “Atlas of Protein Sequence and Structure”, o primeiro banco de dados público computadorizado de sequências de proteínas.

Além destes e de outros pesquisadores que contribuíram de forma grandiosa para o reconhecimento da bioinformática, seu crescimento só foi possível através do desenvolvimento dos computadores. O avanço da tecnologia dos computadores teve por consequência uma maior capacidade de processamento e memória das máquinas, o que é essencial para analisar a grande quantidade de dados gerados nas pesquisas.

Ciência e tecnologia lado a lado

O desenvolvimento da ciência e dos computadores seguiu uma certa sincronia de evolução. Em 1970  Fred Sanger e Walter Gilbert desenvolveram os primeiros métodos de sequenciamento de DNA. Então, em 1977, Sanger usou este sistema para deduzir a sequência de DNA do bacteriófago Phi X 174 (ΦX174), o primeiro genoma completo a ser sequenciado com cerca de 5 mil nucleotídeos. Nesta mesma época os computadores ainda apresentavam capacidade de armazenamento limitado.

No final dos anos 80 surgiu a primeira máquina de sequenciamento automático de DNA. Logo em seguida, na década de 90, os computadores se tornaram mais populares, com maior capacidade de armazenamento e processamento, além da possibilidade de acessar a internet.

Nesta época, os primeiros algoritmos para montagem de genoma, ou seja, para definir a sequência de nucleotídeos no material genético, começaram a ser desenvolvidos. O primeiro organismo vivo a ter seu genoma sequenciado foi a bactéria Haemophilus influenzae, em um trabalho publicado em 1995. Nesta época, a bioinformática se tornou ainda mais conhecida e houve um aumento no investimento para desenvolver novos algoritmos capazes de analisar sequências mais complexas e com maior volume.

Com o avanço da ciência, da tecnologia e da acessibilidade aos dados, em 1990 foi possível iniciar o Projeto Genoma Humano, que contou com pesquisadores de 18 países para mapear o genoma humano, que tem cerca de 3 bilhões de pares de base.

Por volta de 2005, surgiu a tecnologia mais moderna de sequenciamento de DNA, o Sequenciamento de Nova Geração ou NGS, que revolucionou a ciência. Esta tecnologia permite sequenciar bilhões de fragmentos de DNA de uma só vez. Além da agilidade, o NGS também tornou o sequenciamento muito menos custoso financeiramente e, portanto, mais acessível.

Com isso, a lista de genomas completos e do volume de dados biológicos começou a aumentar drasticamente. Por isso, também foi necessário desenvolver novas ferramentas de bioinformática para processar de forma rápida e eficaz volumes enormes de dados gerados.

Quais são as principais aplicações da bioinformática?

Na visão descrita por Luscombe e colaboradores em 2001, a bioinformática é destacada pelos seguintes objetivos:

I- Organizar os dados para que os pesquisadores possam acessar as informações e criar novas informações:

Devido ao grande volume de dados gerados, a organização, armazenamento e acesso se tornaram necessários. Por isso, o aumento da quantidade de dados foi acompanhado do surgimento de diversos bancos de dados biológicos.

Uma das primeiras plataformas desenvolvidas e hoje uma das principais utilizadas foi o GenBank, desenvolvido pelo National Institutes of Health (NIH) em 1982. O banco hospeda a maioria dos dados de sequências de ácido nucléico e proteína de milhares de organismos.

Além do GenBank, o Banco de dados de DNA do Japão (DDBJ) e Laboratório Europeu de Biologia Molecular (EMBL) são considerados os bancos de dados primários. Hoje, segundo o Nucleic Acids Research, existem cerca de 1700 bancos de dados biológicos disponíveis.

II- Desenvolver ferramentas e recursos que auxiliem na análise dos dados

A construção de ferramentas para processamentos de dados é um dos objetivos mais importantes da bioinformática. Como o conhecimento científico avança cada vez mais, muitas vezes é necessário desenvolver um novo recurso ou ferramenta computacional para realizar análises de novas descobertas, por exemplo.

Saiba mais em: Pipelines de bioinformática: o que são e como implementar?

III- Usar essas ferramentas para analisar os dados e interpretá-los de forma significativa

As ferramentas de bioinformática podem ser utilizadas por exemplo para orientar e processar dados de NGS através de uma série de conversões de dados, montagem de genomas, alinhar e comparar sequências de DNA com um genoma disponíveis em bancos de dados, realizar ensaios de modelagem.

Exemplos da aplicação de ferramentas de bioinformática.

NGS e bioinformática

O desenvolvimento de tecnologias NGS associadas à bioinformática abriu uma gama de novas possibilidades, como compreender o papel de variações genéticas, processos de evolução e mecanismos funcionais dos organismos, estudos de expressão gênica global, padrões de metilação, marcadores epigenéticos e outros. A relação entre as duas ferramentas também possibilitou o início de uma nova era para a saúde humana, a medicina de precisão.

Embora a união entre a ciência e a tecnologia computacional ainda seja recente, os avanços no conhecimento são gigantes e muito ainda está por vir!  

Principais referências:

Angarica VE, Del Sol A. Bioinformatics Tools for Genome-Wide Epigenetic Research. Adv Exp Med Biol. 2017;978:489-512. doi:10.1007/978-3-319-53889-1_25

Diniz WJ, Canduri F. REVIEW-ARTICLE Bioinformatics: an overview and its applications. Genet Mol Res. 2017;16(1):10.4238/gmr16019645. Published 2017 Mar 15. doi:10.4238/gmr16019645

Mulder NJ, Adebiyi E, Adebiyi M, et al. Development of Bioinformatics Infrastructure for Genomics Research. Glob Heart. 2017;12(2):91-98. doi:10.1016/j.gheart.2017.01.005

Oliver GR, Hart SN, Klee EW. Bioinformatics for clinical next generation sequencing. Clin Chem. 2015;61(1):124-135. doi:10.1373/clinchem.2014.224360

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Relacionados