Índice
Os resultados de pesquisas científicas geram dados e, pensando na evolução da tecnologia e da ciência em si, é difícil imaginar a quantidade gigantesca de dados gerados diariamente. Além disso, muitas vezes analisar e interpretar os resultados é a parte mais desafiadora dos estudos quando pensamos também na complexidade dos dados obtidos. Neste cenário, surgiu a bioinformática, a união entre a tecnologia computacional e a ciência.
O que é a bioinformática?


A Bioinformática é uma ciência multidisciplinar que usa de tecnologia e ferramentas computacionais para organizar, armazenar, interpretar, visualizar e disseminar dados biológicos.
Na maioria das vezes, a bioinformática é utilizada para estudar a determinação de funções de genes e proteínas, estabelecer relações evolutivas e prever formas tridimensionais das proteínas.
Quando surgiu a bioinformática?
O termo bioinformática foi utilizado pela primeira vez por Paulien Hogeweg e Ben Hesper em 1970 como “O estudo dos processos informáticos em sistemas bióticos “. No entanto, a pesquisadora Margaret Dayhoff foi quem ficou conhecida como a mãe da bioinformática.
A pesquisadora foi a pioneira no desenvolvimento de computadores capazes de determinar a sequência de peptídeo, programas para exibir estruturas tridimensionais de proteínas e métodos computacionais para comparação de sequência. Em 1965 Dra. Dayhoff participou da criação do “Atlas of Protein Sequence and Structure”, o primeiro banco de dados público computadorizado de sequências de proteínas.
Além destes e de outros pesquisadores que contribuíram de forma grandiosa para o reconhecimento da bioinformática, seu crescimento só foi possível através do desenvolvimento dos computadores.
O avanço da tecnologia dos computadores teve por consequência uma maior capacidade de processamento e memória das máquinas, o que é essencial para analisar a grande quantidade de dados gerados nas pesquisas.
Ciência e tecnologia lado a lado
O desenvolvimento da ciência e dos computadores seguiu uma certa sincronia de evolução. Em 1970 Fred Sanger e Walter Gilbert desenvolveram os primeiros métodos de sequenciamento de DNA.
Então, em 1977, Sanger usou este sistema para deduzir a sequência de DNA do bacteriófago Phi X 174 (ΦX174), o primeiro genoma completo a ser sequenciado com cerca de 5 mil nucleotídeos. Nesta mesma época os computadores ainda apresentavam capacidade de armazenamento limitado.
No final dos anos 80 surgiu a primeira máquina de sequenciamento automático de DNA. Logo em seguida, na década de 90, os computadores se tornaram mais populares, com maior capacidade de armazenamento e processamento, além da possibilidade de acessar a internet.
Nesta época, os primeiros algoritmos para montagem de genoma, ou seja, para definir a sequência de nucleotídeos no material genético, começaram a ser desenvolvidos. O primeiro organismo vivo a ter seu genoma sequenciado foi a bactéria Haemophilus influenzae, em um trabalho publicado em 1995.
Nesta época, a bioinformática se tornou ainda mais conhecida e houve um aumento no investimento para desenvolver novos algoritmos capazes de analisar sequências mais complexas e com maior volume.
Com o avanço da ciência, da tecnologia e da acessibilidade aos dados, em 1990 foi possível iniciar o Projeto Genoma Humano, que contou com pesquisadores de 18 países para mapear o genoma humano, que tem cerca de 3 bilhões de pares de base.
Por volta de 2005, surgiu a tecnologia mais moderna de sequenciamento de DNA, o Sequenciamento de Nova Geração ou NGS, que revolucionou a ciência. Esta tecnologia permite sequenciar bilhões de fragmentos de DNA de uma só vez. Além da agilidade, o NGS também tornou o sequenciamento muito menos custoso financeiramente e, portanto, mais acessível.
Com isso, a lista de genomas completos e do volume de dados biológicos começou a aumentar drasticamente. Por isso, também foi necessário desenvolver novas ferramentas de bioinformática para processar de forma rápida e eficaz volumes enormes de dados gerados.
Quais são as principais aplicações da bioinformática?
Na visão descrita por Luscombe e colaboradores em 2001, a bioinformática é destacada pelos seguintes objetivos:
I- Organizar os dados para que os pesquisadores possam acessar as informações e criar novas informações:
Devido ao grande volume de dados gerados, a organização, armazenamento e acesso se tornaram necessários. Por isso, o aumento da quantidade de dados foi acompanhado do surgimento de diversos bancos de dados biológicos.
Uma das primeiras plataformas desenvolvidas e hoje uma das principais utilizadas foi o GenBank, desenvolvido pelo National Institutes of Health (NIH) em 1982. O banco hospeda a maioria dos dados de sequências de ácido nucléico e proteína de milhares de organismos.
Além do GenBank, o Banco de dados de DNA do Japão (DDBJ) e Laboratório Europeu de Biologia Molecular (EMBL) são considerados os bancos de dados primários. Hoje, segundo o Nucleic Acids Research, existem cerca de 1700 bancos de dados biológicos disponíveis.
II- Desenvolver ferramentas e recursos que auxiliem na análise dos dados
A construção de ferramentas para processamentos de dados é um dos objetivos mais importantes da bioinformática. Como o conhecimento científico avança cada vez mais, muitas vezes é necessário desenvolver um novo recurso ou ferramenta computacional para realizar análises de novas descobertas, por exemplo.
Saiba mais em: Pipelines de bioinformática: o que são e como implementar?
III- Usar essas ferramentas para analisar os dados e interpretá-los de forma significativa
As ferramentas de bioinformática podem ser utilizadas por exemplo para orientar e processar dados de NGS através de uma série de conversões de dados, montagem de genomas, alinhar e comparar sequências de DNA com um genoma disponíveis em bancos de dados, realizar ensaios de modelagem.


NGS e bioinformática
O desenvolvimento de tecnologias NGS associadas à bioinformática abriu uma gama de novas possibilidades como compreender:
- O papel de variações genéticas,
- Processos de evolução
- Mecanismos funcionais dos organismos
- Estudos de expressão gênica global,
- Padrões de metilação,
- Marcadores epigenéticos e outros
A relação entre as duas ferramentas também possibilitou o início de uma nova era para a saúde humana, a medicina de precisão. E, embora a união entre a ciência e a tecnologia computacional ainda seja recente, os avanços no conhecimento são gigantes e muito ainda está por vir!


Principais referências:
Angarica VE, Del Sol A. Bioinformatics Tools for Genome-Wide Epigenetic Research. Adv Exp Med Biol. 2017;978:489-512. doi:10.1007/978-3-319-53889-1_25
Diniz WJ, Canduri F. REVIEW-ARTICLE Bioinformatics: an overview and its applications. Genet Mol Res. 2017;16(1):10.4238/gmr16019645. Published 2017 Mar 15. doi:10.4238/gmr16019645
Mulder NJ, Adebiyi E, Adebiyi M, et al. Development of Bioinformatics Infrastructure for Genomics Research. Glob Heart. 2017;12(2):91-98. doi:10.1016/j.gheart.2017.01.005
Oliver GR, Hart SN, Klee EW. Bioinformatics for clinical next generation sequencing. Clin Chem. 2015;61(1):124-135. doi:10.1373/clinchem.2014.224360