Índice
Os resultados de pesquisas científicas geram dados e, pensando na evolução da tecnologia e da ciência em si, é difícil imaginar a quantidade gigantesca de dados gerados diariamente. Além disso, muitas vezes analisar e interpretar os resultados é a parte mais desafiadora dos estudos quando pensamos também na complexidade dos dados obtidos.
Neste cenário, surgiu a bioinformática, a união entre a tecnologia computacional e a ciência.
O que é a bioinformática?


A Bioinformática é uma ciência multidisciplinar que usa de tecnologia e ferramentas da computação na genética para organizar, armazenar, interpretar, visualizar e disseminar dados biológicos.
Na maioria das vezes, a bioinformática é utilizada para estudar a determinação de funções de genes e proteínas, estabelecer relações evolutivas e prever formas tridimensionais das proteínas.
Quando surgiu a bioinformática?
O termo bioinformática foi utilizado pela primeira vez por Paulien Hogeweg e Ben Hesper em 1970 como “O estudo dos processos informáticos em sistemas bióticos “. No entanto, a pesquisadora Margaret Dayhoff foi quem ficou conhecida como a mãe da bioinformática.
A pesquisadora foi a pioneira no desenvolvimento de computadores capazes de determinar a sequência de peptídeo, programas para exibir estruturas tridimensionais de proteínas e métodos computacionais para comparação de sequência.
Em 1965 Dra. Dayhoff participou da criação do “Atlas of Protein Sequence and Structure”, o primeiro banco de dados público computadorizado de sequências de proteínas.
Além destes e de outros pesquisadores que contribuíram de forma grandiosa para o reconhecimento da bioinformática, seu crescimento só foi possível através do desenvolvimento dos computadores.
O avanço da tecnologia dos computadores teve por consequência uma maior capacidade de processamento e memória das máquinas, o que é essencial para analisar a grande quantidade de dados gerados nas pesquisas.
Ciência e tecnologia lado a lado
O desenvolvimento da ciência e dos computadores seguiu uma certa sincronia de evolução. Em 1970 Fred Sanger e Walter Gilbert desenvolveram os primeiros métodos de sequenciamento de DNA.
Então, em 1977, Sanger usou este sistema para deduzir a sequência de DNA do bacteriófago Phi X 174 (ΦX174), o primeiro genoma completo a ser sequenciado com cerca de 5 mil nucleotídeos. Nesta mesma época os computadores ainda apresentavam capacidade de armazenamento limitado.
No final dos anos 80 surgiu a primeira máquina de sequenciamento automático de DNA. Logo em seguida, na década de 90, os computadores se tornaram mais populares, com maior capacidade de armazenamento e processamento, além da possibilidade de acessar a internet.
Nesta época, os primeiros algoritmos para montagem de genoma, ou seja, para definir a sequência de nucleotídeos no material genético, começaram a ser desenvolvidos. O primeiro organismo vivo a ter seu genoma sequenciado foi a bactéria Haemophilus influenzae, em um trabalho publicado em 1995.
Nesta época, a bioinformática se tornou ainda mais conhecida e houve um aumento no investimento para desenvolver novos algoritmos capazes de analisar sequências mais complexas e com maior volume.
Com o avanço da ciência, da tecnologia e da acessibilidade aos dados, em 1990 foi possível iniciar o Projeto Genoma Humano, que contou com pesquisadores de 18 países para mapear o genoma humano, que tem cerca de 3 bilhões de pares de base.
Por volta de 2005, surgiu a tecnologia mais moderna de sequenciamento de DNA, o Sequenciamento de Nova Geração ou NGS, que revolucionou a ciência. Esta tecnologia permite sequenciar bilhões de fragmentos de DNA de uma só vez. Além da agilidade, o NGS também tornou o sequenciamento muito menos custoso financeiramente e, portanto, mais acessível.
Com isso, a lista de genomas completos e do volume de dados biológicos começou a aumentar drasticamente. Por isso, também foi necessário desenvolver novas ferramentas de bioinformática para processar de forma rápida e eficaz volumes enormes de dados gerados.
Quais são as principais aplicações da bioinformática?
Na visão descrita por Luscombe e colaboradores em 2001, a bioinformática é destacada pelos seguintes objetivos:
I- Organizar os dados para que os pesquisadores possam acessar as informações e criar novas informações:
Devido ao grande volume de dados gerados, a organização, armazenamento e acesso se tornaram necessários. Por isso, o aumento da quantidade de dados foi acompanhado do surgimento de diversos bancos de dados genéticos.
Uma das primeiras plataformas desenvolvidas e hoje uma das principais utilizadas foi o GenBank, desenvolvido pelo National Institutes of Health (NIH) em 1982. O banco hospeda a maioria dos dados de sequências de ácido nucléico e proteína de milhares de organismos.
Além do GenBank, o Banco de dados de DNA do Japão (DDBJ) e Laboratório Europeu de Biologia Molecular (EMBL) são considerados os bancos de dados primários. Hoje, segundo o Nucleic Acids Research, existem cerca de 1700 bancos de dados biológicos disponíveis.
II- Desenvolver ferramentas e recursos que auxiliem na análise dos dados
A construção de ferramentas para processamentos de dados é um dos objetivos mais importantes da bioinformática. Como o conhecimento científico avança cada vez mais, muitas vezes é necessário desenvolver um novo recurso ou ferramenta computacional para realizar análises de novas descobertas.
Um exemplo disso, é o estudo de Biologia de sistemas (ou biologia sistêmica) que realiza uma análise quantitativa abrangente da forma com que os componentes de um sistema biológico interagem funcionalmente ao longo do tempo.
Outro exemplo bastante comum de análise é a construção de árvores filogenéticas, um estudo estatístico com o qual é possível analisar as relações evolutivas entre diferentes espécies e organismos.
Saiba mais em: Pipelines de bioinformática: o que são e como implementar?
III- Usar essas ferramentas para analisar os dados e interpretá-los de forma significativa
As ferramentas de bioinformática podem ser utilizadas por exemplo para:
- Processamento dados de NGS através de uma série de conversões de dados;
- Montagem de genomas;
- Alinhamento de sequências;
- Comparação de fragmentos de DNA com um genoma de referência;
- Realização de ensaios de modelagem.


NGS e bioinformática
O desenvolvimento de tecnologias NGS associadas à bioinformática abriu uma gama de novas possibilidades como compreender:
- O papel de variações genéticas;
- Processos evolutivos;
- Mecanismos funcionais dos organismos;
- Estudos de expressão gênica global;
- Padrões de metilação;
- Marcadores epigenéticos e outros.
A relação entre as duas ferramentas também possibilitou o início de uma nova era para a saúde humana, a medicina de precisão. E, embora a união entre a ciência e a tecnologia computacional ainda seja recente, os avanços no conhecimento são gigantes e muito ainda está por vir!


Principais referências:
Angarica VE, Del Sol A. Bioinformatics Tools for Genome-Wide Epigenetic Research. Adv Exp Med Biol. 2017;978:489-512. doi:10.1007/978-3-319-53889-1_25
Diniz WJ, Canduri F. REVIEW-ARTICLE Bioinformatics: an overview and its applications. Genet Mol Res. 2017;16(1):10.4238/gmr16019645. Published 2017 Mar 15. doi:10.4238/gmr16019645
Mulder NJ, Adebiyi E, Adebiyi M, et al. Development of Bioinformatics Infrastructure for Genomics Research. Glob Heart. 2017;12(2):91-98. doi:10.1016/j.gheart.2017.01.005
Oliver GR, Hart SN, Klee EW. Bioinformatics for clinical next generation sequencing. Clin Chem. 2015;61(1):124-135. doi:10.1373/clinchem.2014.224360