Inovamos hoje para que você tenha um amanhã melhor.

Principais bancos de dados genéticos

Os bancos de dados genéticos centralizam e permitem o acesso a informações geradas nas pesquisas e podem ser utilizados para comparar dados.

As técnicas de sequenciamento de DNA estão em crescente desenvolvimento e modernização e, desta forma, a ciência também evolui constantemente, trazendo mais informações sobre a diversidade genética dos organismos. Para que estas descobertas sejam compartilhadas dentro da comunidade científica, foram desenvolvidos bancos de dados genéticos onde informações geradas por pesquisas em todo o mundo podem ser depositadas e acessadas.

Estes bancos ou base de dados genéticos são repositórios online que centralizam as informações genéticas a nível de DNA, RNA ou proteína. Além de ter o objetivo de centralizar e permitir o acesso a informações geradas nas pesquisas, estes bancos também podem ser utilizados para comparar dados.

Por exemplo, é possível comparar o genoma de indivíduo a um banco de dados de variantes genéticas para verificar em qual população do mundo tem maior similaridade a seu perfil genético. Outro exemplo é a possibilidade de identificar variantes relacionadas ao desenvolvimento de certos cânceres.

Bancos de dados genéticos

Existem diferentes bancos de dados genéticos, que podem ser divididos em bancos de dados populacionais, que apresentam diferentes variantes de todo genoma, ou bancos de dados de doenças específicas, como de diferentes tipos de câncer.

Os principais bancos de dados genéticos para análise de variante são:

NCBI refSeq- NCBI Reference Sequence Database

O banco de dados de sequência de referência (RefSeq) do National Center for Biotechnology Information (NCBI) é uma coleção de registros abrangente, integrado, não redundante e bem anotado de sequências de referência genômicas, transcritas e de proteínas. Esses registros são selecionados e com curadoria de arquivos de sequências públicas e representam uma redução significativa na redundância em comparação com o volume de dados arquivados pela International Nucleotide Sequence Database Collaboration.

dbSNP- Single Nucleotide Polymorphism Database

Banco de dados de polimorfismos de nucleotídeo único (SNPs) e várias variações em pequena escala que incluem inserções / deleções, microssatélites e variantes não polimórficos. O banco conta também com publicação, frequência populacional, consequência molecular e informações de mapeamento genômico e RefSeq para variações comuns e mutações clínicas.

ABRaOM – Arquivo Brasileiro Online de Mutações

Este repositório de variantes contém variantes genômicas de brasileiros. As variantes foram obtidas através do sequenciamento do exoma total e do genoma total do SABE, uma amostra baseada no censo de idosos de São Paulo.

ESP6500 – Exome Sequencing Project 6500

Frequência alélica alternativa do projeto NHLBI-ESP com 6500 exomas, incluindo as chamadas indel e as chamadas chrY. O banco de dados ESP6500 é composto por um conjunto de 2.203 afro-americanos e 4.300 europeus-americanos, totalizando 6.503 amostras (13.006 cromossomos).

1000 Genomes

Conjunto de dados genéticos de todas as variantes do projeto 1000 Genomas lançado em agosto de 2015. O conjunto agrupa com frequências de alelos de seis populações, incluindo AFR (Africano), AMR (Americano), EAS (Leste Asiático), EUR (Europeu), SAS (sul da Ásia)

Clinvar – Clinical Genome Resource

Banco de dados genéticos de acesso público para compartilhar relatórios de interpretações de variantes e fenótipos humanos com material científico de apoio das evidências. O ClinVar facilita o acesso e a comunicação sobre as relações afirmadas entre a variação genética humana e o estado de saúde observado, e a evidência desta interpretação.

Acesse nosso artigo para saber mais: ClinVar: Como utilizar o maior banco de variantes do mundo

Cosmic – Catalogue Of Somatic Mutations In Cancer

Banco de dados de mutações somáticas de câncer e da frequência de ocorrência em cada subtipo de câncer. Se trata de um abrangente recurso para explorar o impacto das mutações somáticas no câncer humano.

dbNSFP -Database of Human Nonsynonymous SNPs and Their Functional Predictions

Banco de dados desenvolvido para predição funcional e anotação de todas as variantes potenciais de nucleotídeo único não sinônimas (nsSNVs) no genoma humano. Sua versão atual é baseada no Gencode versão 29 / Ensembl versão 94 e inclui um total de 84.013.490 nsSNVs e ssSNVs (SNVs de site de splicing).

Dbscsnv

Um banco de dados abrangente de todos os SNVs humanos em potencial nas regiões de consenso de splicing e suas anotações funcionais. Utilizado para predição de sítios de splicing por AdaBoost e Random Forest, que avalia a probabilidade de uma variante afetar o splicing.

gnomAD – Genome Aggregation Database

É uma convênio de pesquisadores que buscam agregar e harmonizar dados de sequenciamento de exoma e genoma de uma variedade de projetos de sequenciamento de grande escala e disponibilizar dados genéticos resumidos para a comunidade científica. O Gnomad Genoma contêm frequência de alelo em dados de sequência de genoma completo do banco de dados gnomAD em várias populações

Gnomad Exome

Banco de dados de frequência alélica em dados de sequência de exoma completo do banco de dados genéticos gnomAD em várias populações.

OMIM Gene Map – Online Mendelian Inheritance in Man

Banco de dados genéticos abrangente, gratuito e atualizado diariamente. O banco contém genes humanos e fenótipos genético, informações sobre todos os distúrbios mendelianos conhecidos e mais de 16.000 genes.

My Cancer Genome:

Recurso de conhecimento da medicina de precisão na oncologia que fornece informações atualizadas sobre quais mutações são relacionadas ao desenvolvimento de câncer e as implicações terapêuticas relacionadas, incluindo os ensaios clínicos disponíveis. Este banco de dados genéticos contém afirmações sobre o impacto clínico de 16.871 biomarcadores moleculares no uso de 2.861 medicamentos em 955 tipos de câncer. Ele combina mutações tumorais com terapias.

OncoKB – Precision Oncology Knowledge Base

Base de conhecimento de oncologia na medicina de precisão e contém informações sobre os efeitos e implicações no tratamento de alterações específicas do gene do câncer.  As implicações potenciais do tratamento são agrupadas pelo nível de evidência de que uma alteração molecular específica é preditiva da resposta ao medicamento com base na rotulagem da Food and Drug Administration (FDA) dos EUA e diretrizes da National Comprehensive Cancer Network (NCCN).bancos de dados genéticos: OncoKb

PharmGKB – Pharmacogenomics Knowledge Base

Recurso de conhecimento em farmacogenética que abrange informações clínicas, incluindo diretrizes clínicas e rótulos de medicamentos, associações gene-medicamento com potencial ação clínica, ou seja, o impacto de variações genéticas na resposta a medicamentos.

Spidex

Modelo computacional que usa a métrica Percentage of Spliced-In (PSI) para avaliar se uma determinada isoforma de splicing é mais enriquecida na presença ou ausência de uma determinada variante. Pontuações SPIDEX superiores a 5 preveem que a variante afeta o splicing de RNA. No Spidex, diferentemente do dbscsnv11, essas variantes podem estar distantes dos sites de união canônica.

HGV: Human Genome Variation

Banco de dados genéticos online e gratuito sobre variação genômica documentadas em Relatórios de Dados publicados. Um conjunto de informações sobre cada variação é coletado de artigos publicados na revista e adicionado ao banco de dados genéticos. Todos os manuscritos submetidos sobre variação do genoma humano recebem rigorosa revisão por pares e verificações de qualidade por revisores e editores antes da publicação.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Relacionados