Como subir e configurar arquivos no Varstation

Aprenda a subir e configurar arquivos de entrada NGS do tipo FASTQ, BAM ou VCF, independentemente da origem do sequenciamento, no Varstation

O Varstation é o software ideal para o processamento e análise de dados gerados pelo Sequenciamento de Nova Geração de amostras humanas. Neste artigo, demonstramos como é simples configurar pipelines e rotinas em nossa plataforma!

Como configurar um novo pipeline no Varstation?

O Varstation disponibiliza diferentes templates/workflows de acordo com a necessidade de processamento, incluindo o Dragen (Illumina).

Para configurar um deles, basta escolher o que mais se adequa ao seu sequenciamento (é possível checar a descrição de cada um deles, bem como os dados de validação realizados pela nossa equipe de bioinformática) e clicar em “criar novo pipeline”.

A partir deste momento, você poderá especificar as seguintes informações:

  • Nome do pipeline
  • Tipo de análise: germinativa ou somática (em breve);
  • Genoma de referência: hg19 ou hg38 
  • Biblioteca: Amplicon, Captura ou PCR-Free
  • Tipo de processamento: Painel, Exoma ou Genoma
  • Inclusão de arquivo .bed específico para o kit utilizado.

É possível, ainda, escolher thresholds específicos para as métricas de qualidade, de acordo com o dado que foi sequenciado. Os parâmetros modificáveis para as métricas de qualidade são:

  • Cobertura média;
  • Uniformidade;
  • Qualidade de mapeamento: Q20 ou Q30;
  • Padding para a chamada de variantes;
  • Padding para métricas;
  • Porcentagem de cobertura no alvo;
  • Cobertura média e cobertura no alvo para UMI (Unique Molecular Index).

Após finalizar a configuração, o pipeline ficará salvo para ser utilizado no processamento das amostras.

Como configurar uma nova rotina no Varstation?

Realizando o upload

Nossa interface é intuitiva, selecione ou arraste os arquivos do seu computador! Os formatos dos arquivos de entrada, provindos de NGS e aceitos pelo Varstation são:

  • FASTQ;
  • BAM;
  • uBAM;
  • VCF;
  • Arquivos compactados em gzip (.gz).

Configurando um novo processamento

Para criar um novo processamento, basta digitar um nome para a rotina a ser criada, selecionar um pipeline configurado na organização e realizar o upload dos arquivos de entrada.

Após essa etapa, é possível cadastrar indivíduos com seus respectivos históricos clínicos. Além destas, é possível inserir e outras informações relevantes para que sejam vinculados às amostras, bem como marcar amostras como controles. 

Após clicar em “Continuar”, a plataforma criará uma rotina e já iniciará o processamento das amostras! 

Combinando arquivos

O sistema irá tentar combinar os FASTQ com os seus respectivos paired-end para criar cada amostra. A lógica de combinação é baseada na nomenclatura da Illumina, que traz como prefixo “file_R1” para o FASTQ e “file_R2″ para o seu respectivo paired-end.

Ou seja, o sistema irá buscar arquivos com o mesmo prefixo e interpretará que o par “file_R1.fastq” + “file_R2.fastq” pertence à mesma amostra.

Por fim, para cada FASTQ, o sistema aceita um único paired-end R2. É também possível inserir arquivos FASTQ de leitura única, sem o paired-end ou um arquivo .bed específico para cada amostra.

ebook principais arquivos em rotinas de sequenciamento

Deixe um comentário

O seu endereço de e-mail não será publicado.