Amazon Cloud: Democratização dos Exames Genético

Case de sucesso: Varsomics e Amazon Cloud. Entenda como ocorre o processamento e armazenamento dos dados genéticos em nuvem.

“Buscamos um fornecedor que dominasse a tecnologia e tivesse a mesma maturidade que temos na área de saúde e a AWS mostrou estar nesse patamar” – Murilo Cervato, gerente de Inovação e Ciência de Dados do Hospital Israelita Albert Einstein e head da Varsomics® sobre a Amazon Cloud. 

Anunciada oficialmente em novembro de 2021, a Varsomics®, Antes chamada de Varstation®, é especializada em soluções tecnológicas para a prática da medicina de precisão e parceira de tecnologia da AWS. 

A Varsomics foi desenvolvida para atender as demandas do laboratório clínico do Hospital Israelita Albert Einstein, e agora está expandindo suas soluções em referência às ciências Ômicas que envolvem análises e interpretações de  diversos dados moleculares não apenas humanos. 

Com o objetivo de democratizar o acesso a exames de sequenciamento massivo paralelo e crescimento da demanda pelos exames, e então necessidade de processar um volume cada vez maior de dados, a Varsomics®  passou a utilizar a infraestrutura da AWS.

O desafio e implementação do sistema em nuvem

Em 2014, duas áreas do Hospital Israelita Albert Einstein – a de Medicina Diagnóstica Ambulatorial e a Diretoria de Inovação – somaram forças para estruturar uma nova área com o objetivo de democratizar o acesso aos exames de sequenciamento massivo paralelo, mais especificamente exames de diagnóstico molecular baseados em sequenciamento genético de DNA. Foi o embrião do Varstation, que mais tarde daria origem ao que hoje é a Varsomics.

O atual head da Varsomics, Murilo Cervato, lembra que a geração dos dados utilizados no Varstation é dominada por alguns players globais, mas que essas plataformas geram dados a partir dos quais as equipes do hospital não conseguem fazer associações clínicas, devido ao grande volume de dados.

“Quando o hospital adquiriu esses equipamentos, começamos a contextualizar e investigar como seria possível democratizar o acesso a estes exames para todos os pacientes do hospital”, lembra Cervato, que também é especialista em bioinformática, gerente de inovação e ciência de dados no Hospital Albert Einstein.

Ele lembra que um teste genético depende de alguns  pilares, começando pela obtenção da amostra genética do paciente. Esse material, ao chegar ao laboratório, passa por uma série de etapas de extração e purificação. Depois disso, é preciso selecionar as regiões que serão sequenciadas, essas regiões são então ampliadas, gerando milhões de cópias. 

“Esse material entrava no sequenciador”, que gerava um arquivo .txt que pode ter alguns MB ou até 6 TB de dados. Essas informações por si só, não se correlacionavam com o diagnóstico ou dados clínicos do paciente”, lembra.

A ideia da criação do Varstation era receber o arquivo gerado pelo sequenciador e automatizar um processo chamado pipeline de bioinformática. 

Varstation e Amazon Cloud

Processo de utilização do Amazon cloud no sequenciamento

Nesse processo, são anotadas todas as variantes encontradas no DNA do paciente e identificadas aquelas que podem ser patogênicas, indicando um grau relevante de predisposição ao surgimento ou desenvolvimento de uma doença.

Para este processo, o Varstation conta com uma série de algoritmos que permite chegar mais rápido a essa separação e identificação. Além disso, quando ele libera estas informações para a checagem dos médicos, ele otimiza todo o processo de análise de dados: o médico não precisa analisar as 3 milhões de variantes, uma por uma. 

O Varstation permite aos geneticistas correlacionarem os achados moleculares com estudos científicos e com o quadro clínico do paciente.

A plataforma desenvolvida pelo time de Cervato encapsula toda a tecnologia necessária para esse tipo de análise. Mais que isso, é capaz de analisar de forma precisa dados de diferentes fornecedores de tecnologia de sequenciamento. 

“Hoje temos acesso a dados de três diferentes fornecedores, por isso precisávamos de uma plataforma que nos desse a liberdade para analisar todos eles, independente do sequenciador utilizado”, diz.

Criada a plataforma, o desafio seguinte foi garantir o processamento dos dados levantados. Cervato lembra que o dado genômico de um indivíduo é formado por mais de 3 bilhões de letras. 

“Como a cultura do hospital era orientada a ambientes on-premises, a primeira versão do Varstation rodava internamente”, diz, lembrando que a demanda inicial era de cerca de duas dezenas de exames por semana.

No entanto, com o crescimento da demanda, no início de 2016 a equipe percebeu que não seria possível escalar os testes na plataforma interna. Começou aí a busca por um fornecedor de nuvem, e alguns chegaram a ser utilizados sem sucesso.

A escolha do AWS: Amazon cloud

“Sentimos que alguns dos fornecedores com os quais trabalhamos não estavam maduros o suficiente no âmbito de nuvem. Ao mesmo tempo, identificamos na AWS um grau de maturidade, escalabilidade e segurança que se alinhou aos nossos requisitos”, diz Cervato. 

“Buscamos um fornecedor que dominasse a tecnologia e tivesse a mesma maturidade que temos na área de saúde e bioinformática, a AWS (Amazon Cloud) mostrou estar nesse patamar”.

Definida a migração, houve dois pontos que foram fundamentais para seu sucesso. O primeiro deles foi a jornada de capacitação do time, que sempre teve expertise on-site. 

“Antes de irmos para a nuvem, capacitamos todo o time nesse tipo de ambiente. Isso abrangeu desde o time de vendas até o time de desenvolvimento e permitiu que o processo de migração fosse mais suave”, explica.

Depois dos treinamentos, foram realizadas análises financeiras, comparando os custos exigidos para a manutenção de uma estrutura local e os valores a serem investidos no projeto com a AWS. Ao final, o processo de migração permitiu que o Varstation fosse economicamente viável.

A arquitetura desenvolvida suporta hoje uma rotina que gera 6TB de dados por equipamento – e hoje são 4 em operação -, o que demanda uma estrutura de storage bastante robusta. 

Para isso, há um processo de orquestração baseado no Amazon Simple Storage Service (Amazon S3), que mantém os dados quentes até a entrega do laudo final. 

Já o processamento é feito utilizando-se Amazon Elastic Compute Cloud (EC2) no modelo Spot, que é um modelo de compra que oferece até 90% de desconto pelo uso da capacidade não utilizada de máquinas virtuais da AWS.

De acordo com Cervato, o ambiente criado dentro da AWS permitiu, inclusive, a realização do processo de expansão do Varstation. “Hoje nos chamamos Varsomics, que é o Varstation somado as demais plataformas ômicas, agora com análises multiômicas”, explica. 

A nova marca, anunciada oficialmente em novembro de 2021, ampliou também o portfólio de serviços, que agora incluem também o Varsmetagen, que vai realizar análises de dados de vírus, bactérias e fungos. “Somos uma área consolidada com o foco em quatro frentes: Varstation, Varsconsult, Varsmetagem e Varsacademy”, revela. 

Benefícios da estrutura Amazon cloud

Cervato afirma que o principal diferencial trazido pela nova arquitetura em nuvem da Amazon Cloud é o ganho de escala. “Se investimos mil dólares por mês em uma estrutura on-premises, eu tenho uma estrutura que está ali disponível. Se minha demanda está aderente a isso, tudo bem. 

Se minha demanda for maior, eu não consigo entregar para o paciente o laudo no tempo que ele espera, gerando reclamações”, compara. Para ele, com a AWS foi possível ganhar flexibilidade de escalar quando for preciso, entregando os resultados no prazo independente da demanda.

Outro benefício apontado é a proximidade com os principais usuários, os médicos. “No início do ano autorizamos nosso corpo clínico a avaliar outras plataformas de mercado. Eles avaliaram quatro concorrentes do Varstation e concluíram que estamos um degrau acima, entregando mais valor durante o processo de análise. 

A solução se mostrou a melhor”, comemora. Por conta desses relatos e desse processo de benchmark, os médicos passaram a direcionar mais funcionalidades a serem desenvolvidas, isso porque o Varstation entrega mais valor em menos tempo. 

Próximos passos

Com a consolidação do Varstation, Cervato afirma que o futuro é o desenvolvimento da Varsomics, com a consolidação de suas áreas. Aqui entra a ampliação das análises de metagenômica. O objetivo é oferecer para os clientes o mesmo conceito de uma plataforma de bioinformática, agora direcionada a análise de micro-organismos, o que deve ser atendido pela Varsmetagen. 

Em outra frente, iremos investir na área de consultoria com a Varsconsult, mais especificamente no desenvolvimento de projetos conjuntos com parceiros de negócios em bioinformática.

Por fim, o Varsacademy, que é uma plataforma que vai oferecer todo o portfólio de cursos de curta duração para pessoas da área da saúde,  que tenham interesse em desenvolver know how em análise de dados genômicos. Para isso, ela vai oferecer uma jornada de aulas e treinamentos para pessoas que tenham interesse na área. 

Um dos projetos em que a Varsomics já está trabalhando é a análise de genomas da população brasileira, criando uma base de dados que leve em conta o contexto da miscigenação existente aqui. “Para isso, recentemente fizemos uma parceria com pesquisadores da USP, o que nos deu acesso a mais de mil residentes de São Paulo que foram sequenciados por eles. 

Em parceria com AWS vamos desenvolver estratégias de cálculo de risco poligênico”, revela. Os dados de genoma completos da coorte SABE (Saúde Bem-estar e Envelhecimento) foram gerados​​ em uma parceria entre USP (CEGH-CEL e Faculdade de Saúde Pública), HIAE e Human Longevity, e já são utilizados como referência em diagnóstico molecular através do ABraOM (Arquivo Brasileiro Online de Mutações).

Na prática, estes dados da população brasileira serão reprocessados na AWS utilizando a melhor prática de análise e processamento de genomas. A partir daí, será construído um banco de dados com todas estas informações, ganhando acesso a como esta população é miscigenada e a possibilidade de testar todos os mecanismos de cálculos poligênico. Este projeto deve seguir pelos próximos 12 meses.

Sobre a Varsomics

A Varsomics surgiu dentro do laboratório clínico e foi desenvolvida no laboratório de inovação do Hospital Israelita Albert Einstein pelo especialista em bioinformática Murilo Cervato, que desenvolveram inicialmente o Varstation: plataforma de análise genética humana que surgiu para automação do então complexo e manual processo de análise de dados. 

Com a consolidação da tecnologia de NGS para o diagnóstico molecular, novos exames surgiram em resposta às demandas clínicas. 

Naturalmente, produtos relacionados às áreas associadas às ômicas e bioinformática foram desenvolvidos, ampliando suas atividades em outros segmentos. Assim surgiu a Varsomics, consolidando uma evolução que envolve: desenvolver novos produtos voltados à área de análises genéticas e medicina de precisão.

Trazendo a ideia generalista e de diversidade, como são as várias iniciativas dentro do Omics, Genômica Humana, micro e consultoria tech voltada a genômica.

Benefícios

  • Ganho de escala;
  • Possibilidade de utilização de processamento de acordo com a demanda;
  • Leitura de dados de diferentes fornecedores;
  • Maior conveniência para os médicos.

Serviços AWS

  • Amazon Simple Storage Service (Amazon S3)
  • Amazon Elastic Compute Cloud (EC2)
  • Amazon FSx for Lustre
  • AWS Batch
  • AWS Glue
  • AWS Lake Formation
  • Amazon EMR
Relacionados