Diagnóstico clínico: qual o papel da inteligência artificial?

Inteligência artificial, medicina de precisão e metagenômica, juntas expandindo o diagnóstico de doenças infecciosas.

Desde seu surgimento na década de 50, a inteligência artificial tem avançado a passos largos e cada vez mais faz parte de nossas vidas. Por exemplo: os serviços de streaming usam algoritmos de aprendizado de máquina (machine learning) para nos recomendar filmes e séries, nossos celulares usam reconhecimento facial para desbloqueio de tela e os bancos usam algoritmos para detecção de fraudes. Essa tendência também se manifesta na medicina com sua utilização para o diagnóstico clínico.

O diagnóstico clínico, como exames de imagem por exemplo, pode ser muito facilitado por ferramentas de redes neurais convolucionais, enquanto dados de prontuário podem ser analisados com ferramentas de processamento de linguagem natural. Já características genéticas podem ser incorporadas em modelos de risco poligênico. O uso desses dados para otimizar o tratamento médico de pacientes é o cerne da medicina de precisão.

Outra evolução tecnológica fundamental para a medicina de precisão é o Sequenciamento de Nova Geração (NGS), que consiste no sequenciamento genético em larga escala. Essa tecnologia permite sequenciar um genoma humano completo em poucas horas – um avanço vertiginoso em comparação com o primeiro genoma humano, iniciado em 1990 e que demorou 13 anos para terminar.

Hoje, também é possível focar o sequenciamento em trechos específicos relacionados a alguma suspeita ou quadro clínico, como o câncer e/ou as doenças metabólicas. Os resultados podem ser usados para fechar diagnósticos e/ou recomendar tratamentos mais efetivos – daí sua importância para a medicina de precisão.

Mas essa novidade não se limita à análise de DNA humano. O NGS tem sido cada vez mais usado para caracterizar patógenos, como bactérias, vírus e fungos. Casos de uso recentes incluem o rastreio em massa do SARS-CoV-2 e a identificação de novas variantes.

Metagenômica para diagnóstico clínico

Uma técnica muito interessante nesse sentido é a metagenômica, que consiste no uso de NGS para identificar a totalidade dos organismos presentes em uma amostra. Dessa forma, um teste metagenômico não visa procurar um microrganismo específico (como nos testes PCR convencionais) e nem um pequeno conjunto de organismos (como nos testes PCR multiplex), mas sim todo e qualquer organismo com material genético detectável na amostra.

Isso se mostra especialmente útil para condições com diagnóstico clínico diferencial difícil, como as arboviroses (dengue, zika, chikungunya e febre amarela) ou as infecções do sistema nervoso. Ao invés de solicitar uma sequência de testes PCR, os médicos podem descobrir os microrganismos presentes em uma amostra através de um único teste metagenômico.

Outra vantagem é que, como a técnica se baseia em sequenciamento genético, é possível fazer simultaneamente a identificação do patógeno responsável pela doença e de toda sua sequência genética, o que pode ser útil para guiar o tratamento (como nas mutações de resistência do HIV) ou trazer informação epidemiológica (como no rastreio de variantes do SARS-CoV-2).

Essa capacidade da metagenômica de buscar um universo tão grande de organismos traz desafios para a análise dos resultados: cada amostra sequenciada contém centenas de espécies, incluindo não só o patógeno que causou a doença, mas também bactérias da microbiota natural e contaminação dos reagentes utilizados no preparo da amostra. Cabe ao especialista do laboratório utilizar seu conhecimento em microbiologia para identificar os organismos relevantes e reportá-los para a clínica.

Anomalymeter: o algoritmo de inteligência artificial do Varsmetagen

Essa tarefa pode ser bastante trabalhosa e por isso, a equipe do Varsmetagen desenvolveu uma feature para facilitá-la: o escore de anomalia Anomalymeter. Esse escore busca destacar as espécies mais relevantes em uma amostra, ou seja, aquelas cuja abundância foge do observado em amostras conhecidas.

A ideia por trás do método é captar os padrões de composição da microbiota normal utilizando algoritmos de inteligência artificial. A plataforma do Varsmetagen compara as amostras com esse padrão, gerando um indicador numérico da anomalia de cada organismo na amostra.

Diagnóstico clínico anomalymeter
Visão da página de análises do Varsmetagen com a ferramenta Anomalymeter

Neste algoritmo, os organismos mais comuns – como as bactérias normais da microbiota – tendem a receber escores baixos, enquanto organismos mais atípicos – como vírus e bactérias patogênicos – recebem escores altos, dependendo de sua abundância.

Uma bactéria relativamente comum pode também receber escores altos, mas só se estiver com uma abundância muito maior do que foi observado nas amostras de referência. Isso permite que o analista dê atenção especial a todos os organismos com quantificação fora do esperado, evitando falsos negativos e agilizando o processo.

Como o escore de anomalia Anomalymeter “sabe” qual é a composição normal da nossa microbiota?

Nós utilizamos os dados gerados pela rotina de Viroma do Hospital Israelita Albert Einstein para treiná-lo. Centenas de amostras foram analisadas por Bioinformatas, Analistas e Médicos Patologistas, e mais da metade delas não apresentaram nenhum patógeno conhecido. Essas amostras negativas foram utilizadas como referência para descrever como é a estrutura da microbiota normal.

Uma característica importante do escore de anomalia é que ele se baseia em aprendizagem não-supervisionada e detecção de anomalias, que são classes de aprendizado de máquina que buscam entender padrões e estruturas nos dados e identificar casos que fujam desse padrão, respectivamente. Isso quer dizer que o escore de anomalia destaca espécies com abundância acima do esperado, não necessariamente patogênicos. Isso é uma característica importante que permite que o método funcione inclusive com novos patógenos nunca vistos nos dados de treinamento.

Em termos mais técnicos, nós utilizamos o método NMF – Non-negative Matrix Factorization. Esse algoritmo consiste em identificar módulos básicos de organismos que co-ocorrem, e então modelar as amostras de referência como misturas desses módulos.

Essa estratégia é utilizada em diversas áreas – por exemplo, no processamento de linguagem natural para identificar tópicos em textos, ou na própria metagenômica para identificar grupos funcionais a partir de dados de sequenciamento.

No nosso caso, como o objetivo é identificar organismos que não condizem com a variação normal, esses módulos constituem ruído de fundo e devem ser removidos. O resultado, após essa remoção, é uma métrica de quanto sobra de cada organismo após remover todos os grupos que ocorrem normalmente nas amostras.

O escore de anomalia é um diferencial do Varsmetagen, que usa um framework de inteligência artificial e aprendizado de máquina para tornar as análises de metagenômica clínica mais fáceis e precisas.

O método permite a comparação da amostra sequenciada com um padrão composicional formado por centenas de outras, permitindo que o analista foque sua atenção e seus esforços na caracterização das espécies mais inesperadas, sem ter que procurá-las como uma agulha em um palheiro de centenas de outras espécies.

É importante perceber que essa ferramenta não substitui a análise de um profissional com um conhecimento especializado em microbiologia, mas sim o auxilia na identificação de organismos críticos para uma análise mais detalhada.

Esperamos que o escore de anomalia, Anomalymeter, traga mais eficiência e acurácia para essas análises tão importantes para o diagnóstico clínico e rastreio de doenças infecciosas.

Relacionados