Framework Bayesiano na Classificação de Variantes Genéticas

O framework bayesiano se torna uma importante ferramenta na análise de dados e tomada de decisões da medicina de precisão. Entenda!
Classificação por framework bayesiano

Com o aumento da quantidade de dados genéticos e a crescente utilização de abordagens genômicas, interpretar esses dados se tornou um grande desafio. O uso do framework bayesiano para a interpretação de dados pode tornar as análises mais precisas e robustas, especialmente ao considerar múltiplas variantes em um locus ou grupo de genes e estudar fenótipos correlacionados com arquitetura genética compartilhada.

Nesse artigo vamos mostrar a importância do framework bayesiano na análise de dados genéticos e como ele pode ajudar na tomada de decisões clínicas.

O que é o framework bayesiano para interpretação de variantes?

O framework bayesiano é um método de inferência estatística que permite combinar informações anteriores sobre um parâmetro populacional com evidências de informações contidas em uma amostra, para orientar a interpretação de variantes.

Essa abordagem consegue calcular respostas para perguntas como: Qual é a probabilidade de que a pressão sanguínea de um paciente diminua se a ele for prescrito o medicamento A? Qual é a probabilidade de que crianças com TDAH tenham um desempenho inferior em relação a outras crianças em um teste padronizado?

Diferente de outras análises, o framework bayesiano leva em conta as diferenças específicas do gene e a variabilidade da probabilidade anterior estimada. Esta análise utiliza frequências alélicas e múltiplos preditores in sílico em um modelo de regressão logística, que inclui antecedentes com base em proporções de caso-controle de portadores relatados na literatura ou bancos de dados públicos, uma covariável categórica para efeitos específicos do gene e termos de modelo fixo para cada gene testado.

Regressão logística: é uma técnica de análise de dados que usa matemática para encontrar as relações entre dois fatores de dados. Em seguida, essa relação é usada para prever o valor de um desses fatores com base no outro.

A abordagem Bayesiana oferece uma variedade de benefícios. Primeiro, combina diferentes tipos de informação, fazendo melhor uso do conhecimento atual. Pode propor uma interpretação e classificação baseada em diversas informações disponíveis quando há apenas variação única e esparsa.

Suas conclusões são fornecidas não como decisões binárias, mas como uma escala contínua que reflete de forma mais transparente o estado de incerteza, em vez de uma falsa sensação de certeza.

No entanto, há também limitações. Como são muitos parâmetros e detalhes distributivos que devem ser especificados na análise, muitas escolhas são feitas em termos de frequência variante padrão e parâmetros de coeficiente. Com isso pode ser influenciada pelo conhecimento prévio e pode sofrer o viés de pesquisas anteriores.

framework bayesiano análise e interpretação de variante

Como funciona o processo de classificação de variantes usando o framework bayesiano?

Em estudos genéticos de doenças ou fenótipos contínuos, variantes raras são difíceis de avaliar individualmente devido ao número limitado de observações de cada variante rara. Portanto, para aumentar o poder de detecção de um sinal, as evidências geralmente são agregadas em variantes em blocos.

Para cada síndrome é identificado um conjunto de genes conhecidos por abrigar variantes patogênicas para essa síndrome. E para cada gene são derivadas as probabilidades anteriores de que uma variante rara seja patogênica.

Em seguida, é feita a identificação de preditores relevantes e usados para construir modelos de regressão logística bayesiana, treinados usando um conjunto de variantes raras bem caracterizadas.

A probabilidade de uma variante observada ser patogênica depende do gene em que está localizada e da síndrome do paciente.

Por exemplo, em um paciente com síndrome do QT longo (SQTL), uma variante em KCNQ1 (um gene implicado em uma grande proporção de casos de SQTL) tem maior probabilidade de patogenicidade do que uma variante em KCNJ5 (que foi implicada apenas em alguns casos).

A carga de variantes raras nos casos é estimada principalmente a partir de relatórios da literatura sobre os rendimentos dos testes genéticos de diagnóstico para cada gene e síndrome.

Na ausência de conhecimento clínico específico detalhado sobre variantes particulares observadas em indivíduos ou em um pequeno número de pessoas, a medicina genômica geralmente depende de catálogos bem estabelecidos de variantes específicas e bancos de dados de variantes para fundamentar conclusões sobre variantes raras.

Há uma variedade de tais catálogos, incluindo o Human Gene Mutation Database (HGMD), Online Mendelian Inheritance in Man (OMIM), ClinVar e vários recursos específicos de fenótipos.

Como a abordagem bayesiana pode ajudar na tomada de decisões clínicas?

Algumas variações genéticas humanas estão intimamente relacionadas a certas doenças ou respostas individuais de pacientes a certos medicamentos; portanto, os médicos podem escolher opções de tratamento específicas para otimizar o resultado do paciente.

Por exemplo, na medicina de precisão, os médicos podem escolher diferentes medicamentos para ajudar seus pacientes a parar de fumar, examinando a velocidade de metabolização da nicotina do paciente.

Descobrir variantes genéticas causais de grandes estudos de associação genética apresenta muitos desafios difíceis. Avaliar quais marcadores genéticos estão envolvidos na determinação do status da característica é uma tarefa computacionalmente exigente, especialmente na presença de interações gene-gene.

A abordagem Bayesiana pode ser usada na forma de uma rede neural bayesiana ter seu uso na análise de estudos de associação genética. A junção de dados sintéticos e reais revelam que são capazes de determinar com eficiência e precisão quais variantes estão envolvidas na determinação do status de controle de caso.

Em outro caso, o uso da abordagem bayesiana esteve presente na fabricação das vacinas para a prevenção da COVID-19. A FDA (Food and Drug Administration) emitiu uma orientação em junho de 2020 que afirmava que a estimativa do ponto final primário de eficácia para um estudo de eficácia controlado por placebo deve ser de pelo menos 50%.

Sendo que a porcentagem mínima do intervalo de confiança da vacina fosse > 30%, como requisito mínimo para a saúde pública. A partir disso, para a parte da fase III do programa clínico, a análise de eficácia primária foi baseada na probabilidade bayesiana de que a eficácia da vacina era >30%.

Os resultados do estudo que foram usados ​​para um pedido de autorização de uso de emergência para o FDA observaram que a probabilidade bayesiana posterior para o VE verdadeiro excedendo o limite inferior predefinido de 30% era > 99,99%, excedendo em muito o critério de sucesso de 98,6%.

Os métodos bayesianos podem ser usados também no monitoramento e tomada de decisão interino do ensaio clínico. A abordagem adaptativa bayesiana foi usada com sucesso para comparar a eficácia e a segurança de dulaglutida e sitagliptina no tratamento do diabetes mellitus tipo 2.

Nesse estudo, as probabilidades de randomização foram adaptadas com base em análises interinas quinzenais usando regras de decisão Bayesiana em relação à probabilidade de dulaglutida ser superior ao placebo e não inferior à sitagliptina.

As análises intermediárias bayesianas ajudaram a selecionar as doses ideais de dulaglutida para prosseguir na segunda parte deste estudo (fase III), que foi altamente bem-sucedida.

Conclusões

Nesta era de desenvolvimento explosivo da genômica e dados de sequenciamento de novapróxima geração (NGS), o estudo de associação do genoma (GWAS) é fundamental para caracterizar características complexas e doenças. No entanto, a interpretação dos resultados continua sendo um processo amplamente manual e demorado que não é escalável para o volume e a diversidade dos dados disponíveis.  

A análise de framework bayesiana consegue atender a avaliação desses resultados de forma robusta. Também agrega pontuações múltiplas in silico e estatísticas de evidências em formas quantitativas e qualitativas prevendo a patogenicidade de cada variante usando uma distribuição de probabilidade para explicar a incerteza.

Em pouco tempo, as análises genéticas poderão integrar dados multi-ômicos e redes de genes para inferir genes de risco em loci, prevendo genes de risco responsáveis ​​por uma hereditariedade significativamente enriquecida. Sugerindo oportunidades para reposicionar drogas existentes em caráter preventivo ainda no período pré natal, por exemplo.

Referências:

Alzu’bi AA, Zhou L, Watzlaf VJM. Genetic Variations and Precision Medicine. Perspect Health Inf Manag. 2019 Apr 1;16(Spring):1a. PMID: 31019429; PMCID: PMC6462879.

Qian D, Li S, Tian Y, Clifford JW, Sarver BAJ, Pesaran T, Gau CL, Elliott AM, Lu HM, Black MH. A Bayesian framework for efficient and accurate variant prediction. PLoS One. 2018 Sep 13;13(9):e0203553. doi: 10.1371/journal.pone.0203553. PMID: 30212499; PMCID: PMC6136750.

Ruberg SJ, Beckers F, Hemmings R, Honig P, Irony T, LaVange L, Lieberman G, Mayne J, Moscicki R. Application of Bayesian approaches in drug development: starting a virtuous cycle. Nat Rev Drug Discov. 2023 Mar;22(3):235-250. doi: 10.1038/s41573-023-00638-0. Epub 2023 Feb 15. PMID: 36792750; PMCID: PMC9931171.

Tavtigian SV, Greenblatt MS, Harrison SM, Nussbaum RL, Prabhu SA, Boucher KM, Biesecker LG; ClinGen Sequence Variant Interpretation Working Group (ClinGen SVI). Modeling the ACMG/AMP variant classification guidelines as a Bayesian classification framework. Genet Med. 2018 Sep;20(9):1054-1060. doi: 10.1038/gim.2017.210. Epub 2018 Jan 4. PMID: 29300386; PMCID: PMC6336098.

Wolc, A., Dekkers, J.C.M. Application of Bayesian genomic prediction methods to genome-wide association analyses. Genet Sel Evol 54, 31 (2022). https://doi.org/10.1186/s12711-022-00724-8.

Relacionados