Interações proteína-proteína: entenda o interatoma

Interações proteína-proteína correspondem ao contato físico entre duas ou mais proteínas que podem ocorrer em uma célula ou organismo vivo.

As interações proteína-proteína correspondem ao contato físico entre duas ou mais proteínas que podem ocorrer em uma célula ou em um organismo vivo. Este contato deve ser específico e não genérico. Em outras palavras, as proteínas precisam não somente possuir um contato funcional, mas também interagirem entre si. 

As proteínas são importantes constituintes moleculares. Elas possuem várias funções biológicas a partir das suas interações e são essenciais para a maioria dos processos biológicos celulares, desde o metabolismo até a resposta a estímulos.

O conjunto completo das interações proteicas que podem ocorrer no sistema de um organismo é chamado de interatoma e faz parte do estudo da interatômica, que compreende todo o conglomerado de interações moleculares que ocorre em uma determinada célula.

Métodos de análise das interações proteína-proteína

As interações de proteínas (IPP ou PPI do termo inglês: “Protein-Protein Interaction”) podem ser medidas por métodos biológicos experimentais ou preditas por métodos computacionais. Os métodos experimentais estão divididos em duas categorias:

Métodos binários

Medem interações físicas diretas entre pares de proteínas, sendo o sistema duplo-híbrido em leveduras (Y2H do inglês “yeast two-hybrid”) o método genético de larga escala mais utilizado. O sistema de duplo-híbrido em leveduras é um engenhoso ensaio genético criado em leveduras para detectar interações entre proteínas.

Esta técnica tem se tornado cada vez mais popular no estudo de interatomas devido às muitas vantagens que ela apresenta:

  • Capacidade de reportar interações proteicas in vivo
  • Fácil implementação
  • Custos relativamente baixos
  • A possibilidade de análises em larga escala onde podem ser feitas varreduras de busca por possíveis interações mesmo que os componentes que interagem com uma determinada proteína alvo não sejam conhecidos; 

Métodos co-complexos

Podem medir interações físicas entre grupos de proteínas sem diferenciar se elas são diretas ou indiretas, sendo a purificação por afinidade em tandem acoplada a espectrometria de massas (TAP-MS do inglês “tandem affinity purification coupled to mass spectrometry”) o método proteômico em grande escala mais utilizado.

O TAP consiste na expressão de proteínas alvo fusionadas a etiquetas introduzidas geneticamente para promover a identificação dos híbridos. As proteínas-alvo fusionadas passam por uma matriz que contém um ligante específico para a etiqueta e são posteriormente eluídas da matrix pela ação de uma enzima com afinidade à outra porção da etiqueta.

A purificação em tandem da afinidade é o método mais recomendado para aumentar a especificidade do complexo da proteína. A purificação em tandem da afinidade ajuda a melhorar a relação de relação sinal-ruído pela geração refinada da amostra. Ajuda na rotulagem da proteína isótopa estável em identificar os contaminantes da proteína do fundo e os sócios obrigatórios.

As interações de proteínas também podem ser preditas por métodos computacionais a partir da análise de dados biológicos, como sequência, evolução, expressão e estrutura de proteínas. A maioria dos métodos computacionais podem ser divididos em dois tipos:

  • Baseados em simulação: usualmente feitos em baixa escala, devido a um alto custo computacional;
  • Baseados em métodos estatísticos ou aprendizado de máquina: podem ser aplicados em larga escala.

Rede de interações proteína-proteína

rede de interação proteína-proteína (rede IPP) codifica as interações entre as proteínas e auxilia no mapeamento do interatoma de um organismo. Para compreender um sistema complexo, é preciso entender como seus componentes moleculares interagem entre si, e as redes são excelentes modelos para codificar e interpretar essas interações. 

Uma rede é um catálogo dos componentes de um sistema, geralmente chamados de nós ou vértices, e das interações diretas entre eles, chamadas conexões ou arestas. 

Forma de visualização de uma rede de proteínas Disponível em:<:https://www.ufrgs.br/bioinfo/th_gallery/capitulo-6/>

Na rede IPP, os nós são as proteínas e duas proteínas estão conectadas quando existe evidência de que elas interagem. A representação matemática de uma rede é chamada de grafo segundo a Teoria dos Grafos.

Característica e métodos das IPPs

A definição de IPPs deve considerar algumas coisas:

Primeiramente, a definição deve considerar que a interface de interação entre as proteínas deve ser intencional e não acidental. Ou seja, o resultado de eventos ou forças biomoleculares devem ser selecionadas especificamente.

Além disso, ela também deve compreender que a interface de interação deve evoluir para um objetivo específico distinto de funções totalmente genéricas como produção de proteínas, degradação e outras. 

Outro elemento importante para definir IPPs é o contexto biológico em que a interação se encontra. As interações dependem de vários fatores como o tipo celular em que as proteínas se encontram, a fase e do estado do ciclo celular, o estágio de desenvolvimento, de condições ambientais da célula, as modificações na proteína, a presença de cofatores e a presença de outros parceiros de ligação.

Tipos de interação proteína-proteína

As IPPs são classificadas em 4 subdivisões diferentes, dependendo das características do complexo proteico (ou de proteínas) formado por duas ou mais proteínas envolvidas na interação:

  1. Complexos homoméricos ou heteroméricos: se a interação ocorre entre proteínas (subunidades) idênticas, elas formam um complexo homomérico (em sua maioria simétrico e mais estável); em contrapartida, se a IPP ocorre entre proteínas (subunidades) diferentes, ela forma um complexo heteromérico (estabilidade variável).
  2. Complexos obrigatórios e não obrigatórios: se as proteínas envolvidas na IPP são instáveis quando isoladas e são estáveis no complexo, este é considerado obrigatório; caso contrário, se as proteínas são estáveis independentemente quando isoladas, o complexo resultante da IPP não é obrigatório.
  3. Complexos transientes e permanentes: se, após a ocorrência da IPP, as duas proteínas permanecem ligadas no complexo, este é dito permanente (usualmente muito estável); em contrapartida, complexos em interações transientes se associam e desassociam temporariamente e, dependendo da afinidade entre as proteínas, podem formar uma interação forte ou fraca. Complexos obrigatórios são permanentes, enquanto os complexos não obrigatórios podem ser transientes ou permanentes.
  4. Complexos desordenados e ordenados: se a IPP envolve proteínas desordenadas, as quais possuem regiões não estruturadas que se adaptam à conformação da proteína parceira, o complexo é dito desordenado; caso contrário, se as estruturas das proteínas envolvidas na IPP são estáveis e ordenadas (suas estruturadas não se modificam ou se adaptam na ligação) o complexo é dito ordenado.

As estruturas de alguns complexos biológicos formados pelas interações de Proteinas podem ser encontradas em complexos cristalográficos obtidos por meio de cristalografia de raio-X no Banco Mundial de Proteínas (PDB do inglês: “Protein Data Bank”). O PDB fornece as imagens e as sequências de aminoácidos de proteínas resolvidas e depositadas pela comunidade de pesquisadores.

Estrutura tridimensional da proteína 5IZA Disponível em: <https://www.rcsb.org/structure/5IZA>

Métodos Experimentais X Métodos Computacionais

A precisão dos métodos experimentais de larga escala para a detecção de interações de proteínas sofre com uma grande taxa de falsos positivos, especialmente nos dados TAP-MS não editados para pares de proteína que estão no mesmo complexo, mas não em contato físico direto.

No caso do sistema Y2H, o maior obstáculo é a falha em não considerar os aspectos dinâmicos relacionados à interação proteica. Isto cria falsos positivos na interação de proteínas que se encontram em compartimentos celulares completamente diferentes, e portanto, não interagem de fato no organismo.

A limitação dos métodos experimentais gera a necessidade de métodos computacionais de predição de interações de proteicas. Entretanto, existem várias abordagens computacionais para predizer IPPs. Entre eles destacam-se métodos principais baseados em simulações que modelam as forças governando as interações de proteínas, geralmente a nível atômico, calculando a força da interação.

Este tipo de metodologia inclui simulação dinâmica e docking de proteínas, e são mais utilizados no estudo da dinâmica das proteínas do que na determinação das suas interações, uma vez que possui alto custo computacional;

Os métodos estatísticos e de Machine learning (aprendizado de máquina), podem ser aplicados em larga escala e utilizam informação de interações proteicas conhecidas para fazer as predições.

Além destes dois métodos principais, também existe a predição computacional par-a-par de IPPs e sua análise pode ser feita usando mapeamento de ortólogos, eventos de fusão de gene/domínio, co-ocorrência de domínio, e co-expressão de gene.

É importante ressaltar que, a junção dos diferentes métodos computacionais ou experimentais podem trazer mais confiança e precisão para as redes IPP geradas.

Banco de dados de IPPs

Em 2016 o artigo Predicting Protein-Protein Interactions from the Molecular to the Proteome publicado na ACS Publications apresentou uma lista com os principais bancos de dados e repositórios de interações de proteína-proteína, que estão representadas na tabela a seguir.

Lista de bancos de dados organizando IPPs experimentais e curadas pela literatura:

NomeLink WebMétodo de Avaliação da QualidadeNúmero de InteraçõesNúmero de Proteínas
DIPhttp://dip.doe-mbi.ucla.edu/curado78 19127 098
IntActhttp://www.ebi.ac.uk/intact/curado456 48983 574
HPRDhttp://www.hprd.org/curado41 32730 047
MIPShttp://mips.helmholtz-muenchen.de/proj/ppi/curado  
CORUMhttp://mips.helmholtz-muenchen.de/genre/proj/corumum recurso de complexos de proteínas anotados manualmente de organismos mamíferos  
BioGRIDhttp://thebiogrid.org/interações de proteínas e genéticas curadas por publicações345 57753 561
Banco de Dados de Interatômica CCSBhttp://interactome.dfci.harvard.edu/Y2H de larga escala, não curado4 30313 944
STRINGhttp://string-db.org/não curado, nota de confiança >5 milhões
HIPPIEhttp://cbdm-01.zdv.uni-mainz.de/~mschaefer/hippie/avaliação e nota da qualidade72 91611 836
iRefWebhttp://wodaklab.org/iRefWebavaliação e nota da qualidade∼18 000 (para humanos)∼222 098 (para humanos)
HUPOhttp://www.psidev.info/groups/molecular-interactionsavaliação e nota da qualidade  
Pathway Databases    
KEGGhttp://www.kegg.jp/curado  
Reactomehttp://www.reactome.org/curado7 041 (em humanos)7 460(em humanos)
ConsensusPathDBhttp://consensuspathdb.org/ 416 872154 537
SPIKEhttp://www.cs.tau.ac.il/~spike/curado20 41234 338

Disponível em:  <https://www.researchgate.net/publication/301288053_Predicting_Protein-Protein_Interactions_from_the_Molecular_to_the_Proteome_Level>

Desafios e panoramas para o futuro

As redes IPP podem fornecer uma visão complementar para os processos biológicos que englobam as proteínas correspondentes. Para o futuro da área e para os provedores de banco de dados, persistem dois desafios:

1. Desenvolver um filtro melhor de falsos positivos em coleções de IPP;

2. Criar uma distinção adequada do contexto biológico que especifica e determina a existência ou não de uma dada IPP em uma dada situação biológica. 

Além disso, considerar a característica dinâmica, os compartimentos celulares, a estabilidade, a afinidade e dependência do tempo das interações de proteína se torna um importante objetivo para ganhar cada vez mais informações sobre os mecanismos celulares por trás das redes IPPs.

Sobre o Autor

Joanã Oliveira é estudante de graduação em biomedicina pela Universidade Salvador (UNIFACS) e Analista de Marketing na Infobio Jr.

Referências

Relacionados