Dissertação - Uma abordagem Ensemble Learning para aprimorar a predição de energia livre de ligação entre complexos proteína-ligante

Autor: Patrícia Padula Lopes (Currículo Lattes)

Resumo

Apesar da intensa pesquisa ao longo dos anos, melhorar a precisão das funções de pontuação para prever a energia livre de ligação em complexos proteína-ligante provou ser uma tarefa desafiadora. Para superar este desafio, várias técnicas de aprendizado de máquina têm sido usadas para estimar os parâmetros que são mais importantes para predição da afinidade entre complexos proteína-ligante. Nesse contexto, este trabalho se propõe a apresentar uma metodologia, cuja finalidade é combinar os resultados da utilização de diferentes técnicas de aprendizado de máquina para seleção de atributos em uma abordagem Ensemble, ao empregar a função de pontuação DeltaVinaRF20. Comparando os escores obtidos, utilizando o nosso modelo, em relação ao Poder de Classificação e do Poder de Pontuação e de acordo com a avaliação do CASF-2016, ocupamos a segunda posição deste ranking. Para essas métricas, não foi possível igualar o desempenho da nossa função de pontuação a do DeltaVinaRF20. Porém, observamos que a função de pontuação que foi proposta, conseguiu superar várias das funções de escore com licença comercial avaliadas no CASF-2016 em relação a estas duas métricas. Já em relação ao Poder de Ancoragem, conseguimos igualar nosso escore ao obtido pela função de pontuação DeltaVinaRF20, mas utilizando o método Suport Vector Machine e aplicando várias técnicas computacionais e de aprendizado de máquina como: Ensemble, técnicas de seleção de atributos e otimização de parâmetros.

TEXTO COMPLETO

Palavras-chave: Engenharia de computaçãoFunções de pontuaçãoAprendizado computacionalEnsemble learningPrediçãoAfinidade de ligação