Clustering de proteine - Athena Computing

Présentation:

Notre objectif est de reproduire le clustering de protéines en partant d’un logiciel appelé chimera qui sert à la modélisation de protéines en 3 dimensions, ce logiciel dispose de nombreux outils qui permettent d’intéragir avec les protéines qui y sont chargées.
Pour le calcul du clustering, ce logiciel se sert de l’article : An automated approach for clustering an ensemble of NMR-derived protein structures into conformationally related subfamilies. Kelley LA, Gardner SP, Sutcliffe MJ publié en 1996.
Pour faire cela, il faudra analyser cet article pour en faire ressortir le fonctionnement de la clusterisation.
Ensuite, grâce à l’étude de l’article, créer notre propre logiciel qui calculerait le clustering avec des entrées les plus génériques possible et sortirait les informations de la façon dont on le veut pour des tâches automatiques où un clustering de protéines serait nécessaire. Le but étant d’avoir un logiciel qui peut être utilisé de la manière la plus flexible possible autant pour les entrées que pour la sortie des résultats.

Le cluster est l’art d’associer les protéines entre-elles par famille, pour identifier les protéines qui se ressemblent à des fins de recherche.

Petit mot : pour ceux qui recherchent une librairie permettant de charger des fichiers PDB, j’ai mis un fichier à part, c’est une librairie en C/C++ que j’ai réimplanté moi-même car il y en a très peu. Elle est facile à modifier et modulable.

Compilation : Utiliser Qt creator avec QT 4 ou QT5

Rapport du projet : deroulement_clusterisation doxygen

Source du projet : clustering2 mypdbreader