DEVELOPMENT AND APPLICATION OF A QM/MM DOCKING ALGORITHM
Details
Serval ID
serval:BIB_564B4E8614DF
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
DEVELOPMENT AND APPLICATION OF A QM/MM DOCKING ALGORITHM
Director(s)
Michielin O.
Codirector(s)
Rohrig U., Zoete V.
Institution details
Université de Lausanne, Faculté de biologie et médecine
Address
Faculté de biologie et de médecineUniversité de LausanneCH-1015 LausanneSUISSE
Publication state
Accepted
Issued date
2016
Language
english
Abstract
Molecular docking has become a routine application in drug design projects, when structural information about the target is available. Its task is to predict the binding mode of a ligand within the binding site of a macromolecule, usually an enzyme or a receptor. Docking algorithms are composed of two main components: I ) pose generation and 2) scoring. The first component ailns to generate different ligand poses on the surface of the protein, while the goal of the second component is to score and to rank the generated ligand poses in order to identify the native binding mode as its global minimum.
Many docking programs have been developed, but their accuracy is limited due to difficulties in correctly treating protein flexibility, polarization, charge transfer and covalent interactions, for example with transition metal ions.
To address the challenges of treating polarization and covalent interactions in docking, we developed a hybrid quantum mechanical/molecular mechanical (QM/MM) scoring fonction based on the semiempirical self-consistent charge density functional tight-binding (SCC-DFTB) method and the CHARMM force field.
To benchmark this scoring function, we created a publicly available data set of high quality X-ray structures of zinc metalloproteins. For the zinc-binding data set, QMIMM scoring yielded a significantly improved success rate compared to the classical scoring fonction (77.0% vs 61.5%), while for zinc non-binding data set success rate remained constant (49 .1%). Compared to widely use docking programs AutoDock and AutoDock Vina, our QMIMM scoring scheme performed significantly better and also improved the prediction of correct zinc binding geometries.
In the following, we implemented this scoring function into our in-house docking code Attracting Cavities to perform on-the-fly QM/MM docking. We tested this implementation on our previously developed zinc dataset, the Astex diverse dataset and a newly developed challenging set of 87 heme proteins.
We found an improved success rate for the zinc-binding dataset using the QM/MM on-the-fly docking algorithm (65.5% vs 55.7%). On the Astex dataset, the QM/MM success rate remained close to the classical success rate (71.8% vs 75.3 %). For the heme-binding dataset, the improvement due to the QM/MM treatment is even more striking (success rate of 62.2% vs 18.9%) than for the zinc metalloproteins. These results demonstrate that our QM/MM approach yields improved results for metalloproteins, which pose a severe challenge to classical docking codes due to strong polarization or the formation of bonds of covalent nature . On the other hand, for the common protein/ligand complexes present in the Astex dataset, the QM/MM docking provides results on par with the classical force-field approach.
With the current work we bring docking to a next level by introducing the accuracy of QM-derived interactions in a fully automatized docking process. This enhanced accuracy will be used for real-life drug design applications.
--
Le docking de molécules est devenu une tâche usuelle pour les projets de chimie medicinale, lorsque des informations sur la structure de la cible therapeutique sont disponibles. Son objectif principal est la prédiction du mode de liaison d'un ligand à l'interieur d'une macro-structure (protéine). Les algorithmes de docking sont composés de deux parties principales: 1) la génération de poses et 2) le scoring de ces dernières. La première partie a pour but de générer différentes conformations structurelles de ligands à la surface de la protéine alors que la deuxième joint une valeur physico-chimique permettant de classer et de minimiser les poses générées dans la première partie.
De nom breux programmes de docking ont été développés, mais leur précision reste limitée dû aux difficultés de traiter correctement différentes propriétés, telles que la fléxibilité de la protéine, la polarisation, le transfert de charges et les interactions covalentes (ex : les métaux de transition).
Afin de répondre au défi que pose la polarisation et les interactions covalentes lors d'un docking, une fonction de score a été développée. Celle-ci est un hybride entre méchanique quantique et méchanique moléculaire (QMIMM) basée sur la méthode fonctionelle semi-empirique SCC-DFTB et le champ de force de méchanique moleculaire classique (CHARMM).
Afin d'évaluer notre function de score, un ensemble de structures moléculaires contenant du zinc et provenant d'images déduite par rayons X de hautes resolution fut créé, testé et mis à disposition du public. Pour cet ensemble, le score donné par la méthode QM/MM améliore de manière significative le taux de réussite du docking en comparaison avec la function classique de score (77.0% contre 61.5%), alors que pour l'ensemble de données avec un zinc allosterique, le taux de succès est resté constant (49.1%). En comparaison avec les programmes de docking AutoDock et AutoDock Vina, notre fonction de score QMIMM fournit de meilleurs résultats et trouve des positions acceptable de liaisons entre un ligand et le ion zinc.
Par la suite, cette fonction de score a été incorporée au programme (Attracting Cavities) précédemment développé dans le groupe de Molecular Modeling du SIB, afin d'effectuer des docking avec évalutation QMIMM à la volée. Nous avons testé cette implémentation sur différents ensembles de donnée : notre ensemble contenant du zinc, l'ensemble diversifié d'Astex ainsi qu'un nouvel ensemble de 87 protéines contenant une hème structure.
Le taux de réussite du docking pour l'ensemble contenant du zinc en utilisant notre fonction QM!MM est meilleur qu'avec la fonction classique (65.5% contre 55.7%). Sur l'ensemble d'Astex, le taux de réussite est proche du taux avec la fonction classique (71.8% contre 75.3 %). Pour l'ensemble contenant des hèmes, le gain en utilisant notre fonction QMIMM est encore plus évident (62.2% contre 18.9%). Ces résultats mettent en évidence que notre approche donne de meilleurs résultats pour les protéines contenant des atomes métalliques, qui sont un véritable défi pour les méthodes de docking classiques à cause de leur forte polarisation et de la potentielle formation de liaisons covalentes. Néanmoins, pour les complexes ligand / protéine standards présent dans Astex, l'approche QMIMM donne des résultats équivalents aux méthodes classiques utilisant un champ de force moléculaire.
Avec ce travail, nous améliorons distinctement le docking en introduisant la précision des interactions dérivées de la méchanique quantique dans un processus de docking automatisé. Cette précision améliorée peut alors être utilisée pour de la recherche médicale.
Many docking programs have been developed, but their accuracy is limited due to difficulties in correctly treating protein flexibility, polarization, charge transfer and covalent interactions, for example with transition metal ions.
To address the challenges of treating polarization and covalent interactions in docking, we developed a hybrid quantum mechanical/molecular mechanical (QM/MM) scoring fonction based on the semiempirical self-consistent charge density functional tight-binding (SCC-DFTB) method and the CHARMM force field.
To benchmark this scoring function, we created a publicly available data set of high quality X-ray structures of zinc metalloproteins. For the zinc-binding data set, QMIMM scoring yielded a significantly improved success rate compared to the classical scoring fonction (77.0% vs 61.5%), while for zinc non-binding data set success rate remained constant (49 .1%). Compared to widely use docking programs AutoDock and AutoDock Vina, our QMIMM scoring scheme performed significantly better and also improved the prediction of correct zinc binding geometries.
In the following, we implemented this scoring function into our in-house docking code Attracting Cavities to perform on-the-fly QM/MM docking. We tested this implementation on our previously developed zinc dataset, the Astex diverse dataset and a newly developed challenging set of 87 heme proteins.
We found an improved success rate for the zinc-binding dataset using the QM/MM on-the-fly docking algorithm (65.5% vs 55.7%). On the Astex dataset, the QM/MM success rate remained close to the classical success rate (71.8% vs 75.3 %). For the heme-binding dataset, the improvement due to the QM/MM treatment is even more striking (success rate of 62.2% vs 18.9%) than for the zinc metalloproteins. These results demonstrate that our QM/MM approach yields improved results for metalloproteins, which pose a severe challenge to classical docking codes due to strong polarization or the formation of bonds of covalent nature . On the other hand, for the common protein/ligand complexes present in the Astex dataset, the QM/MM docking provides results on par with the classical force-field approach.
With the current work we bring docking to a next level by introducing the accuracy of QM-derived interactions in a fully automatized docking process. This enhanced accuracy will be used for real-life drug design applications.
--
Le docking de molécules est devenu une tâche usuelle pour les projets de chimie medicinale, lorsque des informations sur la structure de la cible therapeutique sont disponibles. Son objectif principal est la prédiction du mode de liaison d'un ligand à l'interieur d'une macro-structure (protéine). Les algorithmes de docking sont composés de deux parties principales: 1) la génération de poses et 2) le scoring de ces dernières. La première partie a pour but de générer différentes conformations structurelles de ligands à la surface de la protéine alors que la deuxième joint une valeur physico-chimique permettant de classer et de minimiser les poses générées dans la première partie.
De nom breux programmes de docking ont été développés, mais leur précision reste limitée dû aux difficultés de traiter correctement différentes propriétés, telles que la fléxibilité de la protéine, la polarisation, le transfert de charges et les interactions covalentes (ex : les métaux de transition).
Afin de répondre au défi que pose la polarisation et les interactions covalentes lors d'un docking, une fonction de score a été développée. Celle-ci est un hybride entre méchanique quantique et méchanique moléculaire (QMIMM) basée sur la méthode fonctionelle semi-empirique SCC-DFTB et le champ de force de méchanique moleculaire classique (CHARMM).
Afin d'évaluer notre function de score, un ensemble de structures moléculaires contenant du zinc et provenant d'images déduite par rayons X de hautes resolution fut créé, testé et mis à disposition du public. Pour cet ensemble, le score donné par la méthode QM/MM améliore de manière significative le taux de réussite du docking en comparaison avec la function classique de score (77.0% contre 61.5%), alors que pour l'ensemble de données avec un zinc allosterique, le taux de succès est resté constant (49.1%). En comparaison avec les programmes de docking AutoDock et AutoDock Vina, notre fonction de score QMIMM fournit de meilleurs résultats et trouve des positions acceptable de liaisons entre un ligand et le ion zinc.
Par la suite, cette fonction de score a été incorporée au programme (Attracting Cavities) précédemment développé dans le groupe de Molecular Modeling du SIB, afin d'effectuer des docking avec évalutation QMIMM à la volée. Nous avons testé cette implémentation sur différents ensembles de donnée : notre ensemble contenant du zinc, l'ensemble diversifié d'Astex ainsi qu'un nouvel ensemble de 87 protéines contenant une hème structure.
Le taux de réussite du docking pour l'ensemble contenant du zinc en utilisant notre fonction QM!MM est meilleur qu'avec la fonction classique (65.5% contre 55.7%). Sur l'ensemble d'Astex, le taux de réussite est proche du taux avec la fonction classique (71.8% contre 75.3 %). Pour l'ensemble contenant des hèmes, le gain en utilisant notre fonction QMIMM est encore plus évident (62.2% contre 18.9%). Ces résultats mettent en évidence que notre approche donne de meilleurs résultats pour les protéines contenant des atomes métalliques, qui sont un véritable défi pour les méthodes de docking classiques à cause de leur forte polarisation et de la potentielle formation de liaisons covalentes. Néanmoins, pour les complexes ligand / protéine standards présent dans Astex, l'approche QMIMM donne des résultats équivalents aux méthodes classiques utilisant un champ de force moléculaire.
Avec ce travail, nous améliorons distinctement le docking en introduisant la précision des interactions dérivées de la méchanique quantique dans un processus de docking automatisé. Cette précision améliorée peut alors être utilisée pour de la recherche médicale.
Create date
02/09/2016 8:52
Last modification date
20/08/2019 14:10