ARTYKUŁ

Michał Sapa, Alicja Gawalska, Marcin Kołaczkowski, Adam Bucki

The use of machine learning-based sequential virtual screening in the search of new ligands of 5-HT6 receptor
2023-04-05

Wykorzystanie sekwencyjnego wirtualnego skriningu opartego na uczeniu maszynowym w poszukiwaniu nowych ligandów receptora 5-HT6

Receptor 5-HT6 uczestniczy w regulacji procesów nauki i zapamiętywania. Z tego też względu bada się wykorzystanie ligandów tego receptora w leczeniu chorób neurodegeneracyjnych, takich jak choroba Alzheimera, depresja czy autyzm. Rozwój technik uczenia maszynowego (ang. Machine Learning, ML) i dostęp do dużych baz danych związków chemicznych pozwala na coraz częstsze korzystanie z tych metod w poszukiwaniu nowych leków. Wykorzystanie ML w testach przedklinicznych pozwala na skrócenie czasu i kosztów badań nad lekami.

W poniższej pracy wykorzystano sekwencyjny wirtualny skrining w poszukiwaniu nowych struktur o potencjalnym wysokim powinowactwie do receptora 5-HT6. Każdy etap oparty był na modelach uczenia maszynowego, których zadaniem była klasyfikacja związków na związki potencjalnie aktywne i nieaktywne. Jako grupę treningową wykorzystano dane z bazy ChEMBL, zawierające informacje na temat powinowactwa liganda do receptora, mierzonego za pomocą wartości stałej inhibicji (Ki). Pierwszy etap obejmował podejście oparte na ligandach (ang. Ligand-Based Drug Discovery, LBDD), gdzie wykorzystując deskryptory opisujące strukturę chemiczną ligandów oraz fingerprinty Klekoty-Rotha, opracowano model klasyfikacyjny, który wyselekcjonował wstępną grupę kandydatów z bazy firmy Otava. W drugim etapie wykorzystano podejście oparte na strukturze receptora (ang. Structure-Based Drug Discovery, SBDD). W tym celu wykorzystano dokowanie związków do modelu homologicznego receptora 5-HT6, opracowanego przy użyciu algorytmu AlphaFold i zoptymalizowanego z wykorzystaniem narzędzia Induced Fit Docking oraz dynamiki molekularnej. Dokowanie oceniono przy użyciu wytrenowanego modelu klasyfikacyjnego Extra Trees. Jako cechy dla uczonego modelu wykorzystano wartości energii, opisujące interakcje liganda z 14 aminokwasami miejsca wiążącego.

Wykorzystanie uczenia maszynowego, jako funkcji oceniającej dokowanie, pozwoliło na poprawę parametrów wirtualnego skriningu w porównaniu z oceną dokowania przy użyciu funkcji Glide GScore. Na podstawie uzyskanego modelu potwierdzono również, że położenie liganda w pobliżu aminokwasów Ser5.43 i Phe5.38 jest ważne dla wiązania związku do receptora. Procedura pozwoliła na wyselekcjonowanie 20 kandydatów, o nowych strukturach chemicznych, w porównaniu ze znanymi ligandami receptora 5-HT6. Dodatkowo, uzyskane związki posiadały stosunkowo niskie zasadowe pKa w porównaniu ze znanymi ligandami, przez co można podejrzewać, że będą charakteryzowały się niskim powinowactwem do kanałów hERG i dobrą penetracją do mózgu.

Słowa kluczowe: uczenie maszynowe, receptor serotoninowy 6, dokowanie molekularne, zależność struktura-aktywność.

© Farm Pol, 2022, 78(11): 607–614

 

The use of machine learning-based sequential virtual screening in the search of new ligands of 5-HT6 receptor

5-HT6 receptor takes part in learning and memory processes. For this reason, the use of ligands of this receptor in the treatment of neurodegenerative diseases such as Alzheimer’s disease, depression, or autism is being investigated. The development of machine learning (ML) and access to large compound databases allow for the increasing use of these methods in search of new drugs. The use of ML in pre-clinical tests allows for a reduction in time and costs of drug discovery.

In this study, we used a sequential virtual screening approach in search of new structures with potential affinity for the 5-HT6 receptor. Data from the ChEMBL database containing ligand binding affinities, measured as an inhibition constant (Ki), was used as the training dataset. Each step of the screening was based on machine learning models, the task of which was to classify compounds as potentially active and inactive. The first step included a ligand-based drug discovery (LBDD) approach, in which, using Klekota-Roth fingerprints and molecular descriptors of the ligands, a classification model was developed to select a preliminary group of candidates from the Otava chemical compound database. In the second step, a structure-based drug discovery (SBDD) approach was used. For this purpose, compounds were docked to the AlphaFold database-derived model of the 5-HT6 receptor, previously optimized by the Induced-Fit Docking tool and molecular dynamics. Docking poses were scored by a trained Extra Trees classifier. Interactions of a reference ligand with 14 binding site residues were used as features for the trained model.

The use of machine learning as a scoring function allowed for improvement in the virtual screening parameters compared to the Glide GScore scoring function. Based on the obtained model, it was also confirmed that the location of a ligand near Ser5.43 and Phe5.38 residues is important for binding. The procedure allowed to select 20 candidates characterized by novel chemical structure and a relatively low basic pKa compared to known ligands, and thus suspected to have a low affinity for hERG channels and good brain penetration.

Keywords: molecular docking, machine learning, structure-activity relationship, serotonin 6 receptor.

© Farm Pol, 2022, 78(11): 607–614

The use of machine learning-based sequential virtual screening in the search of new ligands of 5-HT6 receptor

611.81 kB | 5 kwietnia 2023