Strojové učení zjednodušuje vyhledávání v chemických knihovnách

Článek

Využití virtuálního screeningu se stalo nepostradatelným při hledání nových léčivých látek. Tato oblast se neustále vyvíjí a vyznačuje se rostoucím počtem metod, které využívají jak cílové, tak ligandové přístupy virtuálního screeningu.

V počátečních fázích projektů objevování léčiv založených na struktuře se často používají metody virtuálního screeningu, které využívají molekulární dokování. Hlavním cílem těchto přístupů je identifikovat počáteční kandidáty na malé molekuly, u nichž se předpokládá, že se budou vázat na dosud neprozkoumaný cíl, nebo nestranným způsobem odhalit nové chemické skelety, zejména nejslibnější kandidáty z rozsáhlého chemického prostoru.

Tyto chemické knihovny se obvykle skládají ze snadno dostupných hotových sloučenin nebo sloučenin, které lze syntetizovat na vyžádání. Tato volba zajišťuje, že předpovědi vytvořené pomocí dokování lze okamžitě ověřit v biochemických testech, aniž by byla nutná potenciálně časově náročná organická syntéza. V posledních letech se tyto knihovny neustále rozšiřují a nyní zahrnují rozsáhlý chemický prostor, který často obsahuje miliardy sloučenin. Vzhledem k tomu, že se knihovny sloučenin stále zvětšují, je zřejmý požadavek na rychlejší a účinnější screening těchto rozsáhlých kolekcí sloučenin v jejich úplnosti.

V tomto článku se vědci s ohledem na své cíle rozhodli využít strategie rozšířené o strojové učení (ML), příkladem je využití nástroje HASTEN, který plynule spojuje rychlé předpovědi ML s robustním a neúnavným dokováním minutových frakcí knihovny. Tento integrovaný přístup významně posiluje propustnost screeningu a vybavuje je pro konfrontaci knihoven giga-rozměrů. Tento výzkumný článek dosáhl úspěchu a my se nyní ponoříme do některých podrobností.

V tomto případě, zahrnujícím antibakteriální chaperon (SURa) a antivirovou kinázu, zahájili vytvořením základní linie hrubého dokování pro 1,56 miliardy (2021) sloučenin v knihovně Enamine REAL podobné olovu. Zajímavé bylo, že vybraná vazebná kapsa SurA byla menší a hydrofobní, s větším počtem donorů vodíkových vazeb. Naproti tomu vazebná kapsa GAK byla větší, hydrofilní a měla větší podíl akceptorů. Tento rozdíl ve vlastnostech vazebných kapes nám umožňuje vyhodnotit výkonnost metody ve dvou různých scénářích screeningu v giga měřítku, což je dobrý plusový bod.

Výsledky ukázaly, že použití nástroje HASTEN integrovaného s ML se ukázalo jako účinná strategie pro urychlení procesu screeningu v obřím měřítku. Iterativní výběr sloučenin na základě předpovídaných skóre postupně obohacoval trénovací data, což zvyšovalo schopnost nástroje HASTEN identifikovat sloučeniny s nejvyššími skóre v každé iteraci. Tento přístup výrazně zkrátil dobu potřebnou pro přípravu ligandů a dokování, což umožnilo zkrátit screening a dokončit jej přibližně za 10-14 dní pro každý ze dvou cílů. Flexibilní možnost rozdělit výpočetní zátěž mezi CPU a GPU navíc poskytuje praktické řešení pro rozsáhlé screeningové projekty.

HASTEN, jejich dokovací nástroj s podporou ML, se ukázal jako účinný v bezprecedentním giga měřítku a prokázal srovnatelnou míru odvolání pro dva různé cíle, SurA a GAK. Nově upravený protokol se selektivním vyloučením sloučenin se stal výchozím nastavením programu HASTEN, který zlepšuje odvolání. Vědci se stali průkopníky srovnávacího testování v tomto měřítku a stanovili tak standard pro budoucí hodnocení. Veřejné zveřejnění našich výsledků dokování v giga měřítku podporuje prediktivní úsilí. Přizpůsobivost programu HASTEN zdrojům a strategie jako „dřívější zastavení“ jsou příslibem pro efektivní objevování léčiv ve velkém měřítku. Celkově je HASTEN robustním řešením pro identifikaci nejlepších hitů, snížení počtu dokovacích výpočtů o více než 99 % a posílení screeningových snah v giga měřítku.

Pokud po prostudování tohoto textu zjistíte, že se stále více zajímáte o zkoumání inovativních metodik identifikace hitů v rozsáhlých chemických prostorech, představuje Chemspace pro vědce převratné řešení. Nabízíme komplexní službu, která bezproblémově integruje knihovny kódované DNA (DEL), strojové učení (ML) a rozsáhlé chemické prostory (CS) s cílem zefektivnit a urychlit rané fáze procesu objevování léčiv. Tento nový přístup byl původně demonstrován Kevinem McCloskeyem a dalšími, kteří vyvinuli modely strojového učení založené na datech generovaných z obrazovky DNA kódovaných knihoven a úspěšně tyto modely aplikovali na komerční chemické prostory.

Ve společnosti Chemspace poskytujeme služby zahrnující různé aspekty této metodiky. To zahrnuje provedení DEL screeningu na vašem cíli zájmu ve spolupráci s našimi váženými partnery, sestavení modelu strojového učení na míru vašim specifickým potřebám, a nakonec dodání kurátorského výběru potenciálně aktivních sloučenin připravených ke screeningu. Je pozoruhodné, že tento přístup také přispívá ke snížení nákladů při zachování vysoké míry shody.

Tento inovativní přístup se ukazuje jako zvláště výhodný u projektů, kde mají výzkumní pracovníci přístup k purifikovaným proteinům, ale chybí jim zásadní strukturní údaje nebo jakékoli předchozí znalosti týkající se jejich aktivity.

Další informace naleznete na tomto odkazu: https://chem-space.com/services#del-ml-cs

Celý článek si můžete přečíst zde: https://pubs.acs.org/doi/full/10.1021/acs.jcim.3c01239

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Strojové učení zjednodušuje vyhledávání v chemických knihovnách

Článek

Postranní panel

Sdílejte s lidmi své příběhy

Doporučované

Postranní panel