真實世界的分子設計

編譯:肖高鏗 2020-01-25

原文:Kuhn B, Guba W, Hert J, et al. A Real-World Perspective on Molecular Design. J Med Chem. 2016;59(9):4087-4102. doi:10.1021/acs.jmedchem.5b01875

前言

在當前的小分子藥物發現中,分子設計的作用似乎已經牢固確立。 有關藥物化學的期刊文章通常會參考使用模擬的結合模式,虛擬篩選或預測的分子性質。全球的制藥公司都報告了其部署和使用工具的方式1-3。

然而,分子設計對單個項目進展的真正貢獻很少在公開場合進行辯論和剖析,令人信服的案例研究比分子模擬軟件所暗示的大量貢獻要稀缺得多。 通過羅氏(Roche)十多年來藥物發現的一系列項目簡介,我們說明了哪些工具和方法在過去幾年中取得了最豐碩的成果。我們證明了這些方法背后有共同的原則,這使我們認為,藥物發現中分子設計的首要目標可以以一種讓人更自然地關注有效活動的方式重新定義。

DMTA循環

Figure 1. 經典的設計周期示意圖。合成和測試為實驗組件,分析和設計為概念組件。設計區域中的箭頭是斷開的以說明從已知到未知以及虛擬是離散步驟。本文涉及設計的各個方面,這些方面可以采用完全不同的形式,具體取決于新思想(idea)產生和過濾方式。

術語“分子設計”與廣泛接受的設計周期概念密切相關,這意味著藥物發現是定向進化的過程(圖1)。該循環可細分為合成和測試的兩個實驗部分,以及一個概念階段。這一概念性階段開始于數據分析,結束于合成下一輪化合物的決策。在分析和決策之間會發生什么是不太明確的,我們將其稱為設計階段。在任何實際項目中,設計階段都是一個多方面的過程,結合了有關項目狀態和目標、先驗知識、個人經驗、創意和關鍵過濾要素以及實際規劃等信息。據我們了解,分子設計的任務是將這一復雜的過程盡可能地轉變成一個明確的、合理的和可追溯的過程。任何分子設計方法實用性的兩個關鍵標準是:產生實驗可測試的預測,以及無論這些預測最終正確與否,實驗結果應該增加對可用優化空間的理解,因此以迭代的方式提高正確預測的機會。分子設計的主要成果是一個想法(idea)4,成功是對研究生物系統的改良化合物的有意義的貢獻。

Table 1. 本文的案例概述

Project Approach Impact
DPP-IV Filling a lipophilic pocket Affinity increase while balancing polarity
FABP 4/5 Targeting specific residue differences in the binding site Affinity and selectivity increase
Cathepsin S/L Assessment of electrostatic complementarity of protein and ligand. Visualization of halogen bonding potential Affinity and selectivity increase
Β-Tryptase Scaffold hopping Alternative scaffold
BACE1 Scaffold hopping Solubility increase, alternative scaffold
PDE 10A Targeting binding site hotspots identified from multiple crystal structures, Calculation of torsion energy potentials Affinity increase,Prioritization of alternative scaffolds
HSL Hypothesis derived from homology model Novel scaffolds with potential for improved PK
properties
GPBAR1 Hypothesis derived from homology model Targeted introduction of solubilizing group
L-CPT1 Bioactive shape hypothesis Prioritization of scaffolds
SSTSR Sequence-based binding site similarity as a basis for focused screening (“chemogenomics”) Identification of druglike hits


下面,我們報告10個案例研究用來說明分子設計在羅氏藥物發現項目中的貢獻。表1為這些項目的概述,每一個都以簡短的項目基本原理、問題陳述開始,然后是所采用的計算方法的描述和所獲得的結果的討論。所有研究均以前瞻性方式進行;在準備計算輸入和規劃藥物化學時,不知道實驗結果。大部分研究以前都沒有發表過。因此,本研究展示了一組新化合物以及與之相關的13項PDB數據。在閱讀本案例時,應該記住它們不是完整的項目描述,而是專注于一個學科的作用。這意味著有時引入新化合物而不描述它們的起源,以便將注意力集中在一個特定階段和設計問題上。這也意味著并非優化的所有方面都受到相同程度的關注。例如,ADMET性質的優化在本文所涉及的所有項目中都發揮了突出的作用,但在案例研究中并非總是如此。

案例

分子設計的起源與更常規的晶體結構測定的出現是一致的,并且本質上與該信息的利用同義,一次一個結構。 如今,通過將此類分析擴展到數千個小分子和蛋白質復合物結構上,可以對蛋白質和小分子的相互作用和構象偏好做出可靠的經驗性陳述。我們和其他人已經匯編了此類知識5-7,在此我們將不再嘗試進行新的總結。 相反,我們想思考一下如何將這些知識用于設計目的。

設計配體以優化其與親脂性口袋的形狀互補性以獲得親和力或選擇性。 “口袋填充”可能是最顯而易見、應用最廣泛的設計概念,但正如以下三個應用案例所示,這并不意味著其中沒有挑戰。

DPP-IV抑制劑

二肽基肽酶IV(DPP-IV)抑制劑已成為治療2型糖尿病患者的推薦療法8,9。內部高通量篩選(HTS)發現的2-aminobenzo[a]quinolizine類苗頭化合物1是一種DPP-IV抑制劑,僅中等活性,但具有令人感興趣的類藥特性(圖2)。在DPP-IV晶體結構公開之前,通過隨機化學修飾改善結合親和力的嘗試都不成功。進入項目大約1年后,化合物1與人類DPP-IV的結合模式通過共晶結構得以揭示,理性設計的方法才得以進行(圖2a)。

圖2. DPP-IV抑制劑

Figure 2.(a)人DPP-IV與抑制劑1的晶體結構(PDB 3oc0)。形成S1口袋的蛋白殘基、與化合物1胺基發生氫鍵相互作用(紅色虛線)的側鏈以綠色突出顯示,抑制劑以青色顯示。(b)人DPP-IV與化合物9的晶體結構(PDB 3kwf)S1口袋的特寫圖。品紅色的線表示氟甲基與蛋白質之間的距離小于等于4.0?的非鍵接觸。(c)所選化合物對DPP-IV的SAR11,14,數值是化合物對人DPP-IV酶抑制的IC50值。

結合位點的分析表明,相當柔性的正丁基指向DPP-IV由幾個芳香族和脂肪族氨基酸的側鏈組成的S1口袋。 S1口袋的高度親脂性以及脯氨酸環系被DPP-IV底物所識別這一事實表明:用更剛性的環系替換正丁基可以顯著提高親和力。用苯基(化合物2)或吡啶(化合物4)進行了標準藥物化學替換,虛擬篩選和分子設計技術補充了諸如N-取代的內酰胺7。令人驚訝的是,這些替代并沒有顯著改善DPP-IV的結合親和力。通過詳細分析環狀衍生物與S1口袋的形狀互補性以及與另一種DPP-IV抑制劑系列(其P1取代基進行了優化)的疊合模擬10,發現芳族間位的有額外空間可用。如化合物3、5、8和9所示,通過小的甲基和氟甲基取代,可以實現很高的結合親和力提高(40至70倍)。吡啶類似物6的DPP-IV活性大大降低:氮孤對電子與酪氨酸殘基的π電子云之間不利的相互作用可能抵消了引入甲基所帶來的親和力增益。對DPP-IV底物衍生物的模擬表明:極性官能團僅是鄰位容許,該位置的極性基團暴露于溶劑和極性蛋白質殘基。雖然化合物3、5、8和9具有相似的DPP-IV親和力,但8和9由于兩親性的降低而顯示出最佳的類藥性,這是由于極性基團的分布更加平衡所致11。最后,選擇了化合物9(Carmegliptin)進入臨床開發。

DPP-IV的例子說明,當有晶體結構的結合模式可用并且界定清楚的疏水性口袋很少被占據時,可以快速實現活性增強。在這種情況下,單個重原子就可獲得驚人的親和力增加,從而證實了在包埋腔內填充小空隙的重要性12,13。DPP-IV S1口袋的親脂性高且柔性低,這使其成為基于結構設計的理想案例。當然,單獨的高親和力并不是優化的目標;在本案例中,極性的定向引入對于平衡PK特性和消除hERG抑制至關重要。次優的形狀互補性可以容易地檢測到并可視化;因此,對3D復合物結構進行適當的注釋和可視化使得基于結構的設計可以用簡單的方法來實現。由于(去)溶劑化能的不確定性以及蛋白質的誘導契合,加上大部分極性相互作用的高度定向性,使得在更具極性或更柔性的結合口袋中優化抑制劑的親和力更具挑戰性。

Fatty Acid Binding Protein 4/5(FABP 4/5)

脂肪酸結合蛋白(FABPs)是具有組織特異性分布的胞質脂質結合蛋白,與脂肪酸的攝取、代謝和細胞內運輸有關15。根據流行病學研究和動物基因敲除模型,同工型FABP4和FABP5已被確定為潛在的糖尿病和動脈粥樣硬化靶標16。理想的抑制劑特性包括對FABP3具有高度選擇性。對Roche化合物庫一組1200個化合物的集中庫篩選得到喹啉10,對FABP4(0.1μM)具有良好的活性,但對FABP3沒有選擇性、對FABP5沒有檢測到活性。因此,我們的目標是改善對FABP4和FABP5的活性,同時強烈降低對FABP3的活性。

FABP4與化合物10、13的結合模式

Figure 3.(a)化合物10和13與FABP4的結合模式(綠色,PDB 5edb和5edc)。 左圖顯示了FABP3、FABP4和FABP5結合位點里具有差異的氨基酸。 FABP3(青色)具有Leu104、Leu115、Leu117(PDB 2hmb),而FABP4(綠色)具有Ile105、Val116、Cys118(PDB 5edb),FABP5(品紅色)具有Ile107、Val118、Cys120(PDB 1b56)。 5edb中的甲基和5edc中的哌啶基的電子密度相當弱。Cys118側鏈和配體哌啶基的兩個構象用于模擬FABP4-13復合物結構的電子密度。(b)化合物10-13對FABP3、FABP4和FABP5的抑制常數(Ki)。

解決此問題的常用方法是將相關靶標上的序列信息映射到配體結合位點上,并靶向3D空間中顯示氨基酸差異的那些區域。在項目早期就解釋了FABP4與喹啉苗頭化合物10的復合物晶體結構,發現有一個區域,其中FABP3與其他兩個同工型之間存在三個殘基差異的簇(圖3a)。由于FABP3在此簇為三個Leu側鏈,這比FABP4和FABP5中的Ile、Val和Cys殘基更大,因此對于FABP3來說該口袋似乎更小。因此,增加喹啉2-位取代基的尺寸(甲基、乙基、異丙基、哌啶基的尺寸依次增大)會引起與FABP3的空間碰撞。如圖3所示,此策略導致FABP3抑制常數從90nM急劇增加至10μM,與2位取代基的大小增加密切相關。由于FABP4和FABP5的結合口袋沒有被原始甲基最佳填充,因此較大的取代基進一步改善了這兩種同工型的配體親和力。對于FABP5效果尤為明顯,經過引入哌啶基,苗頭化合物10由檢測不到的活性轉變為具有亞微摩爾抑制活性的化合物13。在13與FABP4形成復合物的晶體結構中(圖3a),喹啉哌啶以假軸構象嵌入選擇性口袋中。先前基于CSD的構象分析表明5,這對于與缺電子芳環(比如吡啶或嘧啶)連接的哌啶并不罕見,這表明這種情況下的配體張力能很小。Cys118周圍的電子密度必須用兩個旋轉異構體來描述,而相鄰配體哌啶基的兩個假軸構象是這兩個旋轉異構體所必需的。

靶向結合位點中的氨基酸差異通??梢酝ㄟ^聚焦直接的蛋白質-配體接觸來實現,例如通過設計與靶標原子發生有利相互作用而與反靶標發生立體碰撞來實現降低對反靶的結合能力。嘗試”突破界限”也是很好的實踐,也就是設計與蛋白質口袋碰撞的分子以測試其柔性。以這種方式發現新的蛋白構象17,18。

不幸的是,這種情況通常不如在FABP3情況下有利。在FABP3案例中,引入與不希望的靶標的簡單立體碰撞就足以實現同工型的特異性。更精細的構象可塑性和間接作用可能是驅動靶標選擇性的主要因素,而這些實際上幾乎不可能被晶體學檢測到或被計算預測出來。在其他情況下,無法通過利用與配體緊鄰的氨基酸差異來實現選擇性。 如下一個示例所示,將離結合位點更遠的區域考慮進來并利用分類的相互作用等替代方式會有所幫助。

Cathepsin S/L

半胱氨酸蛋白酶組織蛋白酶S(CatS)和L(CatL)雙重抑制是靶向腎臟腎小球疾病的潛在策略。 在先前項目中發現了有效的、選擇性的CatS抑制劑后19,該團隊著手開展了一項重點項目,旨在調整其對CatL活性。 項目的起點是四氫吡咯化合物14(圖4),其腈基與活性位點的半胱氨酸共價結合,而取代的苯砜和氯取代的吡啶分別占據S2和S3口袋。由于CatS的體外活性已經處于低納摩爾范圍內,因此設計目標是特異性改善CatL結合,同時保持對其他組織蛋白酶的良好選擇性。

人組織蛋白酶L/S

Figure 4. (a)人組織蛋白酶L(左,PDB 2yjc)和小鼠組織蛋白酶S(中,PDB 4bpv)結合位點的表面靜電勢。出于技術原因,將小鼠晶體結構作為人類同工酶的替代物。在化合物14 7?范圍內帶電荷的氨基酸有:人CatL(2 Glu,4 Asp),人CatS(1 Asp,1 Lys),小鼠CatS(1 Glu,1 Asp,1 Lys)。 表面靜電勢用MOE計算20,色標范圍從-40 kcal/mol(紅色)至+40 kcal/mol(藍色)。(b)化合物15與人類CatL的X射線共晶體結構(PDB 5f02)。新引入的氮雜環丁烷環以黃色突出顯示。(c)對人組織蛋白酶L,S和K的IC50值19

在CatS / L示例中,在更全局的水平上分析結合位點的差異是很有幫助的。如圖4所示,組織蛋白酶L和S的靜電勢存在顯著差異20。CatL結合位點主要為負的表面靜電勢:在化合物14的約7?半徑范圍內,有六個酸性Asp和Glu殘基,但在人的CatL中沒有堿性的Lys或Arg殘基。相反,CatS的結合位點更加均衡。人類的CatS位點只有一個Asp殘基與一個Lys殘基互補。在此分析中,相關的半胱氨酸蛋白酶組織蛋白酶K(CatK)介于CatL和CatS之間,其人類酶的結合位點有3個Asp而沒有Lys/Arg殘基。

為了優化與組織蛋白酶L的靜電互補性,中性環丙基接臂被帶正電的氮雜環丁烷取代。由于靜電相互作用的長程性質,我們推斷引入遠離(大于6?)帶負電荷的蛋白質側鏈的正電荷配體對CatL結合可能是有利的。如圖4中的一對化合物14、15所示,該化學變化確實導致對CatL的結合親和力增加11倍,而對CatS和CatK的IC50值僅改變了2倍。隨后CatL-15的復合物晶體結構表明,氮雜環丁烷環保持溶劑暴露狀態,并且僅通過水介導的接觸與蛋白負電荷相互作用(圖4b)。在先前對CatL S3口袋中的鹵鍵進行了系統研究的基礎上21,我們將化合物15的5-氯吡啶用5-溴-3-氟吡啶替換得到化合物16以進一步選擇性地優化對CatL的活性??傊?,通過優化靜電互補性和微調鹵鍵相互作用,識別出幾乎等價的CatS/L雙重抑制劑,對其他組織蛋白酶具有良好的選擇性。

本研究舉例說明了:不僅與蛋白原子直接接觸的配體基團可以用來優化結合,而且溶劑暴露的配體基團也可以用來優化結合22,23。改造配體及其蛋白質環境的靜電互補性是獲得親和力并提高對反靶選擇性的有用策略24,25。靜電性分析應是研究新蛋白質結合位點的常規步驟。

迄今為止,我們一直關注優化相互作用以獲得親和力和選擇性。在基于結構的設計工具的另一端,有一些方法旨在修飾分子母核的同時而保持現有的相互作用。這樣的技術被稱為骨架躍遷(scaffold hopping)方法。 ReCore26,27是建立在CAVEAT28原始概念上的一種這樣的方法。ReCore通過識別小分子晶體結構中與出口載體(exit vector)幾何匹配并可選地滿足藥效團約束的片段來進行骨架替換。 接下來的兩個示例說明:骨架躍遷可以成為訪問全新化學空間的強大工具。

β-Tryptase

β-胰蛋白酶是一種肝素穩定化的四聚體絲氨酸蛋白酶,主要在肥大細胞中表達,在呼吸道炎癥和過敏反應中起到關鍵作用。賽諾菲-安萬特公司的參比抑制劑在我們的發現項目啟動時就作為強效胰蛋白酶抑制劑,該抑制劑在S1口袋中有個芐胺[29],一個哌啶酰胺骨架連接臂,以及在S4口袋中有各種取代的芳環(圖5)。 設計的目標是發現擁知識產權、強效和選擇性的β-胰蛋白酶配體。

人β-胰蛋白酶-抑制劑共晶結構

Figure 5. (a)胰蛋白酶參比抑制劑和ReCore26得到的新型惡唑烷酮骨架。 用于定義鏈接區的鍵加粗顯示為綠色的棒,ReCore約束的受體官能團以紅色橢圓突出顯示。(b)ReCore在骨架躍遷過程中產生的疊合。(c)參比化合物-人β-胰蛋白酶共晶(白色,PDB 4a6l)和新設計的惡唑烷酮抑制劑-人β-胰蛋白酶共晶(黃色,PDB 5f03)疊合。末端基團用紅色圓圈突出顯示,以強調整體結合模式的相似性。

賽諾菲-安萬特(Sanofi-Aventis)分子之一與人 β-胰蛋白酶的復合物晶體結構在項目早期就已經解釋出來。如胰蛋白酶樣絲氨酸蛋白酶所預期的那樣,堿性芐胺基占據了S1口袋與陰離子Asp207側鏈相互作用,而取代的芳環指向誘導型S4口袋。連接這兩個部分的配體片段具有相對小的蛋白質接觸。ReCore用來識別連接P1和P4芳基的新連接基團,同時保留哌啶酰胺的受體官能團(圖5a)。將200個打分最高的ReCore結果聚類得到結構多樣的子集,并且在胰蛋白酶結合位點進行可視化分析。在對一些提出的骨架進行修飾以使其具有更好的結構匹配性和分子性質后,與藥物化學家討論了20種骨架的選擇。由于其對 β-胰蛋白酶的新穎性以及相對容易合成,CSD骨架BUHGEQ被優先選擇。新設計的噁唑烷酮分子對人 β-胰蛋白酶顯示出兩位數nM水平抑制活性,并對相關蛋白酶具有普遍的高選擇性。雖然成功的骨架替換表明我們的疊合假設是正確的,但 β-胰蛋白酶-噁唑烷酮衍生物的共晶體結構顯示出中心片段的驚人翻轉(圖5c)。新連接臂的構象如所預測的一樣,但反轉為鏡像。這是由于形成了可供選擇的氫鍵:哌啶酰胺羰基與Gly237主鏈氮之間較弱的相互作用被與Gln105的側鏈酰胺的氫鍵相互作用取代。這一發現提醒我們永遠不要相信結合模式假設,除非已經探索了所有可能的替代方案!

BACE1

我們之前已經描述了多種環狀脒類BACE1抑制劑30,31,這是一個廣為研究的頭部基團32。脒片段部分通過三個氫鍵與催化位點的天冬氨酸殘基Asp93和Asp289緊密結合,并提供了合適的出口載體以延伸至S2’以及S1和S3子結合位點。 S1的口袋很淺,我們的抑制劑含有一個間位取代苯環的P1取代基,它將頭部基團與P3取代基連接起來30。

骨架的模仿設計

Figure 6.(a)19中的P1苯環被20中的反式環丙基酮所取代。19(PDB 5ezz)和21(PDB 5ezx)的晶體結構的疊合表明P1苯環與其模仿設計之間完美疊合。(b)反式環丙基酰胺是間位取代苯胺的模仿設計:化合物21(PDB 5f00)和22(PDB 5f01)的疊合結果。

我們正在尋找取代P1苯環的替代品以改善物理化學性質。 圖6中的化合物19高度親脂性,log D為4.0,因此動力學溶解度非常低。ReCore建議使用反式環丙基酮作為間位取代苯環的極性替代品(CSD entry:FUQGAZ)。出口載體的二面角僅相差2.6°,幾乎完美地疊合。將該片段插入到先前的化合物中得到化合物20。20在細胞水平的活性測試中僅略微活性增加,但其降低了的log D和增加了的溶解度顯著地改善了理化性質(圖6a)。

芳香胺因其可能與反應性代謝物的形成以及遺傳毒性有關而在藥物化學中備受關注33。為了探索使用反式環丙基酮替代間位取代苯胺的適用性,我們將化合物21的苯胺替換后生成22。與之前的情況一樣,我們發現建模的和實驗確定的受體結合構象之間完美匹配,同時改善了溶解度(圖6b)。

β-胰蛋白酶和BACE1實例表明,使用CSD-衍生的連接臂進行骨架替換可以識別非顯而易見的替代物,從而為項目打開了新的化學空間。適合使用該方法的結合位點在分子的遠端具有主要配體識別模式,而在中心區域幾乎沒有直接的蛋白接觸。這允許實現大量不同的設計方案并具有更大的設計限制容差。在不滿足理想情況的條件下,約束條件的數量可以是一個限制條件,在非常窄的搜索空間內,骨架替換搜索本質上就是藥效團搜索。在這種情況下,將已知抑制劑的片段互相組合與連接的方法可能更有前途。不同共晶結構的3D片段拼合是一種組合不同系列分子感興趣片段的巧妙方法。結構信息越大越多樣化,產生新穎組合的機會就越大。BREED算法是最早使用項目結構進行3D拼合34的方法。將片段篩選的苗頭化合物與其它激酶抑制劑的已知片段組合設計全新的DDR1/2激酶抑制劑是該技術巧妙應用的例子35。在下面的例子中,鹵素原子從一個系列轉移到另一個系列,但是該概念同樣適用于更大的配體片段。

PDE10A

因其在紋狀體中的患病率很高,并且臨床前數據顯示出抗精神病藥和預認知作用,人們認為抑制磷酸二酯酶10A(PDE10A)是治療精神分裂癥有吸引力的靶點36。我們鑒定了幾種三唑并嘧啶與三唑并吡啶化合物是強效、選擇性的PDE10A抑制劑(Figure 7)。在本研究中我們闡明了如何通過遷移不同系列的知識來改善結合親和力。

PDE10A與抑制劑的復合物結構

Figure 7.(a)人類PDE10A(綠色)與三唑并嘧啶抑制劑(青色,PDB 5edh)的的晶體結構。橙色是Roche PDE10項目其他兩個抑制劑的疊合結構,根據Scorpion網絡分析39(PDB 5ede和5edg),它們的氯原子占據一個結合熱點。熱點顯示為青綠色橢圓形,檢測到的有利相互作用用虛線表示(黃色:色散;粉色:鹵鍵)。(b)三唑并吡啶23和24對人類PDE10A的抑制常數與配體效率(LE)。(c)化合物24與人類PDE10A的晶體結構(PDB 5edi)。結合熱點用紅色圓圈突出顯示。

配體模式(Motif)從一個系列轉移到另一個系列的前提條件是:有晶體結構可以進行疊合,并且可以通過分子間相互作用的分析或通過活性懸崖映射到結合位點來理解結合位點的“熱點” 37?;赑roasis38中實現的自動疊合流程和Scorpion對有利相互作用的網絡分析39,我們預測了PDE10A活性位點的熱點。Scorpion打分貢獻大于1.5的配體原子被標記為熱點,并根據其空間分布進行聚類。然后將每一類(Cluster)可視化為橢圓形,其形狀代表著該類成員的分布。我們識別出了一個具有良好色散與鹵鍵等有利相互作用的鹵原子結合熱點,如其他抑制劑系列化合物中的兩個與PDE10A復合物晶體結構所示的那樣(圖7a)。三氮唑并嘧啶與PDE10A復合物晶體結構的疊合表明,三氮唑并吡啶系列通過6-位取代可以到達此熱點?;衔?3的Cl取代衍生物不僅對PDE10A的抑制作用提高了10倍以上,而且配體效率也提高了?;衔?4與PDE10A催化結構域的復合物晶體結構證實:氯原子的加入確實占據了聚類的橢球體并產生了預期的相互作用(圖7c)。盡管這種情況很特殊,將Cl取代基從一個系列遷移到另一個系列的看起來很簡單、直接,但此處描述的工作流程卻更為通用,可以從許多晶體結構中吸取教訓,并遷移更大的配體片段。

毫無疑問,在基于結構的設計中理解優勢、低能構象的重要性是毋庸置疑的40。雖然當今的力場覆蓋了藥物化學所能訪問的大部分化學空間,但通過對小分子X-ray結構的統計分析可以獲得更多、更詳細的構象偏好見解5。但是,CSD中涵蓋的化學空間不一定與藥學上感興趣的化合物重合。一個具體的例子是分析在CSD中代表性不足的雜環之間的扭轉角。 當實驗數據過于稀疏而無法進行統計分析的時候,可以選擇量子力學進行計算。

PDE10A

Figure 8.(a)具有吡啶-2-酮、噠嗪-4-酮或吡嗪-2-酮母核的吡唑抑制劑對人類PDE10A的IC50值。(b)抑制劑26與人類PDE10A(PDB 5i2r)的晶體結構。蛋白質殘基和抑制劑分別以灰色和青色顯示。(c)對連接兩個中心雜芳基的二面角τ進行了柔性掃描,用Gaussian 9841在B3LYP/cc-pVDZ理論水平進行計算。垂直虛線表示在3-吡唑基噠嗪-4-酮母核與PDE10A共晶結構中觀察到τ的范圍(28-40°)。

作為PDE10A項目的一部分,我們研究了HTS發現的3-(吡唑基)噠嗪-4-酮(3-pyrazolylpyridazin-4-one)類抑制劑(26)?;衔?6與人類PDE10A的復合物晶體結構揭示了噠嗪-4-酮核心與蛋白的重要相互作用,即羰基氧原子與保守的Gln726側鏈的氫鍵相互作用,以及噠嗪片段與Phe696和Phe729形成的芳香鉗之間的π-π相互作用。在26的結合模式中,兩個末端苯基形成分子內“邊對面”相互作用,吡唑連接臂相對于噠嗪-4-酮平面扭曲約28°(圖8)。噠嗪-4-酮母核兩個骨架躍遷為兩個吡啶-2-酮的變體得到生物等排體化合物27,其對PDE10A的抑制作用僅比26低3倍,而比活性衍生物25的抑制作用則低300倍。當與PDE10A結合時,結合模式無法解釋為什么比25的活性下降,我們懷疑配體的張力能是潛在原因。量子力學(QM)計算確實揭示了兩個雜環之間扭轉角τ的能量分布存在重大差異。雖然26和27(紅色和藍色曲線)的最小能量與蛋白質結合構象中的扭轉角很好地吻合,但25的優勢構象卻扭曲得多(品紅色曲線,在τ≈90°時最?。?。在τ≈30°處有相當大的配體張力能(2-3 kcal/mol),這將轉化為結合親和力下降約100倍。隨后合成的化合物證實了這一觀察結果。例如,吡嗪-2-酮化合物28的二面角極小值在τ= 0°處,但該化合物仍然有效,這是因為在τ= 30°時,配體張力受到限制(0.3 kcal/mol)。由于計算的配體張力能與IC50值之間具有良好的定量一致性,因此我們進行了類似的二面能量掃描,以便優先考慮虛擬雜芳基的骨架修飾,然后再開始合成(結果未顯示)。

當實驗結構信息不可用時,同源模型在多大程度上也可以使用?下面的兩個例子說明了即使是相對粗糙的蛋白模型也可以為項目指出明確的方向。成功的關鍵是充分利用同類靶標的機理方面知識,加上比在實驗確定的結構更低的粒度水平上所解釋模型的理解。

Hormone sensitive lipase (HSL)

激素敏感性脂肪酶(HSL)在儲存脂肪的動員中起關鍵作用。糖尿病患者由于該脂肪酶的上調而表現出增強的脂解活性。 HSL抑制被認為能恢復過高的血漿游離脂肪酸和甘油三酯水平,因此對治療2型糖尿病具有治療價值42。

在項目開始時,所有已知的HSL抑制劑都是自殺性底物,對靶標產生不可逆抑制。高通量篩選發現了磺酰哌啶化合物29,這是第一種具有弱的、但可重現的細胞活性的可逆抑制劑(圖9)?;衔?9的活性可通過酰胺鍵環化得到螺內酰胺哌啶的30而顯著提高。該化合物的初步小鼠研究表明,當以30 mg/kg的劑量給藥時,游離脂肪酸可減少了21%。螺內酰胺哌啶系列化合物具有低溶解度、低代謝穩定性的缺點,因此藥物化學團隊開始著手優化這些性質。

Hormone sensitive lipase的結構設計

Figure 9.(a)對HSL高通量篩選苗頭化合物29酰胺鍵的環合發現了化合物30。(b)化合物30與HSL同源模型結合位點的理論結合模式。(c)化合物31與同樣的HSL模型的理論結合模式。(d)化合物31是將化合物30的磺?;哙禾鎿Q為環己醇而設計化出來的。非對映異構體32的活性損失進一步支持了該理論結合模式。

為了研究理論結合模式能否用來指導優化過程,建立了HSL的同源性模型。 HSL與實驗確定的3D結構的蛋白質幾乎沒有序列同源性。所使用的三個模板與HSL的整體序列一致性僅為12-14%,序列相似性為22-24%。但是,由于包埋的活性位點通道具有不同的形狀,并且由于初始先導化合物30具有同樣的不同形狀,因此所得的HSL模型仍使我們能夠建立近似的理論結合模式:簡單的力場計算可以確定在極性環境下,內酰胺羰基團偏向于偽平伏鍵的位置,使其更暴露于環境。在該取向下,磺酰胺部分僅具有一個優選的取向,使末端苯環指向羰基的相反方向。在活性位點內,內酰胺羰基與氧陰離子孔很好的契合,將三氟甲氧基指向狹窄的親脂性口袋。因此,磺酰胺取代基位于活性位點隧道的另一端,在更寬的親脂性區域中。雖然這種結合假設只是一個粗略的草圖,但它為內酰胺部分的作用提供了理論依據,并暗示在磺酰胺位點可能存在更大的變化空間。但是,團隊最需要的是給出先導化合物的一個位置以增加極性基團?;酋0肥莻€分子嵌合體(chimera),可形成氫鍵并與蛋白質內的單極性環境相互作用6。在本案例中,同源模型表明磺酰胺氧原子可與氧陰離子孔附近的谷氨酰胺側鏈相互作用。我們假設該側鏈的酰胺末端同樣可以很好地充當氫鍵受體。因此,我們設計了一種分子,該分子在直立鍵方向用帶有羥基的環己基環取代了磺?;哙?、在平伏鍵位置有個丁基從而占據了親脂性口袋。實際上,化合物31顯示出與30相似的抑制活性,更少的重原子數,因此顯著地改善了配體效率。相應的對映異構體32的活性顯著損失也證明了該假設的有效性。對于沒有丁基的一對化合物,以衰減形式觀察到相同的差異活性(數據未顯示)。

該實例說明了盡管缺乏可靠的信息、有關酶學機理的、蛋白質結構和構象等先驗知識,但還可以激發創造力以建立具體的、可檢驗的理論模型(假設)。顯然,這樣的假設并不總是正確的,但是實驗設計的越好, 就可以越多地了解需要修改假設的地方。在HSL的情況下,同源性模型沒有被篡改,這并不意味著它是正確的,而是它的基本特征與實驗數據一致。 最重要的是,項目團隊受益于磺酰胺的替換,這在新的方向上擴展了化學空間,并能夠創造出具有理化性質均衡且穩定、有效的化合物43。

G-Protein-Coupled Bile Acid Receptor 1 (GPBAR1)

GPBAR1被膽汁酸(如膽酸)激活。它在葡萄糖穩態中發揮作用,并通過Kupffer細胞觸發抗炎活性44。GPBAR1是A類GPCR,與視紫紅質一樣,與Gα偶聯。 GPBAR1項目的起點是高通量篩選命中的許多有效的GPBAR1激動劑,它們具有高親脂性和低溶解性45。圖10給出了一種代表性化合物(化合物33,R = H)。由于GPBAR1跟石膽酸(LCA)以及?;撬峁曹椢锱;悄懰幔═LCA)一樣的結合良好,因此該受體明顯耐受天然激動劑上的極性或陰離子側鏈,并由此產生了在當前系列化合物的何處引入極性基團的問題。為了指導藥物化學工作,需要建立有充分根據的結合理論模型。由于GPBAR1與其他A類GPCR的高度同源,因此可以建立同源性模型(視紫紅質模板,PDB 1F88)。然而,將基本無特征的親脂性化合物對接入跨膜結合口袋并不是一項簡單的工作。在沒有其他信息的情況下,可能會出現幾種不同的取向,每種取向都暗示了一種用于添加極性基團的出口載體(exit vector)。

GPBAR1 與TCLA結合的理論模型

Figure 10.(a)GPBAR1同源模型與TCLA(藍綠色)以及激動劑代表性化合物(品紅色,33,R = H)理論結合模式。?;撬崞谓Y合的區域用紅色圓圈標記。(b)吡啶系列化合物的GPBAR1活性、親脂性(log D)、動力學溶解度(LYSA)和微粒體清除率(CL)。

缺少的信息來自該團隊正在處理激動劑的事實,該激動劑的分子作用機制可以與A類GPCR視紫紅質進行比較。在視紫紅質中,視網膜的β-紫羅蘭酮擠壓在跨膜螺旋5和6(TM5和TM6)之間,這兩個螺旋相對于彼此的方向產生小的位移接著轉化為TM6在受體胞質側向外旋轉出更大空間,從而允許其容納G蛋白。因此,在正構結合口袋中,TM5和TM6之間的間隙被認為是同樣重要的激動熱點。因此,膽汁酸和TLCA以這樣的方式對接到GPBAR1模型中,即該熱點被類似于視紫紅質中 β-紫羅蘭酮環的親脂性部分占據。對于這種結合模式,代表性的先導化合物可以通過保留與激動劑熱點的結合方式進行疊合。這導致了單個可能的結合取向,如圖10a所示。最有希望的極性側鏈出口載體是苯環的對位。如圖10b所示,具有各種側鏈的化合物確實是強效的激動劑,其溶解度和體外清除率值大大提高。

GPBAR1的案例再次說明,在沒有實驗確定的靶標蛋白結構的情況下,各種來源的知識(本文為天然配體和對靶標類別的機理理解)的組合也可以生成靶向假設。 此處,對可能出口載體的識別高效地將藥物化學搜索空間縮小到特別有希望的區域。

在下一個示例中,我們將離開3D靶標結構的領域。在它們不存在的情況下,生物活性構象的陳述當然會變得更加模糊,因此必須更加謹慎。不同化合物類別的3D疊合和3D藥效團生成是有用的技術,其結果當然會受到輸入構象質量的強烈影響。但是,配體疊合幾乎總是會產生高度3D相似度的錯誤外觀。不同結構類別的結合模式彼此間的差異通常遠大于疊合所建議的那樣。這個問題困擾了3D-QSAR領域很長一段時間,因為當結構多樣性低或它們很可能出錯時,疊合就不是什么問題。在這種情況下,生成可直接測試生物活性構象假設的剛性結構是顯而易見的。默克Orexin項目是此類驗證實驗的一個很好的例子46。下一個例子展示了配體疊合如何在不被過度解釋的情況下用來指導藥物化學。

Liver Carnitine Palmitoyltransferase 1

肉毒堿棕櫚酰轉移酶是一種線粒體酶,負責將長鏈脂肪?;鵆oA的?;騆-肉毒堿轉移,促進脂肪酸在線粒體膜上的轉運47。本項目的目標是識別肝臟同功酶(L-CPT1)抑制劑,其選擇性高于肌肉同功酶(M-CPT1)以及線粒體膜上催化脫乙?;磻拿窩PT2。2004年,對LCPT1進行了高通量篩選。對第一輪命中的5000個化合物進一步用三種酶進行了8點IC50表征,獲得約2200個苗頭化合物,IC50值低于50 μM,包含多個易處理的苗頭化合物類別。在項目的早期階段,CADD的作用是什么? 基于子結構的聚類(MCS,MOS)[48]和手動疊合可以確定大多數苗頭化合物可能以其生物活性構象擺出相同的形狀(圖11a)。由于推定的生物活性形狀“外皮”是手性的,但苗頭化合物結構不是手性的,在沒有其它信息的情況下,無法區分兩種可能的對映異構體形狀“外皮”(圖11b)。L-CPT1的同源性模型可以進行區分:化合物太大而不能放入適合?;舛緣A結合的隧道,因此假定它們將在CoA結合位點結合。該結合位點僅適合兩個對映異構體中的一個。在探索苗頭化合物的初始階段,使用圖11b中所示的形狀外皮來對苗頭化合物的合成進行優先級排序,并將不同苗頭化合物的元素彼此混合和匹配。D-脯氨酸衍生物39(而不是其對映異構體)應該是L-CPT1抑制劑的正確預測支持了生物活性形狀假設(圖11c)。

Liver Carnitine Palmitoyltransferase 1配體的疊合

Figure 11.(a)主要苗頭化合物類別的代表性化合物的手動3D疊合。(b)兩個對映體生物活性形狀外皮的示意圖,其中左邊的那個認為是正確的。(c)化合物39由高通量篩選苗頭化合物38衍生而來。用形狀外皮假設正確地預測出39對映異構體為活性化合物。

一旦項目團隊對多種苗頭化合物完成探索,藥物化學便迅速專注于優化三個有前景系列的選擇性、溶解度和穩定性。 從這時開始,該項目本質上是一個經典的藥物化學優化項目,其中的預測方法側重于分子性質,而不是結合模式和親和力。

可以得出結論,形狀分析有助于發現配體之間的相似性,有助于在項目團隊內啟動配體片段的”混合和匹配”的嘗試。疊合是逐步的、手動處理的過程,其不可能很容易地自動化。其次,沒進行簡單的形狀分析,就不要持續優化結合模型是一個很好的決定。任何定量的3D藥效團假設,都可能是基于多個配體的重疊而建立的,可能會將團隊帶入歧途。迄今尚未獲得L-CPT1結合假設的實驗驗證。然而,我們能夠用解釋CPT2與非選擇性抑制劑的晶體結構,與簡單的疊合相比,CPT2確實顯示出更寬范圍的結合模式49。

缺乏可利用的配體或蛋白質3D信息標志著從經典分子設計向通常被稱為”化學信息學”的轉變。這一領域的許多方法已經如此深入到日常工作中,以至于它們的假設或設計特征不再被實現:簡單的相似性算法通常用于聚類、HTS跟蹤、集中庫篩選數據庫的選擇或專利分析50,51。 化學信息學技術與通用的信息科學和生物信息學密切相關。如果將各種不同來源的信息進行交叉鏈接、提供上下文和降低數據訪問障礙的方式來實現它們,則它們是最有效的。下面的最后一個例子說明了這種思維方式52。

SST5R

生長抑素(SST)是一種環狀四肽激素,主要抑制荷爾蒙分泌,如生長激素、胰腺胰島素、胰高血糖素和胃泌素的釋放53。SST通過五個不同的G蛋白偶聯受體(GPCR)起作用。 當我們尋找SST受體亞型5(SST5R)的選擇性抑制劑作為潛在的抗糖尿病藥時,尚無已知的小分子拮抗劑。 由于我們不想投入大量資源進行高通量篩選,而基于結構的設計也遙不可及,因此,集中庫篩選似乎是快速識別化合物的唯一可行途徑。

集中庫篩選需要種子化合物進行相似性搜索。 我們沒有遵循通常的方法在SST中尋找具有活性四肽的擬肽54,而是基于生物學相似性選擇了另一種方法。 根據hSST5受體跨膜結合口袋內氨基酸的相似性,對具有已知小分子配體的A類GPCR進行了排序。僅考慮了共有結合位點周圍的局部序列相似性,這種方法在比較GPCR結構時可顯著提高分辨率55。

SST5R抑制劑

Figure 12.(a)分析GPCR中共有藥物結合位點周圍的氨基酸同源性。 生物胺受體(血清素、多巴胺、組胺、阿片類藥物)的跨膜結合口袋與hSST5R密切相關。高度保守的天冬氨酸(D)用紅色框標記,據信阿司咪唑的哌啶環中的叔胺與之非常接近。(b)從阿司咪唑到化合物40,第一個類藥的高選擇性SSTR5拮抗劑小分子。

SST5R的最近鄰居被確定為生物胺受體,通常將其堿性的胺靠近到跨膜配體口袋中保守的Asp332。因此,我們選擇了阿片類藥物、組胺、多巴胺和5-羥色胺受體的配體對SSTR5進行測試(圖12a)。hSST5R放射性配基結合試驗識別了許多具有微摩爾親和力的苗頭化合物。從這些苗頭化合物中,我們選擇了第二代抗組胺藥阿司咪唑作為進一步優化的起點。

藥物化學團隊隨后系統地研究了先導化合物的SAR,并設法從苯并咪唑核心去除芐基來降低阿司咪唑的組胺H1親和力。以這種方式產生了對其他SST受體亞型具有高選擇性的、強效和代謝穩定的hSST5R拮抗劑(圖12b)56??傊?,該實例表明,定制的相似性計算方法與已知配體數據庫的系統搜索相結合可以有效地發現不明顯的化學進入點。這項工作的先決條件是適當的數據基礎:帶注釋的配數據集以及正確比對的跨膜口袋序列。

結論

我們相信,這10個羅氏案例研究雖然并不詳盡,但可以代表當今分子設計可以為小分子藥物發現提供的技術。 具體的工具和方法對許多類型的項目都具有廣泛的用途,包括我們此處未介紹的項目:基于片段的藥物設計,蛋白質-蛋白質相互作用抑制劑的設計,變構調節劑等。 分子識別的基本規則保持不變,而難度和可預測性卻有所不同。 我們現在要后退一步,找到這里使用的各種工具和方法背后的共同主題。

1. 定性陳述的價值

通常,對于項目團隊而言,一個新的想法或指向新方向的指導就足夠了。 大多數項目影響來自于定性工作、分享見解或假設、而不是計算得出的數字或優先級順序。在一個對定量預測方法投入巨大的領域,這種觀察的重要性怎么評估都不過分。 我們認為,僅僅用定量預測是對分子設計使命的誤導性陳述。 計算工具就其本質而言,當然可以產生數值結果,但是絕對不能如此使用。 相反,任何排序列表都應被視為原始輸入,以便在項目范圍內進行進一步評估。 例如,在性質預測中選擇分類而不是回歸模型,該原理可以被非常廣泛地應用,并且超出結合親和力預測的問題。

2. 塑造化學空間

藥物化學是一門創造的學科。在項目進行過程中的任何時候,團隊的重點要么是擴大化學空間,要么是縮小化學空間,以解決和優化問題的不同方面。擴大化學空間需要在一系列約束條件下產生新想法的方法。在這種情況下,有用的工具是基于查詢的工具:3D骨架跳躍,藥效團或形狀搜索的工具,或將已知化合物的元素相互重組的工具??s小化學空間可以是簡單的過濾過程,也可以基于特定的假設(如上述GPBAR1案例)。在給定的項目環境中,重要的是要了解是否需要擴大或縮小化學空間并相應地選擇工具和方法(參見圖1的圖例)。隨著項目向候選藥物選擇發展,縮小和擴大空間的“幅度”通常會變小,但概念保持不變。先進的先導優化中的理性方法可能,例如,建議避免使用某種子結構或優先使用某種取代模式以避免脫靶效應或改善ADMET特性。

3. 簡單即好的原則

分子設計是一個概念過程,因此始終有失去與現實聯系的風險。 科學問題應引出方法,反之亦然。 為此,使事情盡可能簡單是一個有用的指導原則。 選擇最簡單的解釋和最簡單的計算流程可以提高靈活性,并更好地關注手頭的關鍵問題。 一個典型的例子是在任何可能的情況下使用從實驗獲得的數據(例如,構象的CSD),并僅在需要時(例如,雜環之間的扭轉角或互變異構體偏好)訴諸第一性原理方法。

4. 注釋是成功的一半

上述組織蛋白酶示例說明了如何用正交視角看到設計機會。對復合物晶體結構可視化分析其中有利與不利的相互作用、水分子形成的接觸、柔性區域等信息來會帶來價值。上下文信息幾乎可以在任何地方帶來增值。通常需要進行大量的前期工作(計算,組織)來將數據成轉化為有用的形狀。 正確的前端加載工作可以將復雜的查詢轉變為簡單的查找過程或可視化步驟。 除了結合模式可視化之外的良好實例是通過匹配分子對來重復使用ADMET數據或者上述針對SST5量身定制的生物信息學方法。 這方面有很大的增長潛力57,58。

5. 保持與實驗近距離

使事情盡可能簡單的一種方法是優先利用可能支持項目的實驗數據,只要這是有意義的。這可以通過許多不同的方式來完成:參考測得的參數而不是計算的參數;利用現有的化學砌塊而不是設計新的化學砌塊;充分利用已知的配體和SAR或相關的蛋白質結構。合理的藥物設計與巧妙的回收利用有很大關系。

如果得到貫徹,這些指南會重新把務實的重點拉回到當前的分子設計實踐。 讓我們看看在目前實踐中存在的一些問題。

許多計算方法引入額外的參數并因此引入潛在的誤差源,這使得預測值難以提取。處理蛋白質動力學的方法屬于這一類別。在大多數基于結構的項目中,可以利用剛性蛋白質結構或利用側鏈的選擇性松弛或旋轉來建立粗略的結合假設或能量估計。自由能微擾方法也有類似的論點。這一領域取得了明顯的進展59-61。然而,在定性答案就足夠好的快節奏項目中,節約原則限制了它們的使用,因為它們所帶來的額外復雜性收效甚微。此外,它們的適用范圍小,因為水結構或構象的顯著變化難以解釋和量化。

在需要評估蛋白質動態性質(Mobility)且無法通過其他技術進行評估的情況下,分子動力學(MD)可能會有用62,63。需要格外小心,不要過度解讀或曲解計算結果。MD軌跡無法通過實驗驗證,因此需要付出額外的努力才能將此類模擬結果與真正可檢驗的假設聯系起來,例如,在定性預測機制或蛋白質運動可能用于結合劑(binder)設計的場合。

近年來,已提出了嘗試在蛋白質結合位點內模擬水網絡的方法64-66。在此,該方法的直接計算結果(水位,結合能,熵變)無法通過實驗進行測試,因此, 將結果轉換為會推動藥物發現的假設,而不是提供需要額外的努力事后合理化。這額外的努力是什么?至少,應該弄清楚底線是相對于哪些計算是一種改進。 就水的結構和動力學而言,這可能是經典的去溶劑化觀點或晶體學或模擬水位置的幾何打分67。如果沒有這樣的參考模型,從更高的理論水平上計算水的作用,幾乎沒有機會獲得新的見解。

每種方法都有其適用范圍和一組必須避免的內在缺陷。如上所述,最典型之一是對數值結果的過高置信度。例如,小分子-蛋白對接可用于確定化合物的優先級以進行實驗篩選。對接程序可以評估化合物是否以合理的構象與結合口袋匹配,但眾所周知,對接打分值與結合親和力數據無關68-71。正確使用對接程序需要使用盡可能多的約束條件,并在視覺檢查和選擇方面投入大量資金72。如果沒有進一步的審查,對接工具預測的結合模式不應被接受。只要可能,藥效團搜索或形狀匹配提供更集中假設的測試73,74。

比較不同的配體時,基于特征的疊合結果通常給人以高3D相似性的印象,而這一點并尚未被實驗證實。 結合模式通常大大地有別于3D相似性所暗示的。無論何時進行基于此類疊合的預測時,都應牢記這一點。因此,只有對生物活性構象作出明確的陳述時,才能有把握地推導出3D藥效團和形狀約束。對于大多數QSAR方法,存在生成自洽模型的風險,該模型本質上反映了手頭的數據,但沒有預測能力。 從藥物化學家的角度來看,它們還有另一個缺點,那就是黑匣子,只能用作過濾器,而不能培養創造性思維。

分子設計的最佳實踐是所有科學的最佳實踐:對清晰、簡單和良好實驗設計的不懈關注。 分子設計的特殊之處在于需要建立扎實的假設并同時培養藥物化學方面的創新思維。 如果我們接受這一點,我們的重點可能會從我們擁有的許多半定量預測工具轉移到支持這一創造性過程的方法上75。那么,計算方法的進一步改進可能與科學的關系不如與好的軟件工程和界面設計的關系。 這些工具只是達到目的的一種手段。 如果適當地使用它們,就會產生好的科學。

奇米777四色影视在线看_国内一点不卡在线播放视频_比较有韵味的熟妇无码