丝氨酸及苯基异丝氨酸类SARS病毒3CL蛋白酶抑制剂HQSAR研究及分子设计

何安朕 张继川 何严萍 王月平

引用本文:
Citation:

丝氨酸及苯基异丝氨酸类SARS病毒3CL蛋白酶抑制剂HQSAR研究及分子设计

    作者简介: 何安朕(1996−),男,安徽人,硕士生,主要研究药物分子设计与合成. E-mail:anzhenhe1996@gmail.com;
    通讯作者: 何严萍, yphe@ynu.edu.cn ; 王月平, wangyp@kmust.edu.cn
  • 中图分类号: O629.71; R914

HQSAR study and molecular design of serine and phenylisoserine derivatives as SARS-CoV 3CL protease inhibitors

    Corresponding author: HE Yan-ping, yphe@ynu.edu.cn ;WANG Yue-ping, wangyp@kmust.edu.cn
  • CLC number: O629.71; R914

  • 摘要: 采用分子全息定量构效关系(Holographic Quentitative Structure-Activity Ralationship,HQSAR)方法,研究了40个丝氨酸及苯基异丝氨酸类SARS-CoV 3CL蛋白酶抑制剂的构效关系,探讨了分子碎片大小、碎片区分参数及全息长度对模型质量的影响. 利用偏最小二乘法建立了一个以30个化合物为训练集的最优模型,其交叉验证相关系数q2为0.604,非交叉验证相关系数r2为0.904,标准偏差SEE为0.125;使用该模型对由9个化合物组成的测试集进行预测,其预测相关系数r2pred为0.723,表明该模型具有良好的预测能力及拟合能力. 利用HQSAR色码图探讨了分子中不同结构片段对活性的贡献,在此基础上根据最优HQSAR模型设计了一组具有良好预测活性的苯基异丝氨酸类3CL蛋白酶抑制剂,为新型SARS-CoV 3CL蛋白酶抑制剂的设计和优化提供了参考,也为研发治疗新型冠状病毒肺炎(COVID-19)的3CL蛋白酶抑制剂提供借鉴.
  • 图 1  丝氨酸及苯基异丝氨酸类抑制剂与3CL蛋白酶结合模式

    Figure 1.  Binding mode of serines and phenylisoserines inhibitors with 3CL protease

    图 2  丝氨酸及苯基异丝氨酸类3CL蛋白酶抑制剂公共结构(1~36)

    Figure 2.  The structure of serine and phenylisoserine 3CL protease inhibitors (1~36)

    图 3  训练集和测试集样本的实际值与预测值相关关系

    Figure 3.  Comparison of the experiment value and the predicted value of the training set and test set

    图 4  HQSAR活性贡献图

    Figure 4.  HQSAR contribution maps

    图 5  基于HQSAR设计的化合物通用结构

    Figure 5.  General structure of compounds designed by HQSAR

    表 1  40种化合物结构

    Table 1.  Structure of 40 compounds

    序号通用结构R序号通用结构R序号通用结构R
    1 a 15 a 29 c
    2 a H 16 b 30 c
    3 a 17 b 31 Ent-a
    4 a 18 b 32* Ent-a
    5 a 19* b 33* Ent-a
    6 a 20 b 34 Ent-a
    7* a 21* b 35 Ent-a
    8 a 22 b 36 Ent-a
    9 a 23 b 37
    10 a 24 b 38
    11* a 25 c 39*
    12 a 26 c 40
    13*
    a 27 c
    14 a 28* c
    *表示化合物为测试集
    下载: 导出CSV

    表 2  39个化合物生物活性的实验值、计算值和误差

    Table 2.  Biocative experiment data,calculated value and deviatoin of 39 compounds

    序号pIC50预测值误差序号pIC50预测值误差序号pIC50预测值误差
    13.9033.7660.137154.1874.1600.027293.6023.788−0.186
    22.824163.3013.393−0.092304.1874.1560.031
    33.1873.295−0.108173.6203.772−0.152312.7962.7260.070
    43.1873.1550.032183.6583.5990.05932*3.2603.1610.099
    53.2523.470−0.21819*3.8103.851−0.04133*3.4693.4380.031
    63.2603.1420.118203.8123.913−0.101343.6203.5380.082
    7*3.3473.2430.10421*4.0003.9400.060353.6783.6270.051
    83.3983.3960.002224.0093.8550.154364.0004.061−0.061
    93.6023.643−0.041234.0223.9100.112373.7453.7060.039
    103.7453.6420.103244.1314.0690.062383.3673.490−0.123
    11*3.7573.7520.005254.3674.432−0.06539*4.1254.1160.009
    123.7703.866−0.096264.0714.077−0.006403.6483.854−0.206
    13*3.9213.3690.552274.1873.9510.236
    144.0713.9280.14328*3.9033.7620.141
    *表示化合物为测试集
    下载: 导出CSV

    表 3  碎片区分参数及全息长度对模型的影响

    Table 3.  The influence of various fragment distinction parameters and hologram length on HQSAR

    碎片区分参数4~71~9
    q2 a)BLb)NOCc)r2 d)SEEe)q2 a)BLb)NOCc)r2 d)SEEe)
    Ch0.20740140.5750.2640.14915130.5140.277
    A/Ch0.19540110.3840.3000.12640110.3410.311
    B/Ch0.0755910.2930.3220.08735310.3000.320
    Co/Ch0.18335310.4210.2910.2648330.6840.223
    Da/Ch0.02140110.2930.3220.2916150.7190.219
    H/Ch0.20740140.5750.2640.14915130.5140.277
    A/B/Ch0.17525710.4080.2950.2399730.7480.200
    A/Co/Ch0.3355960.8880.1410.24725730.7450.201
    A/Da/Ch0.1955940.6570.2370.19525740.6830.228
    B/Co/Ch0.16040110.4030.2960.1829720.5650.257
    B/Da/Ch0.1078340.6670.2340.0955940.6980.223
    Co/Da/Ch0.1285930.7240.2090.21035340.7770.191
    A/B/Co/Ch0.17935310.4410.2860.5049760.9370.106
    A/B/Da/Ch0.07440130.6460.2360.19140160.8920.139
    A/Co/Da/Ch0.2275930.6880.2220.3357140.7680.195
    A/B/Co/Da/Ch0.2646140.7310.2100.3859750.8880.138
    A/B/Co/Da/H/Ch0.1819760.8220.1780.4809760.8500.163
    a) q2为交叉验证相关系数;b) BL为最佳分子全息长度;c) NOC为最佳主成分数;d) r2为非交叉验证相关系数;e) SEE为非交叉验证标准误差
    下载: 导出CSV

    表 4  不同碎片大小对HQSAR分析结果的影响

    Table 4.  Influences of various fragment parameters for HQSAR

    碎片大小q2BLNOCr2SEE
    1~40.2767110.4230.291
    1~70.20435310.4340.288
    1~150.6047140.9040.125
    4~50.29435310.4740.278
    4~70.17935310.4410.286
    7~100.4735360.9460.098
    7~130.43640150.9270.112
    9~120.35025750.9430.098
    9~130.41440150.9300.109
    9~150.5717140.8990.129
    下载: 导出CSV

    表 5  基于最优HQSAR结果所设计分子的结构及活性预测值

    Table 5.  Structure and calculated values of the designed molecules

    化合物R1R2预测值
    D14.367
    D24.394
    D34.671
    D44.752
    D54.99
    下载: 导出CSV
  • [1] 丁珍. 冠状病毒N蛋白抑制IFN-β产生的分子机制研究[D]. 武汉: 华中农业大学, 2017.

    Ding Z. The molecular mechanism of coronavirus N proteins inhibit IFN—13I production[D]. Wuhan: Huazhong Agricultural University, 2017.
    [2] Hasöksüz M, Kiliç S, Saraç F. Coronaviruses and SARS-CoV-2[J]. Turkish Journal of Medical Sciences, 2020, 50(S1): 549-556. DOI:  10.3906/sag-2004-127.
    [3] Chan J F W, Kok K H, Zhu Z, et al. Genomic characterization of the 2019 novel human-pathogenic coronavirus isolated from a patient with atypical pneumonia after visiting Wuhan[J]. Emerging Microbes & Infections, 2020, 9(1): 221-236. DOI:  10.1080/22221751.2020.1719902.
    [4] Wilder-Smith A, Chiew C J, Lee V J. Can we contain the COVID-19 outbreak with the same measures as for SARS?[J]. The Lancet Infectious Diseases, 2020, 20(5): e102-e107. DOI:  10.1016/S1473-3099(20)30129-8.
    [5] Liu Y, Liang C, Xin L, et al. The development of Coronavirus 3C-Like protease (3CLpro) inhibitors from 2010 to 2020[J]. European Journal of Medicinal Chemistry, 2020, 206(15): 112 711. DOI:  10.1016/j.ejmech.2020.112711.
    [6] Akaji K, Konno H. Design and evaluation of anti-SARS-coronavirus agents based on molecular interactions with the viral protease[J]. Molecules, 2020, 25(17): 3 920. DOI:  10.3390/molecules25173920.
    [7] Akaji K, Konno H, Mitsui H, et al. Structure-based design, synthesis, and evaluation of peptide-mimetic SARS 3CL protease inhibitors[J]. Journal of Medicinal Chemistry, 2011, 54(23): 7 962-7 973. DOI:  10.1021/jm200870n.
    [8] 马春玲. SARS冠状病毒基因组编码蛋白的研究进展[J]. 国外医学: 病毒学分册, 2004, 11(1): 16-19. DOI:  10.3760/cma.j.issn.1673-4092.2004.01.005. Ma C L. Research progress of the SARS coronavirus genome coding protein[J]. International Journal of Virology, 2004, 11(1): 16-19.
    [9] 孙波. SARS冠状病毒主蛋白酶抑制剂的设计与合成[D]. 天津: 南开大学, 2012.

    Sun B. Design and synthesis of the inhibitor of SARS-CoV Mpro[D]. Tianjing: Nankai University, 2012.
    [10] Chou K C, Wei D Q, Zhong W Z. Binding mechanism of coronavirus main proteinase with ligands and its implication to drug design against SARS[J]. Biochemical and Biophysical Research Communications, 2003, 308(1): 148-151. DOI:  10.1016/S0006-291X(03)01342-1.
    [11] Thanigaimalai P, Konno S, Yamamoto T, et al. Design, synthesis, and biological evaluation of novel dipeptide-type SARS-CoV 3CL protease inhibitors: Structure–activity relationship study[J]. European Journal of Medicinal Chemistry, 2013, 65: 436-447. DOI:  10.1016/j.ejmech.2013.05.005.
    [12] Yang H, Yang M, Ding Y, et al. The crystal structures of severe acute respiratory syndrome virus main protease and its complex with an inhibitor[J]. Proceedings of the National Academy of Sciences, 2003, 100(23): 13 190-13 195. DOI:  10.1073/pnas.1835675100.
    [13] Akaji K, Konno H, Onozuka M, et al. Evaluation of peptide-aldehyde inhibitors using R188I mutant of SARS 3CL protease as a proteolysis-resistant mutant[J]. Bioorganic & Medicinal Chemistry, 2008, 16(21): 9 400-9 408. DOI:  10.1016/j.bmc.2008.09.057.
    [14] Konno H, Wakabayashi M, Takanuma D, et al. Design and synthesis of a series of serine derivatives as small molecule inhibitors of the SARS coronavirus 3CL protease[J]. Bioorganic & Medicinal Chemistry, 2016, 24(6): 1 241-1 254. DOI:  10.1016/j.bmc.2016.01.052.
    [15] Konno H, Onuma T, Nitanai I, et al. Synthesis and evaluation of phenylisoserine derivatives for the SARS-CoV 3CL protease inhibitor[J]. Bioorganic & Medicinal Chemistry Letters, 2017, 27(12): 2 746-2 751. DOI:  10.1016/j.bmcl.2017.04.056.
    [16] Shukla A, Tyagi R, Meena S, et al. 2D-and 3D-QSAR modelling, molecular docking and in vitro evaluation studies on 18β-glycyrrhetinic acid derivatives against triple-negative breast cancer cell line[J]. Journal of Biomolecular Structure and Dynamics, 2020, 38(1): 168-185. DOI:  10.1080/07391102.2019.1570868.
    [17] G Mercader A, B Pomilio A. 2D-and 3D-QSAR studies of flavonoids, biflavones and chalcones: Antiviral, antibacterial, antifungal, and antimycobacterial activities[J]. Anti-Infective Agents, 2012, 10(1): 41-54. DOI:  10.2174/2211362611201010041.
    [18] 项瑶, 赵钟祥, 陈静波, 等. 咪唑类ALK5抑制剂的3D-QSAR及分子对接研究[J]. 云南大学学报: 自然科学版, 2017, 39(4): 633-642. DOI:  10.7540/j.ynu.20160624. Xiang Y, Zhao Z X, Chen J B, et al. 3D-QSAR and docking studies on imidazole derivatives as activin receptor-like kinase 5 (ALK5) inhibitors[J]. Journal of Yunnan University: Natural Sciences Edition, 2017, 39(4): 633-642.
    [19] 王月平, 陆礼和, 刘小蜂, 等. 6-(1-萘甲基)取代S-DABO类逆转录酶抑制剂的3D-QSAR研究[J]. 云南大学学报: 自然科学版, 2013, 35(2): 208-213. DOI:  10.7540/j.ynu.20120378. Wang Y P, Lu L H, Liu X F, et al. HQSAR study and design of benzimidazole 5-carboxylic amide derivatives as HCV NS5 polymerase inhibitors[J]. Journal of Yunnan University: Nature Sciences Edition, 2013, 35(2): 208-213.
    [20] 施海枫, 刘永香, 涂文通. 国内有关黄酮类化合物及其衍生物的2D-QSAR和3D-QSAR研究进展[J]. 广东化工, 2013, 40(24): 70-71. DOI:  10.3969/j.issn.1007-1865.2013.24.032. Shi H F, Liu Y X, Tu W T. The relevant domestic flavonoids and its derivatives of 2D-QSAR and 3D-QSAR research progress[J]. Guangdong Chemical Industry, 2013, 40(24): 70-71.
    [21] 霍金旭, 张卓勇, 肖爱婧, 等. 比较分子力场法研究5,6-二氢-(9H)-吡唑[3,4-c]-1,2,4-三唑[4,3-a]吡啶类抑制剂的定量构效关系[J]. 计算机与应用化学, 2009, 26(2): 45-48. DOI:  10.16866/j.com.app.chem2009.02.012. Huo J X, Zhang Z Y, Xiao A J, et al. QSAR study of a series of 5,6-dihydor-(9H)-Pyarzolo[3,4-c]-l,2,4-triazolo [4,3-a] pyridine inhibitors by COMFA[J]. Computers and Applied Chemistry, 2009, 26(2): 45-48.
    [22] Lowis D R. HQSAR: A new highly predictive QSAR technique[J]. Tripos Technical Notes, 1997, 1(5): 17. DOI:  10.3390/ecsoc-1-02064.
    [23] Rodrigues C R, Flaherty T M, Springer C, et al. CoMFA and HQSAR of acylhydrazide cruzain inhibitors[J]. Bioorganic & Medicinal Chemistry Letters, 2002, 12(11): 1 537-1 541. DOI:  10.1016/S0960-894X(02)00189-0.
    [24] Sridhar J, Foroozesh M, Stevens C L K. QSAR models of cytochrome P450 enzyme 1A2 inhibitors using CoMFA, CoMSIA and HQSAR[J]. SAR and QSAR in Environmental Research, 2011, 22(7-8): 681-697. DOI:  10.1080/1062936X.2011.623320.
    [25] 陈娴, 张廉高, 王子恒, 等. 苯并咪唑-5-羧酸酰胺HCV NS5B聚合酶抑制剂的分子全息QSAR研究及设计[J]. 云南大学学报: 自然科学版, 2017, 39(6): 1 040-1 050. DOI:  10.7540/j.ynu.20170197. Chen X, Zhang L G, Wang Z H, et al. HQSAR study and design of benzimidazole 5-carboxylic derivatives amide derivatives as HCV NS5B polymerase inhibitors[J]. Journal of Yunnan University: Nature Sciences Edition, 2017, 39(6): 1 040-1 050.
    [26] 王子恒, 陈娴, 张玉芳, 等. 5-羧基苯并咪唑类HCV NS5B聚合酶抑制剂的HQSAR研究及分子设计[J]. 中国科学: 化学, 2017, 47(3): 350-360. DOI:  CNKI:SUN:JBXK.0.2017-03-006. Wang Z H, Chen X, Zhang Y F, et al. HQSAR study and molecular design of benzimidazole 5-carboxylic derivatives of hepatitis C virus NS5B polymerase[J]. Scientia Sinica Chimica, 2017, 47(3): 350-360.
    [27] 孙磉礅, 米思奇, 游靖, 等. 苯并咪唑类缓蚀剂的 HQSAR研究及分子设计[J]. 物理化学学报, 2013, 29(6): 1 192-1 200. DOI:  10.3866/PKU.WHXB201303154. Sun S D, Mi S Q, You J, et al. HQSAR study and molecular design of benzimidazole derivatives as corrosion inhibitors[J]. Acta Physico-Chimica Sinica, 2013, 29(6): 1 192-1 200.
    [28] Flower D R. On the properties of bit string-based measures of chemical similarity[J]. Journal of Chemical Information and Computer Sciences, 1998, 38(3): 379-386. DOI:  10.1021/ci970437z.
    [29] Winkler D A, Burden F R. Holographic QSAR of benzodiazepines[J]. Quantitative Structur-Activity Relationships, 1998, 17(3): 224-231. DOI: 10.1002/(SICI)1521-3838(199806)17:03<224::AID-QSAR224>3.0.CO;2-6.
    [30] 崔世海, 刘树深, 王晓栋, 等. 雌二醇衍生物的HQSAR研究[J]. 科学通报, 2003, 48(3): 239-242. DOI:  10.3321/j.issn:0023-074X.2003.03.007. Cui S H, Liu S S, Wang X D, et al. HQSAR study of estradiol derivatives[J]. Chinese Science Bulletin, 2003, 48(3): 239-242.
  • [1] 陈娴张廉高王子恒王月平何严萍 . 苯并咪唑-5-羧酸酰胺HCV NS5B聚合酶抑制剂的分子全息QSAR研究及设计. 云南大学学报(自然科学版), 2017, 39(6): 1040-1050. doi: 10.7540/j.ynu.20170197
    [2] 冯惠王晓辉王菊冯长君 . 培氟沙星均三唑硫醚类化合物抗增殖活性的3D-QSAR研究与分子设计. 云南大学学报(自然科学版), 2021, 43(1): 142-146. doi: 10.7540/j.ynu.20200132
    [3] 陈艳堵锡华吴琼石春玲 . 2-芳基苯并二氢吡喃-4-酮类衍生物抗菌活性的定量构效关系研究及分子设计. 云南大学学报(自然科学版), 2020, 42(2): 332-337. doi: 10.7540/j.ynu.20190601
    [4] 张虽栓辛七四何严萍李聪何嵋 . DABO类非核苷类逆转录酶抑制剂分子设计及合成. 云南大学学报(自然科学版), 2008, 30(5): 514-518.
    [5] 项瑶赵钟祥陈静波马玉卓刘鹰翔熊迪 . 咪唑类ALK5抑制剂的3D-QSAR及分子对接研究. 云南大学学报(自然科学版), 2017, 39(4): 633-642. doi: 10.7540/j.ynu.20160624
    [6] 王宜挺樊世瑞杨碧娟陈铎之郝小江 . 基于虚拟筛选探讨菲啶类衍生物抗新型冠状病毒(SARS-CoV-2)潜力. 云南大学学报(自然科学版), 2020, 42(6): 1173-1180. doi: 10.7540/j.ynu.20200259
    [7] 薛孟祺杨念琦字慧敏杨平杨靖华汪云松 . 基于分子模拟技术筛选木姜子属阿朴菲型生物碱的COX-2抑制剂研究(I). 云南大学学报(自然科学版), 2020, 42(2): 325-331. doi: 10.7540/j.ynu.20190583
    [8] 杨静高波丁磊徐艳声李梅章 . 埃博拉病毒宿主及病毒分子检测技术研究进展. 云南大学学报(自然科学版), 2015, 37(S1): 96-. doi: 10.7540/j.ynu.20150a2
    [9] 叶亚飞李全董星徐盛宇程晓红 . 基于2,4,6-三苯基吡啶星型液晶分子的设计合成及性能研究. 云南大学学报(自然科学版), 2010, 32(2): 208-212 .
    [10] 何琴张立科黄保军 . RBF网络在取代苯胺和苯酚定量构效关系研究中的应用. 云南大学学报(自然科学版), 2010, 32(6): 685-689, .
    [11] 徐位凯王琳 . Turbo码中混沌交织器的设计. 云南大学学报(自然科学版), 2003, 25(4): 308-312.
    [12] 王月平陆礼和刘小蜂武道春何严萍 . 6-(1-萘甲基)取代S-DABO类逆转录酶抑制剂的3D-QSAR研究. 云南大学学报(自然科学版), 2013, 35(2): 208-213. doi: 10.7540/j.ynu.20120378
    [13] 张亚鹏唐猛李海华谢灵运陈建华 . 物理层网络编码与LDPC码联合系统设计及性能优化. 云南大学学报(自然科学版), 2020, 42(1): 28-35. doi: 10.7540/j.ynu.20190226
    [14] 李海华唐猛张亚鹏谢灵运陈建华 . 多中继物理层网络编码系统与LDPC码联合设计及性能分析. 云南大学学报(自然科学版), 2020, 42(): 1-9. doi: 10.7540/j.ynu.20190651
    [15] 吕兵杨向东 . CH2(X3B1)分子的结构与解析势能函数. 云南大学学报(自然科学版), 2008, 30(4): 376-380.
    [16] 蔚亚楠龚亚菊汪骞黎志彬鲍锐李石开吴丽艳 . 基于SSR分子标记‘云茄3号’的种子纯度鉴定. 云南大学学报(自然科学版), 2020, 42(4): 804-810. doi: 10.7540/j.ynu.20190737
    [17] 任雁明彭雄伟邢伟张蓓程晓红 . 偶氮1,3,4-噻二唑polycatenar分子为底物的连续识别传感器制备. 云南大学学报(自然科学版), 2017, 39(4): 643-649. doi: 10.7540/j.ynu.20160816
    [18] 杜宇段禄华周剑和万忠曹云华李斌陈光勇寸东义 . 长针科线虫2种传毒种类和3种非传毒种类分子鉴定和亲缘分析. 云南大学学报(自然科学版), 2009, 31(1): 84-89 .
    [19] 庞礼军汪荣凯令狐荣锋陈世国杨向东 . HF分子基态(X1∑+)的分子结构与势能函数. 云南大学学报(自然科学版), 2007, 29(2): 156-159.
    [20] 闵勇易平古昆邱明华 . 1,5-二芳基吡唑类环氧合酶-1选择性抑制剂的CoMFA研究. 云南大学学报(自然科学版), 2005, 27(5): 429-433.
  • 加载中
图(5)表(5)
计量
  • 文章访问数:  280
  • HTML全文浏览量:  278
  • PDF下载量:  4
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-01-13
  • 录用日期:  2021-05-27
  • 网络出版日期:  2021-07-20
  • 刊出日期:  2021-11-15

丝氨酸及苯基异丝氨酸类SARS病毒3CL蛋白酶抑制剂HQSAR研究及分子设计

    作者简介:何安朕(1996−),男,安徽人,硕士生,主要研究药物分子设计与合成. E-mail:anzhenhe1996@gmail.com
    通讯作者: 何严萍, yphe@ynu.edu.cn
    通讯作者: 王月平, wangyp@kmust.edu.cn
  • 1. 昆明理工大学 理学院 应用化学系,云南 昆明 650500
  • 2. 云南大学 教育部自然资源药物化学重点实验室,化学科学与工程学院·药学院,云南 昆明 650500

摘要: 采用分子全息定量构效关系(Holographic Quentitative Structure-Activity Ralationship,HQSAR)方法,研究了40个丝氨酸及苯基异丝氨酸类SARS-CoV 3CL蛋白酶抑制剂的构效关系,探讨了分子碎片大小、碎片区分参数及全息长度对模型质量的影响. 利用偏最小二乘法建立了一个以30个化合物为训练集的最优模型,其交叉验证相关系数q2为0.604,非交叉验证相关系数r2为0.904,标准偏差SEE为0.125;使用该模型对由9个化合物组成的测试集进行预测,其预测相关系数r2pred为0.723,表明该模型具有良好的预测能力及拟合能力. 利用HQSAR色码图探讨了分子中不同结构片段对活性的贡献,在此基础上根据最优HQSAR模型设计了一组具有良好预测活性的苯基异丝氨酸类3CL蛋白酶抑制剂,为新型SARS-CoV 3CL蛋白酶抑制剂的设计和优化提供了参考,也为研发治疗新型冠状病毒肺炎(COVID-19)的3CL蛋白酶抑制剂提供借鉴.

English Abstract

  • 冠状病毒是自然界广泛存在的一种病毒,在系统分类上属套式病毒目(Nidovirales)冠状病毒科(Coronaviridae)冠状病毒属(Coronavirus)[1]. 此类病毒是具囊膜(Envelope)、基因组为线性单股正链的RNA病毒. 目前已知的可感染人类的冠状病毒一共有7种,分别为HCoV-229E、HCoV-OC43、HCoV-NL63、HCoV-HKU1、SARS-CoV、MERS-CoV和SARS-CoV-2. 其中,后3种对人类健康及公共安全具有严重威胁:SARS-CoV导致了2003年重症急性呼吸综合征的爆发、MERS-CoV引发了2012年的中东呼吸综合征,而2019年的新型冠状病毒肺炎(COVID-19)[2]则因感染SARS-CoV-2所致. 由于新冠疫情的全球蔓延,研发SARS-CoV-2的药物相关药物刻不容缓. 鉴于SARS-CoV-2与SARS-CoV的基因组具有82%的相似度[3]. 两者高度同源,说明这两种病毒可能均起源于蝙蝠[4]. 因此,从抗SARS-CoV化合物中发现SARS-CoV-2抑制剂,是目前研发治疗COVID-19药物的重要策略之一[5-7].

    冠状病毒基因组编码的病毒蛋白主要有以下3种:结构蛋白、复制酶多聚蛋白及附属蛋白. 就SARS冠状病毒而言,其结构蛋白主要由N蛋白、M蛋白、E蛋白以及S蛋白共同构成;附属蛋白则包括由orfla、orflb等开放阅读框编码的各种蛋白质[8];其复制酶多聚蛋白pp1a和pp1b则由开放阅读框1a/b编码,生成后被3CL蛋白酶和类木瓜蛋白酶(PLpro)水解,裁剪成具有独立作用的16个功能性多肽(蛋白). 只有在这些非结构蛋白的参与下,病毒才能进行转录和复制[9]. 因此,3CL蛋白酶是抗SARS病毒药物设计的重要靶标.

    3CL蛋白酶的催化活性中心由半胱氨酸(Cys145)和组氨酸(His41)二联体构成. 其中,Cys145为亲核进攻基团,His41则为酸−碱催化残基[10-11]. 2003年Rao课题组[12]报道了肽类抑制剂与3CL蛋白酶结合的晶体结构,为后续的药物设计指明了方向. Kenichi Akaji课题组基于3CL蛋白酶晶体结构进行合理设计,合成了高活性的醛基四肽[7, 13]. 构效关系分析表明,当抑制剂能与3CL酶结合腔中的S1,S2,S4和S1′结合位点紧密结合时,化合物将有很高的酶抑制活性. 为了克服肽类抑制剂的不良药代性质,Kenichi Akaji课题组通过分子模拟,以丝氨酸及苯基异丝氨酸为骨架(图1),设计了一系列具有良好活性的非肽类小分子抑制剂[14-15],值得进一步深入研究.

    图  1  丝氨酸及苯基异丝氨酸类抑制剂与3CL蛋白酶结合模式

    Figure 1.  Binding mode of serines and phenylisoserines inhibitors with 3CL protease

    定量构效关系(QSAR)研究在现代药物设计中起着重要的作用. 二维定量构效关系(2D-QSAR)和三维定量构效关系(3D-QSAR)已经得到了广泛应用[16-19],但这两种方法均有其自身局限性. 传统的2D-QSAR在分析过程中涉及大量的物化参数,需对这些参数进行选择及组合,过程复杂[20]. 3D-QSAR中如比较分子力场分析(CoMFA)方法,虽然包含了更为明确的物理化学信息,同时也能够间接反映分子与靶点之间的非键相互作用特征[21],但其模建过程依赖于分子的叠合,大大增加了工作量. 1997年,Hurst和Heritage建立了分子全息定量构效关系(HQSAR)方法[22],无需叠合分子构象,计算简单、快捷,所建模型具有较高的预测能力,已被广泛用于构效关系研究中[23-26].

    本文采用HQSAR方法研究了丝氨酸及苯基异丝氨酸类3CL蛋白酶小分子抑制剂的构效关系,建立了具有较好预测能力的构效关系模型. 并以此为指导,对该类抑制剂进一步结构优化,经模型预测,所设计化合物对3CL蛋白酶均有较高的抑制活性. 本研究为此类3CL蛋白酶小分子抑制剂的设计与优化提供了指导,也为新型SARS-CoV-2 3CL蛋白酶抑制剂的设计提供参考.

    • 用于HQSAR分析的丝氨酸及苯基异丝氨酸类SARS-CoV 3CL蛋白酶抑制剂源自Kenichi Akaji课题组[14-15]. 分子公共结构见图2,其中化合物37383940表1中额外列出. 所选取的40个化合物的结构见表1,活性数据见表2.

      图  2  丝氨酸及苯基异丝氨酸类3CL蛋白酶抑制剂公共结构(1~36)

      Figure 2.  The structure of serine and phenylisoserine 3CL protease inhibitors (1~36)

      序号通用结构R序号通用结构R序号通用结构R
      1 a 15 a 29 c
      2 a H 16 b 30 c
      3 a 17 b 31 Ent-a
      4 a 18 b 32* Ent-a
      5 a 19* b 33* Ent-a
      6 a 20 b 34 Ent-a
      7* a 21* b 35 Ent-a
      8 a 22 b 36 Ent-a
      9 a 23 b 37
      10 a 24 b 38
      11* a 25 c 39*
      12 a 26 c 40
      13*
      a 27 c
      14 a 28* c
      *表示化合物为测试集

      表 1  40种化合物结构

      Table 1.  Structure of 40 compounds

      序号pIC50预测值误差序号pIC50预测值误差序号pIC50预测值误差
      13.9033.7660.137154.1874.1600.027293.6023.788−0.186
      22.824163.3013.393−0.092304.1874.1560.031
      33.1873.295−0.108173.6203.772−0.152312.7962.7260.070
      43.1873.1550.032183.6583.5990.05932*3.2603.1610.099
      53.2523.470−0.21819*3.8103.851−0.04133*3.4693.4380.031
      63.2603.1420.118203.8123.913−0.101343.6203.5380.082
      7*3.3473.2430.10421*4.0003.9400.060353.6783.6270.051
      83.3983.3960.002224.0093.8550.154364.0004.061−0.061
      93.6023.643−0.041234.0223.9100.112373.7453.7060.039
      103.7453.6420.103244.1314.0690.062383.3673.490−0.123
      11*3.7573.7520.005254.3674.432−0.06539*4.1254.1160.009
      123.7703.866−0.096264.0714.077−0.006403.6483.854−0.206
      13*3.9213.3690.552274.1873.9510.236
      144.0713.9280.14328*3.9033.7620.141
      *表示化合物为测试集

      表 2  39个化合物生物活性的实验值、计算值和误差

      Table 2.  Biocative experiment data,calculated value and deviatoin of 39 compounds

      活性指标用抑制3CL蛋白酶活性的半数有效浓度IC50的负对数pIC50 (−lgIC50)表示. 在初步构效关系研究中,化合物2的R为氢,异于其它化合物的烃基取代基,在HQSAR模型中为异常点,予以去除. 故本文最终选取了30个化合物作为训练集构建模型,随机选取9个化合物作为测试集(表1中带*的分子),用于检验模型预测能力.

    • 本文所有计算工作均在Tripos公司的SYBYL7.2分子模拟软件上进行. 计算中各项参数除特别指明外均采用缺省值. 首先使用SYBYL/Base Builder模块构建化合物结构,随后利用Minimize模块中的Tripos分子力场进行能量优化,采用Gasteiger-Huckel方法计算原子电荷,能量收敛标准为0.0209 kJ/mol,迭代次数为5000次,优化后得到的各分子最低能量构象用于HQSAR分析.

    • 采用SYBYL/HQSAR模块产生分子全息. 首先,将训练集中的各分子剪切为包含一定原子个数的分子碎片,碎片的结构类型即为碎片区分参数,SYBYL中提供的碎片区分参数为原子类型(A)、化学键类型(B)、连接性(Co)、氢原子(H)、手性(Ch)及氢键供体或受体(DA). 碎片中的原子数目即为碎片大小参数(fragment size parameters),由碎片中最小原子数N和最大原子数M设定. 一般而言,碎片长度在1~3为较小分子碎片,4~7为中等原子碎片,8~10为较大原子碎片[27]. 随后,基于循环冗余校验算法将产生的分子碎片映射为0~231的伪随机整数,使得每个分子可用一定长度的整数串进行表示. 继而基于哈希法将其转换为具有相同长度的整数串,即分子全息[28]. 在HQSAR模块中,提供了12个缺省质数(53,59,61,71,83,97,151,199,257,307,353和401)作为全息长度[29]. 通过调整不同的碎片大小、全息长度等参数可以得到不同的分子全息. 随后,将各个分子的分子全息作为自变量,活性作为因变量,采用偏最小二乘法(PLS)进行线性回归分析. 采用留一法(LOO)进行交叉验证,通过交叉验证相关系数q2确定最佳主成分数,选择q2最大时的主成分数为最佳主成分数(NOC),应用最佳主成分数进行非交叉验证PLS分析得到HQSAR模型.

    • 由于不同的碎片区分参数及其组合所包含的信息不同,因此确定适宜的碎片区分参数对HQSAR模型至关重要. 首先,在默认长度(4~7)下及较大的分子碎片(1~9)下考察不同碎片区分参数以及分子全息长度对模型的影响,结果见表3. 由于本文所研究的化合物具有手性,因此碎片区分参数中的手性(Ch)为必选项. 由表3的数据可知,当以原子类型(A)、化学键类型(B)、连接性(Co)和手性(Ch)作为碎片区分参数时,可以得到较好的模型. 此时,留一法交叉验证相关系数q2为0.504,非交叉验证相关系数r2=0.937,最佳主成分数(NOC)为6,最佳分子全息长度(BL)为97.

      碎片区分参数4~71~9
      q2 a)BLb)NOCc)r2 d)SEEe)q2 a)BLb)NOCc)r2 d)SEEe)
      Ch0.20740140.5750.2640.14915130.5140.277
      A/Ch0.19540110.3840.3000.12640110.3410.311
      B/Ch0.0755910.2930.3220.08735310.3000.320
      Co/Ch0.18335310.4210.2910.2648330.6840.223
      Da/Ch0.02140110.2930.3220.2916150.7190.219
      H/Ch0.20740140.5750.2640.14915130.5140.277
      A/B/Ch0.17525710.4080.2950.2399730.7480.200
      A/Co/Ch0.3355960.8880.1410.24725730.7450.201
      A/Da/Ch0.1955940.6570.2370.19525740.6830.228
      B/Co/Ch0.16040110.4030.2960.1829720.5650.257
      B/Da/Ch0.1078340.6670.2340.0955940.6980.223
      Co/Da/Ch0.1285930.7240.2090.21035340.7770.191
      A/B/Co/Ch0.17935310.4410.2860.5049760.9370.106
      A/B/Da/Ch0.07440130.6460.2360.19140160.8920.139
      A/Co/Da/Ch0.2275930.6880.2220.3357140.7680.195
      A/B/Co/Da/Ch0.2646140.7310.2100.3859750.8880.138
      A/B/Co/Da/H/Ch0.1819760.8220.1780.4809760.8500.163
      a) q2为交叉验证相关系数;b) BL为最佳分子全息长度;c) NOC为最佳主成分数;d) r2为非交叉验证相关系数;e) SEE为非交叉验证标准误差

      表 3  碎片区分参数及全息长度对模型的影响

      Table 3.  The influence of various fragment distinction parameters and hologram length on HQSAR

    • 由于不同大小的分子碎片所包含的分子结构信息有所区别,所以分子碎片大小也会对HQSAR模型造成影响. 为得到最优模型,以A/B/Co/Ch为最优碎片区分参数,以不同大小的分子碎片建立HQSAR模型,表4表明了不同碎片长度对HQSAR结果的影响. 当分子碎片为1~15时可得最优模型,q2达到0.604,r2为0.904.

      碎片大小q2BLNOCr2SEE
      1~40.2767110.4230.291
      1~70.20435310.4340.288
      1~150.6047140.9040.125
      4~50.29435310.4740.278
      4~70.17935310.4410.286
      7~100.4735360.9460.098
      7~130.43640150.9270.112
      9~120.35025750.9430.098
      9~130.41440150.9300.109
      9~150.5717140.8990.129

      表 4  不同碎片大小对HQSAR分析结果的影响

      Table 4.  Influences of various fragment parameters for HQSAR

    • 在QSAR分析中,r2q2是衡量模型效果的主要标准. 通常当r2≥0.9时认为该模型具有良好的拟合能力,当q2≥0.5时则表明模型具有良好的预测能力. 本文所得最佳模型的r2为0.904,q2为0.604,表明所建模型具有良好的相关性和较强的预测能力. 此外,模型的非交叉验证标准误差(SEE)也是衡量模型的重要标准,本模型SEE为0.125,活性数据的数值范围约为1.57,比值约为7.96%,小于10%的标准,故所建模型良好[30]. 为进一步验证模型的预测能力及稳定性,采用最优模型对测试集进行了活性预测,结果见表2图3. 由计算结果可知,预测值与实验值偏差较小,其预测相关系数r2pred为0.723,表明此模型具有良好的预测能力和稳定性,可用于此类化合物抗SARS-CoV活性预测.

      图  3  训练集和测试集样本的实际值与预测值相关关系

      Figure 3.  Comparison of the experiment value and the predicted value of the training set and test set

      综上所述,当采用碎片区分参数为A/B/Co/Ch,碎片大小为1~15,最佳全息长度为71,最佳组分数为4时可得最佳HQSAR模型,此时预测相关系数r2pred为0.723,交叉验证相关系数q2为0.604,非交叉验证相关系数r2为0.904,标准误差SEE为0.125.

    • 由HQSAR模型得到的色码图,采用不同颜色表征分子中不同原子或片段对活性的贡献,从而能直观地指导分子结构的改造与优化. 部分化合物HQSAR活性色码图如图4中色谱带所示,从红色到绿色的变化,表示基团或原子对分子活性的贡献由不利到有利. 红色、橙红色表示该部位为分子活性提供负贡献;白色代表该部位对分子活性贡献中等;黄色、绿色表示该部位原子或基团对整个分子活性提供正贡献.

      图  4  HQSAR活性贡献图

      Figure 4.  HQSAR contribution maps

      在a类化合物(1~15)中,基团R作用于酶活性中心的S1′结合位点. 当R为苯甲酰基时得到化合物1(pIC50=3.903),由其色码图可以看出,其分子主链呈黄色及贡献度中等的白色. 而当R为苯乙酰基,叔丁酰基或2-甲酰基吡啶时,得到的化合物4710的pIC50分别为3.187,3.347和3.745,活性大大降低,其色码图中显示出不利于活性的橙红色,表明以苯甲酰基作为R取代基,有利于提高化合物的活性.

      对化合物1的苯甲酰基进行修饰,当R基团为2-甲基-6-硝基苯甲酰基,得到化合物15(pIC50=4.187),其活性明显提高,且分子主链存在呈正贡献的黄色及绿色结构. 而当R为2,4,6-三氯苯甲酰基或3,5-二硝基苯甲酰基时,得到化合物69,其pIC50分别为3.260和3.602,和化合物1相比,其活性均出现了不同程度的下降,且色码图中出现了呈负贡献的区域. 因此,以2-甲基-6-硝基苯甲酰基作为R取代基,有利于化合物活性的提高.

      在b类化合物(16~24)中,基团R则作用于酶活性中心的S4结合位点. 当R为单甲氧基或双甲氧基取代肉桂酰基时,得到化合物1719202122,其pIC50分别为3.620,3.810,3.812,4.000,4.009. 由色码图可以看出,在R基末端苯环3位引入甲氧基后,其色码图中呈正贡献的黄绿色部分均比引入前有所增加,活性也有所提高;当R为3,4,5-三甲氧基肉桂酰基时得到化合物24(pIC50=4.131),其活性高于其它b类分子,且色码图中呈正贡献的黄绿色区域也远多于其它b系化合物,表明3,4,5-三甲氧基肉桂酰基能同3CL蛋白酶活性中心的S4结合位点形成有利于活性的相互作用.

      与具有丝氨酸骨架的a,b两系列分子不同的是,c类分子(25~30)为苯基异丝氨酸类化合物,不仅能同3CL蛋白酶活性中心的S1′和S4结合位点发生作用,其苯基还能同S2结合位点形成相互作用. 比较c类化合物25和a类化合物1的色码图可以明显看出,当与酶活性中心S1′和S4结合位点作用的取代基相同的情况下,化合物25的色码图中对活性有利的黄色及绿色部分远远多于化合物1的正贡献部分,同时,化合物25(pIC50=4.367)的活性较化合物1(pIC50=3.903)提高了一个数量级,说明以苯基异丝氨酸为骨架进行分子结构改造与优化,能更有效地提高化合物的酶抑制活性. 此外,化合物25是c类化合物中活性最好的,其色码图中对活性有利的黄绿色部分也多于其它c类分子,表明在c类化合物中苯甲酰基依然能同酶活性中心的S1′位点形成有利于活性的相互作用.

      综上所述,以苯基异丝氨酸为骨架,苯甲酰基或取代苯甲酰基作为和3CL蛋白酶活性中心S1′位点作用的取代基,而与S4位点作用的取代基优选取代肉桂酰基,均能有效提高化合物的活性,这为该类化合物的进一步结构改造与优化指明了方向.

    • 基于以上色码图分析,我们以苯基异丝氨酸为骨架进行结构修饰,其中,和S1′结合位点作用的R1基团分别为苯甲酰基,2-甲基-6-硝基苯甲酰基及肉桂酰基,和S4结合位点作用的R2基团则为肉桂酰基及甲氧基取代肉桂酰基,并采用所建立的最佳HQSAR模型预测所设计分子的活性,分子结构及预测值见表5图5. 由可以看出,基于所建模型设计的化合物均具有较优的预测活性,且5个化合物预测活性均大于等于现有化合物测试活性. 以上结果支持了以苯基异丝氨酸为骨架进行分子结构改造,能更有效地提高化合物酶抑制活性的理论假设.

      化合物R1R2预测值
      D14.367
      D24.394
      D34.671
      D44.752
      D54.99

      表 5  基于最优HQSAR结果所设计分子的结构及活性预测值

      Table 5.  Structure and calculated values of the designed molecules

      图  5  基于HQSAR设计的化合物通用结构

      Figure 5.  General structure of compounds designed by HQSAR

    • 本文采用HQSAR方法对丝氨酸及苯基异丝氨酸类SARS-CoV 3CL蛋白酶抑制剂进行了分子全息定量构效关系研究,得到的最优HQSAR模型交叉验证相关系数q2为0.604,非交叉验证相关系数r2为0.904,标准偏差SEE为0.125. 对由9个化合物构成的测试集进行了预测,测试集的预测相关系数r2pred为0.723,表明该模型具有较高的预测能力和拟合能力. 通过HQSAR色码图直观展示的不同取代基对化合物活性呈现的有利及不利贡献,设计出一组具有较高抗3CL蛋白酶活性的苯基异丝氨酸类抑制剂,为此类化合物的进一步结构改造与优化提供指导,也为以3CL蛋白酶为潜在靶标的SARS-CoV-2冠状病毒抑制剂的设计与结构优化提供参考.

参考文献 (30)

目录

    /

    返回文章
    返回