人工智能如何寻找新冠特效药,看这家企业硬核突破
经过长达一个月的鏖战,新冠疫情逐渐得到了控制。2月18日,新增治愈首次超过新增确诊。此后现存确诊人数开始逐日下降,到2月27日下午,现存确诊人数已经降低到了43284人,较上一日再降2413人。
老药新用是本次抗疫的主力军。很多抗病毒药物都被证明对新冠肺炎有一定的治疗效果。但是毕竟这些药物不是针对新冠肺炎研发,很难凭借一己之力扭转局势。而进行针对新冠病毒的新药研发,似乎又过于漫长。
老药效果有限,新药进度缓慢。在这两难的局面下,人工智能与新药研发的结合,似乎找到了通往答案的又一种选项。
老药新用治疗新冠肺炎,虽然有效却达不到特效药级别
部分机构做出可能对治疗新冠肺炎有效的药物预测(中成药相关未列入)
2020年1月25日,由蒋华良院士、饶子和院士领衔,中科院上海药物研究所和上海科技大学联合研究团队发现一批可能对新型肺炎有治疗作用的老药和中药。联合团队快速表达了2019-nCoV水解酶(Mpro)并获得了高分辨率晶体结构,随后继续利用虚拟筛选和酶学测试相结合的策略,重点针对已上市药物以及自建的“高成药性化合物数据库”和“药用植物来源化合物成分数据库”进行了药物筛选,发现了30多种可能对新冠病毒肺炎治疗有效的药物、活性天然产物和中药。
这项工作成果是首批被筛选出可能对新冠病毒肺炎有效的药物。30多种药物中,包括了12种抗HIV药物、2种抗RSV药物、1种抗人巨噬病毒药物、1种抗精神分裂症药物,1种免疫抑制剂以及其他一些药物和活性天然产物。
在首批药物披露之后,陆续有国内外的研究团队披露了自己的分析结果。药物类型也主要集中在抗病毒药物方面。在研究中发现的几种药物,比如李兰娟院士团队提出的阿比多尔、武汉病毒所提出的磷酸氯喹等,都在经过临床实践之后,进入了最新公布的《新型冠状病毒诊疗方案(试行第六版)》。
《新型冠状病毒肺炎诊疗方案(试行第六版)》中推荐的抗病毒药物
老药在临床实践中体现了自己的价值,但同时也不断有声音提醒,这些药物虽然对新冠肺炎的治疗有一定的帮助,但仍不是专门针对新冠病毒的药物。在2月18日举行的发布会上,钟南山院士专门就磷酸氯喹的临床使用发表了自己的看法。他表示虽然在临床上有疗效,但还是达不到特效药的级别。
目前为止披露的研究机构大多使用的都是传统的方法,通过体外实验或者人工分析去寻找针对新冠病毒的特效药。在如今的新药研发领域,虽然很多传统的方法仍然是研究中的金标准,但是同时也有很多新技术开始加速新药研发,尤其是人工智能技术的介入,让新药研发过程中处理数据的能力发生了质的飞跃。那么在本次新冠肺炎特效药的搜寻中,人工智能技术又能起到怎样的作用?
实际上在老药的搜寻方面,就已经有企业用到了人工智能技术。位于英国的AI+新药研发企业BenevolentAI就使用自己的人工智能技术找到了巴瑞替尼可能对新冠病毒有抑制作用。
本土的药物研发企业也在积极寻找有效的治疗方法,比如中国AI制药领域的头部企业、最近正在募集新一轮融资的晶泰科技,就以不一样的思路切入研究并分享了成果,为抗击疫情做出了自己的贡献。
晶泰科技:从病毒的致病机制与分子结构出发的老药新筛,并加速安全高效、抗耐药的创新药研发
对晶泰科技来说,AI模型+物理思维的深度结合才能同时满足药物研发速度与精确度的要求,而面对疫情最直接有效的药物筛选策略,是以云端超算支持物理化学算法搭建病毒模型,再从结构出发,通过AI加速寻找到有抗病毒活性的FDA已批准的上市药物。
晶泰科技的优势是具备领先的量子物理药物模拟算法、人工智能药物发现平台,并有横跨多个云平台的超算资源作为有力支撑,能够在短时间内完成大量高精度的药物模拟计算。在新冠病毒数据尚不充足的情况下,晶泰科技可以从仅有的少量信息出发,从分子机理层面研究病毒的关键结构与感染机理,从而寻找阻断感染、治疗肺炎的有效途径。
1月20日,NCBI首次公布了新型冠状病毒的基因序列,这为构造病毒的蛋白结构模型提供了基础。而从结构出发的药物筛选与设计是以计算为基础的筛选方法中准确性、成功率更高的方法。当天,晶泰科技成立新冠研究小组,基于基因序列,以非典型性肺炎病毒的同源蛋白晶体结构为基础,对新冠病毒SARS-CoV-2上的关键蛋白搭建三维结构模型,包括影响病毒复制过程的3CLpro和PLpro,以及与感染患者密切相关的Spike蛋白受体结合区。
2月2日,晶泰科技将这些高精度模型与大量的计算数据、研究结果发布在自媒体与公司网站上,数日内被下载上千次。这些模型对研究病毒分子机理、设计与筛选提供了基础。随着研究的推进,晶泰科技仍在不时更新可供同行下载的分享内容。
基于这些模型,晶泰科技通过分子动力学模拟,发现病毒Spike蛋白与人体内ACE2受体蛋白可以稳定结合,且有较强的亲和力。晶泰科技的首席科学家张佩宇博士告诉我们,这一点从计算层面验证了新型冠状病毒具有较强的传播力与人际传播的可能性。基于该计算方法,判定未来同类病毒的人际传播风险的分子层面量化模型评估或可在一天内完成,可以帮助疫情一线研究者快速、多维预测疾病威胁。
在药物研发的策略选择上,晶泰科技在老药新用筛选与新药从头设计两个方向同时推进着。老药新用与传统的新药研发相比,推进快,耗时短,药物的稳定性和安全性已经通过多重实验验证。尤其是在针对突发传染性疾病疫情的时候,该策略的优点更加突出。在老药新用的靶点选择的过程中,晶泰科技决定聚焦病毒上的3CLpro、PLpro和Rdrp这三个参与病毒复制与转录的重要蛋白靶点。
张佩宇介绍说,这三个靶点也是抑制非典(SARS)病毒与中东呼吸综合征(MERS)病毒的良好靶点,并且由于他们存在于病毒而不是人体上,相对不容易造成严重的副作用。晶泰科技通过其自主开发的人工智能药物虚拟筛选平台ID4(Intelligent Digital Drug Discovery and Development),对已获FDA批准的2900多个药物分子和超过10000个中药成分分子进行了筛选,共得到了183个对这两个靶点有潜在抑制作用的候选分子。2月5日,晶泰科技又通过高精度的活性预测和结构评估,将搜索范围缩小到FDA上市药中排名最高的38个分子。
“这一候选列表中的药物还需要进一步的体外细胞实验与动物模型去验证活性。出于科学严谨性,我们仅对同行公布了我们的筛选结果。”张佩宇介绍,目前,晶泰科技已经购买实验蛋白,正对老药新筛的候选分子进行生物化学实验验证。
然而老药新用的办法有它自身难以克服的局限性。这些药物并非针对冠状病毒而设计开发,疗效往往差强人意,另外也可能在治疗新适应症时由于活性问题导致剂量增加,而给患者带来难以接受的副作用。例如最近报道的洛匹那韦/利托那韦(克力芝)和阿比尔多的临床疗效均不理想。而新药研发时间周期更长,研究窗口却很短。张佩宇坦言,SARS 与MERS至今没有开发出有效的药物和疫苗,其中一大原因是,在药物研究进入临床之前,疫情已经消退,无法找到足够的患者入组完成临床试验。晶泰科技希望通过其人工智能研发平台,通过与其他药企合作加速新药的开发,开发安全高效并具有潜在广谱抗冠状病毒性质的抗新冠药物,在人类与冠状病毒的长期战役中发挥效力。
在新药从头设计上,晶泰科技选择了冠状病毒上的Spike蛋白及其他关键蛋白作为自己的突破点,它们被公认是开发抗病毒药物有吸引力的靶点。
冠状病毒的Spike蛋白简称S蛋白,其与人体ACE2受体蛋白的结合是新冠病毒感染人体细胞的关键。在SARS病毒和MERS病毒中,S蛋白也行使着类似的作用。目前在研的疫苗产品中有很多都以S蛋白为基础。另外在多肽和小分子药物研发方面,如果能阻断S蛋白与ACE2蛋白之间的结合,也能阻止新冠病毒感染人体细胞,从而达到治疗效果。
值得一提的是,2月21日,中国科学院微生物研究所共享了新冠病毒S蛋白受体结合区域和ACE2形成复合物的2.5埃分辨率晶体结构。晶泰科技将自己分子动力学模拟优化后的同源模型结构与该晶体结构进行了对比,发现重合度很高,并且准确预测了关键残基部位的构象和氢键结合模式。而晶泰科技的相关结果早在2月2日就已经发布,比实验方法快了接近3个星期,对小分子、疫苗和抗体开发等具有类似的指导意义。
在计算模拟了S蛋白和ACE2蛋白之间的相互作用之后,晶泰科技接下来进一步研究了S蛋白和ACE2的表位,也就是这两个蛋白直接接触的位点,来揭示关键的多肽片段和氨基酸残基。同时还用自由能微扰方法预测评估了表位上的氨基酸如果发生突变,会对病毒的传染性、致病性有怎样的影响。这一论文的预印本刚刚已在ChemRxiv网站上发表。
自由能微扰计算(FEP)是评估药物小分子和靶点结合强度的一种高精度算法,是学界公认计算亲和力最严谨的方法之一,需要的计算量也很大。晶泰科技在这一方法的基础上开发独有的XFEP计算,通过结合AI算法的加速和优化,效率和针对性都有进一步提升。“我们当时为这个项目抽调了很多资源,甚至还暂停了一个其他方向的研发项目来推进这个事情。后续我们还可以做更多的计算,甚至把表位里的每个氨基酸都突变一遍。如果未来再遇到类似的疫情,我们预期可以在一天之内完成对所有关键突变的扫描。这样就可以提早了解病毒可能发生的变异对其传染性和致病性的影响,”张佩宇说。
通过全面的蛋白突变分析,晶泰希望能提早预知病毒可能的突变情况,并在此基础上筛选出活性、毒性和关键物理化学性质最理想的候选,开发安全高效、能够应对病毒耐药性变异和具有潜在广谱抗病毒性质的药物。要让药物兼顾如此之多的方面,可能只有人工智能技术才能但此重任。
“人工智能最大的优势,是可以显著扩大新药的搜索范围,以几百万个有潜在活性的分子骨架作为筛选起点”,张佩宇表示,以AI+计算化学结合,综合考虑多种关键性质给候选分子打分,可以一步步接近最理想、最有希望研发成功的化合物。“我们在合作的新药发现项目中以这一方法筛选出的活性分子,都在细胞模型中得到了很好的验证,并且显著缩短了研发时间。我们希望这一技术能在将来的抗病毒药物研发中有所应用。”
表位分析的部分主要通过计算物理、计算化学的方式来拿到这些结构,而针对表位推荐抗体或多肽,就要用到更多人工智能的方法了。比如在疫苗研发方面,什么样的抗原能与MHC(主要组织相容性复合体,其蛋白产物就是HLA抗原)分子之间有更好的相互作用,就可以使用AI的方式去预测。
在抗体药物研发方面,AI可以根据抗体文库中获取的信息进行建模,然后进一步进行亲和力的计算,帮助提高抗体的活性。传统方法提高抗体的活性会选择使用随机突变的方法,成功率比较低。AI建模可以帮助发现最有利的突变位点,再通过定点突变直接将药物的活性提高。
在本次疫情的相关研究中,晶泰科技已经与多家研究机构、药企建立合作,开始进行下一步的工作,同时也在加速多个药企的新冠相关的研发项目。晶泰科技已经订购了自己分析出的小分子的样品和实验用蛋白,正着手与具备P3评级的合作单位开展进一步的细胞实验和动物实验。
2月17日下午,国务院应对新型冠状病毒感染肺炎疫情联防联控机制的新闻发布会上,明确了磷酸氯喹在治疗新冠肺炎临床试验中展现出的治疗效果。随后在2月19日发布的《新型冠状病毒肺炎诊疗方案(试行第六版)》中,磷酸氯喹就已经作为抗病毒治疗的可选方案之一被纳入。
而在这些消息出现之前,晶泰科技已经与众生药业开展了合作,成立氯喹研究攻关小组,通过自己的药物模拟技术基础对氯喹治疗新冠肺炎的分子机理进行了研究。2月18日,在国家相关机构刚刚宣布氯喹疗效之后,晶泰科技就发布了自己的研究结果。
晶泰科技利用分子层面的模拟和计算对氯喹可能的作用机制进行了分子动力学模拟,尝试解析氯喹治疗新冠肺炎的的基本机理和有效结合模式,再结合目前的文献报道,列出了氯喹治疗新冠肺炎的四种可能机理。其中,晶泰科技提出“氯喹通过PLpro抑制新冠病毒的转录和翻译过程”的新的可能机理,并对已有的“氯喹通过干扰ACE2的末端糖基化来削弱病毒与受体的结合”的假说使用计算和模拟的手段加以验证。晶泰科技目前已经与众生药业开展合作,加速推进实验验证。
张佩宇说,“AI模型结合量子物理、计算化学的药物模拟技术在这次疫情响应的初期发挥了关键的作用,帮助我们提高了预测的速度、精确度和筛选的广度,为研发决策提供支持,让我们可以在接下来的研究中把有限的实验资源用在刀刃上。”此前,晶泰科技的晶型预测、药物固相设计与筛选技术已经为包括辉瑞在内的几十家药企提供服务,并在AI驱动药物发现与设计领域的合作中取得里程碑进展。这次紧急的研发任务也让这支团队积累了更多抗压经验,在较短的时间内完成了大量多维度的研究工作。
在研究中前行,为未来的疫情预先做好准备。
无论是疫苗还是新药,完成临床前相关研究才只是迈出了第一步,后续需要经过漫长的临床试验证明安全性和有效性之后,才能最终获批上市。对于像本次新冠病毒肺炎这样发展迅速的疫情,一直有人质疑现在开始从分子研发新药是否只是资源的浪费。
首先,对于AI+新药企业来说,研究本来就是自己发展中的一部分。本次疫情中处理的数据将会被这些企业沉淀下来,成为自己结构化数据中的一部分,在未来发展的某个阶段可能还会再有用处。同时这种事件紧任务重的突发事件,也正是他们训练自己团队和算法的好机会。
除此之外,晶泰科技也坦露了自己对未来的担忧。
张佩宇认为,这次疫情是对中国药物研发行业快速响应能力的最直接的考验,也暴露了行业在传染性疾病研究方面积累的薄弱。“冠状病毒家族已经产生了七种可传人的变种,下一次爆发可能只是时间问题。相信在这次疫情之后,中国制药行业的关注点会从少数几个重磅靶点扩展到更广泛的疾病研究范围。以长远为计,开发更具针对性的广谱抗病毒药物,才能从根本上制约类似疫情未来可能带来的危害。同时,我们也看到,疾病的迅速传播与疾病的研究也越来越不只局限在国境线之内。应对这类突发的公关卫生事件需要全球科学家的共同努力与合作。”
在我们与其他研发型企业对话时,也获得了相同的答案。目前的努力可能在本次疫情上发挥不出自己的作用。但是在更远的未来,如果疫情卷土重来,或是又有更棘手的冠状病毒出现,这些研究将成为基石,帮助我们在未来可能发生的疫情中,占据更大的优势。
作者:郝翰
最新活动更多
-
12月12日火热报名中>>> STM32全球线上峰会
-
即日-12.18立即报名>>> 【在线会议】Automation1微纳精密运动控制系统
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26立即报名>>> 【在线会议】村田用于AR/VR设计开发解决方案
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
1月8日火热报名中>> Allegro助力汽车电气化和底盘解决方案优化在线研讨会
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论