3个月超越AlphaFold 2,清华系初创公司多项指标登顶世界第一,用AI设计新冠抗体实现新突破
发表于 2021-12-18 13:06:29

目录

3个月超越AlphaFold2,HeliXonAI如何算法创新?

“十年磨一剑”成为过去式?AI设计新冠抗体HX001实现新突破

One more thing:绕不开的清华、微软……


终于,超越AlphaFold 2的中国AI来了。  

近日,一家中国AI公司宣布,其自主研发的人工智能药物开发平台HeliXonAI在蛋白质结构预测竞赛CAMEO(Continous Automated Model Evaluation)上表现突出,多项性能指标上超越AlphaFold2,登顶世界第一。

而HeliXonAI背后则是一家刚刚成立半年的中国AI初创公司——华深智药。

在短短6个月的时间里,华深智药不仅实现了对AlphaFold 2的超越,还在新冠抗体的自动化设计方面取得了重大突破。

这一切是如何实现的?接下来为你解析。

3个月超越AlphaFold2,HeliXonAI如何算法创新?

要理解HeliXonAI取得的成绩,首先我们要了解为什么蛋白质的结构预测如此重要。

实际上,蛋白质在理解生命科学与药物开发中的地位举足轻重,而预测蛋白质的结构有助于我们在原子层面了解蛋白质的功能。几十年来,人们一直在尝试着解开蛋白质结构的谜团,但这并不是一件易事。

直到2020 年,由DeepMind 团队开发的 AlphaFold2模型在第十四届国际蛋白质结构预测竞赛(CASP14)上几乎达到冷冻电子显微镜等实验技术的准确度,成为重大突破。

不过,AlphaFold2也并非完美,例如在同源信号较弱的情况下预测的误差较大,对于抗体可变区域的预测也精度欠佳。

作为华深智药自主研发的人工智能药物开发平台,HeliXonAI囊括了包含蛋白质结构预测在内的一整套生命建模算法体系,将被用于承接包含抗体设计,靶点发现等诸多挑战性任务。

据介绍,HeliXonAI的蛋白质结构预测算法在AlphaFold2的基础上提出了诸多改进:

  1. 在数据上利用数据蒸馏引入了更为庞大的无结构氨基酸序列数据库,并且在模型上设计了新颖的进化调整(Evolutionary Calibration)模块实现了对多比对序列的信息较正。
  2. 对于空间坐标的优化,HeliXonAI引入了几何平滑(Geometric Smoothing)模块,利用几何深度学习的特性,和近一千层的深度,不断地将坐标优化到正确位置上。

而这2个全新的模块能够迭代式地修复同源序列对比中的误差并相应地对所有原子几何位置做出对应的调整,这样就能更为有效地解决同源信号弱的问题并在原子级别的细节上做出更精准的预测。

这个升级后的模型在8块A100显卡上经过连续接近3个多月的训练,最终预测能力赶超AlphaFold2。

作为结构预测领域最重要的赛事之一,CAMEO的参赛者需要每周预测20个由世界范围内的结构生物学家最新破解出结构的蛋白质的结构,比赛的得分与排名也会每周实时更新。

诸如华盛顿大学蛋白质设计研究所的David Baker教授研发的RoseTTAFold,百度开发的PaFold,和腾讯研发的tFold等模型,都在其中竞逐。

在这项国际竞赛中,华深智药的结构预测平台HeliXonAI已经连续四周在主要评价指标lDDT(Local Distance Different Test)上达到83.5分,持续排名世界第一,并远超第二名。

Figure Caption: CAMEO链接:https://www.cameo3d.org/modeling/1-week/difficulty/all/?to_date=2021-12-04

如上图所示,越靠右表示预测的结构越多,越靠上表示预测的结构越准,我们可以看到HeliXonAI牢牢地占据了最右上角的位置。

可以看到,在近期CAMEO发布的17个目标蛋白质上,HeliXonAI的平均lDDT预测精确度,达到了84.0——意味着对AlphaFold2的超越。

在另一评价指标TM-score上HeliXonAI更是达到了91.6,高于AlphaFold2的85.6,并且显著高于RoseTTAFold和PaFold的76分。

不仅如此,在最新一周的标注为“困难” (hard) 的7个蛋白结构中,HeliXonAI更是在TM-score上显著超过第二名Alphafold2有6分之多,进一步证明了HeliXonAI算法改进的有效性。

“十年磨一剑”成为过去式?AI设计新冠抗体HX001实现新突破

看广告,还要看疗效,蛋白质结构预测只是AI推动生命科学的万里长征第一步。

在迈出第一步之后,华深智药推出了全球首个由AI设计的、具有临床价值的广谱新冠中和抗体——HX001。

华深智药创始人彭健表示,“HX001已经在临床前试验上取得了成功,对德尔塔等多个变异毒株具有高效和广谱的中和效果,抗病毒能力达到或超越目前已经获得紧急批准使用的新冠抗体。”

AI抗疫,并不是一句空话。

新冠病毒具有突变快,传染性强的特点。平均每年新冠病毒在每个碱基上会发生0.001个左右的突变,其中有一些突变会影响到病毒的特性,提高传播能力或影响现有疫苗或抗体药物的效果。这也意味着传统的“十年磨一剑”的药物设计模式也不再适用,而设计出来的具有临床价值的抗体也需要具有更强的广谱性和预见性。

传统的抗体开发采用“人体/生物筛选+专家设计”模式,抗体由人体或者小鼠血清中分离,主要针对现有的病毒株,对新的变异株效果无法预期。

彭健认为,以人工智能算法驱动的抗体设计将彻底改变传统方法周期长、广谱性弱的现状,不仅可以做到快速响应,还有望做到提前预测病毒的变异方向,判断当前抗体是否对新的变异株有效。

自2021年8月开始,华深智药与清华大学医学院张林琦教授团队及智能产业研究院(AIR)智慧医疗团队合作,利用自主研发的AI抗体设计平台Helixon Design,对现有新冠中和抗体开展了系统设计和优化。

Helixon Design平台不仅能对新冠病毒变异株快速响应,同时开展多个靶点设计与优化,生成有针对性的广谱中和抗体,并能随着新冠病毒的突变快速随动,生成新的抗体设计。这一平台还能够帮助研究人员同时优化抗体稳定性、溶解性、亲和力等多个参数,在成药性上对抗体候选进行评估,大大缩短研发周期并提高了研发成功率。

从今年8月到11月中旬,通过综合分析抗体与新冠病毒刺突蛋白在原子水平的相互作用,结合蛋白与蛋白相互作用的大数据提炼,合作团队在短时间内完成了从设计、合成、评估和再优化的全链条闭环程序,研制出了全新的新冠特效中和抗体。本次AI平台研发的新抗体,最大的特征就是具备广谱性。

据彭健介绍,该抗体对新冠病毒原始株和阿尔法、贝塔、伽马和德尔塔等突变株具备高效和广谱的中和效果,抗病毒能力达到或超越目前已经获得紧急批准使用的新冠抗体。

“当前开发的抗体已经在临床前试验上取得了成功,正在进行后续的成药性及开发性评估。目前正与多家医药企业正在探讨合作,将共同开展下一步临床试验和药物申报工作。”

One more thing:绕不开的清华、微软……

IT桔子的中国AI创业者人群画像显示,清华、微软等是绕不过去的标签。华深智药能够在如此短的时间里突飞猛进,快速突破,背后也有清华、微软的影子。

作为华深智药创始人,彭健教授在博士期间设计的RaptorX算法以及在UIUC任教期间设计的DeepContact算法均多次在CASP比赛中获得领先的成绩,很早就尝试将深度学习的技术引入这个领域,并于2020年获得计算生物领域最高奖奥弗顿奖(Overton Prize),成为该奖项20年来的唯一华人得主。

据悉,AlphaFold 2问世不久,彭健便收到了清华大学智能产业研究院(AIR)的邀请,并在2021年初与清华大学智能产业研究院(AIR)院长张亚勤、首席科学家马维英的沟通后,彭健决定加入。

而华深智药正是由清华大学人工智能产业研究院孵化,不仅天使轮融资背后也有着清华系的身影,HX001的诞生也离不开清华大学医学院的资源和支撑。

据悉,目前华深智药团队也在开展基于AI的新冠病毒免疫逃逸位点预测与检测的算法研究。通过集成进化,结构,与功能的大数据,人工智能算法能够有效地对于不同病毒变种的免疫逃逸能力进行评估与预测,并能快速判断出短期内或未来可能有有重大风险的病毒突变并进行检测,从而为病毒防疫,疫苗开发以及药物开发进行预警。

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】