近日,瑞士创新企业FinalSpark公司发布了全球首款生物处理器,这一突破性技术利用人脑类器官中的生物神经元进行驱动,其功耗比传统数字处理器低一百万倍,引发了业界对“生物计算机”的广泛关注。这里的“生物计算机”其实指的是利用人类神经元进行计算的新一代生物处理器,但是过去谈及“生物计算”,人们更多指的是通过超级计算机提供加速、以生物大分子作为数据和研究对象的一个研究领域,至今已经发展了几十年。今天我们要介绍的主角,就是十几年来在全球生物计算领域占据主导地位、默默书写着王者传奇的专用超级计算机安腾Anton。
超级计算机安腾Anton于2007年由美国D.E. Shaw Research机构推出,专注于生物计算领域的分子动力学模拟加速。由于超算安腾的“目标专注”,它在执行分子动力学模拟任务时甚至比通用超算Top500榜首的最强超算前沿 Frontier还要高出50倍以上。凭借其在高性能计算领域的出色表现,安腾超级计算机曾两度荣膺高性能计算领域的最高荣誉——“ACM戈登贝尔奖”。
安腾超级计算机 图片来源: David E Shaw研究所
为什么超算安腾可以做到如此惊人的计算效率?
中国科学院院士、北京航空航天大学教授钱德沛在接受《中国科学报》采访时就曾谈到,“美国D. E. Shaw研究所就用专门设计的ASIC芯片搭建了分子动力学模拟专用计算机(Anton),通过算法创新和软硬件协同,在分子动力学模拟中获得了比通用计算机高出百倍的计算能效,这是非常值得我们借鉴的。
超算安腾的前世今生:出身名门,专注分子动力学加速,为推动生物计算而生
安腾超级计算机(Anton)的发明者,大卫·E. 肖(David E. Shaw),是美国量化投资领域的领军人物,曾任奥巴马政府科技顾问,同时也是亚马逊创始人贝索斯的昔日上司。《福布斯》杂志赞誉他为“量化投资之王”,其个人资产约为41亿美元,位居全球财富榜300名。
David E Shaw博士 图片来源: 网络
在临近五十知命之际,这位金融巨擘果断转型投身于生物计算。因为当时David E. Shaw深刻认识到,相较于金融,生物计算对社会的影响更为深远,更契合个人价值追求。他从朋友那里了解到,分子动力学模拟(molecular dynamics)能显著加速从分子水平理解生命过程(biological processes),不仅推动基础科学研究,还能加速诸如癌症等重大疾病的药物研发。
然而长久以来,分子动力学模拟因计算效率低下的问题,难以在业务场景中应用。举例来说,人体内典型的大分子蛋白质往往由几十万到上百万个原子构成,假设用分子动力学模拟方法计算模拟一个有着50万原子的蛋白质的0.001秒的瞬间动态,即使动用10000颗CPU并行计算,也需要耗费超过100年的时间。
为突破这一技术难题,David E. Shaw利用他在金融市场积累的财富,首先组建了一支由全球最顶尖博士组成的精英队伍。在当年,他给每位博士开出的年薪高达10万美元,这几乎是常规科研岗位薪资的2-3倍。
David E. Shaw与团队的策略,是借助超算来解决计算效率低下的问题。
为什么选择用超算来破局?这是因为超算具有极高的计算速度和处理能力,能够在极短的时间内处理庞大的数据和复杂的计算任务,一直用来解决解决复杂的科学、工程和商业问题。
而Shaw博士和他团队的创新之举是,他们认为术业应有专攻,区别于通用超算的广泛应用场景,他们专门设计出了一款能够专门应用在生物计算场景,专注于分子动力学模拟加速的超级计算机——这便是安腾诞生的故事。
为了实现专用这一目标,在硬件上,超算安腾的芯片、主板、布线都由D. E. Shaw研究所特殊设计。通过特殊设计的专用芯片,可以尽可能减少数据的传输和运算,在芯片上分区域、分精度计算不同任务,突破制约分子模拟速度的瓶颈——原子间相互作用力的计算。与硬件相匹配的是软件,D. E. Shaw研究所也专门设计了适配安腾的动力学模拟软件Desmond。
于是,在2007年,这一群技术天才们终于研发成功,这台专用超级计算机正式问世,并命名为安腾(Anton)。
安腾之名,取自“显微镜之父”安东·范·列文虎克(Anton van Leeuwenhoek),因为他制作了高精度光学仪器,并首次利用这些仪器观察到各种各样的生物体和细胞类型,开启了对微观世界探索的新纪元。超算安腾,正是对这份探索精神的传承与超越,于计算领域中续写探索微观世界的新篇章。
超算安腾极大提升药物研发效率 技术价值被资本市场高度认可
在超算安腾问世后,它的技术价值真正被广泛知晓,就是在2016年它帮助美国AI制药公司Relay Therapeutics成功研发了一款治疗胆管癌的药物,一举打破了药物研发领域的“双十”魔咒,即研发一款新药的投入至少需要十年、十亿美金以上。
2016年,Relay在超算安腾的支持下,对药物靶点和成药小分子的结构进行分子动力学模拟和筛选设计,仅用18个月、不到1亿美金就确认了一款用于治疗胆管癌的高选择性FGFR2抑制剂药物RLY-4008的结构,并且顺利进入了美国FDA的临床II期试验,极大程度地缩短了从药物发现到临床前研究近90%的投入时间和成本。
为何超算安腾可以将药物研发效率提升如此之高?
首先,Relay重塑了药物研发的技术路径,将行业内对于蛋白质靶点的理解从过去的静态视图转变为基于蛋白质运动的动态视图,从传统的基于蛋白质静态的药物设计(Structure-based Drug Design,SBDD)转向基于蛋白质动态的药物设计(Motion Based Drug Design(TM),MBDD)。
图片来源:Relay官方
同时,Relay开创性地构建了基于运动的药物设计平台——Dynamo Platform,该平台集成了8种实验技术(例如室温晶体学等)和8种计算方法(例如分子动力学模拟等),用于落地Relay提出的MBDD药物研发路径。
在完成整个MBDD的过程中,Dynamo平台的底层都是通过超算安腾来支撑进行模拟计算。
除了确认RLY-4008结构的案例外,Relay还曾试图研究野生型和突变型蛋白质,并使用如室温X射线和冷冻电镜,然后再用超算安腾来模拟蛋白质随时间变化的影像。与其他药物研发公司相比,Relay宣称其模拟速度比他们快上100倍。 对于一个有100万个原子基准蛋白的卫星烟草花叶病毒,在传统硬件上(Nvidia V100)需要271天才能完成,而在超算安腾上只需要一天。
资本市场对Relay Therapeutics的高认可度,也间接证明了超算安腾的技术价值。
Black Diamond与Relay Therapeutics同为专注于药物小分子研发的平台,并且两者均仅有一个药物进入临床一期候选阶段,但在首次公开募股(IPO)当天,两者市场估值呈现出明显差异。Black Diamond当天市值12.24亿美元,而Relay Therapeutics当天市值是Black Diamond的两倍多,为30.45亿美元。
Relay Therapeutics之所以能赢得资本市场的如此青睐,是因为它与David E. Shaw研究所的签署了独家战略合作伙伴关系,协议约定,双方将合力进行特定靶点化合物的研发与商业化。双方科学家需要在每一个项目上合作,充分利用David E. Shaw研究所的计算建模技术,尤其是通过安腾超级计算机来研究蛋白质的动态行为,特别聚焦在药物发现阶段提出动态基础假设和识别先导化合物。
可见,超算安腾不仅是生物计算领域的一项革命性创新,更是推动药物研发进入新时代的强力引擎。安腾超级计算机不仅代表了计算技术向专业化的深度探索,预示着生物科学与计算科学交叉融合的无限可能,也证明了专注于细分领域的深度技术创新能够带来颠覆性的改变。未来,类似超算安腾这样尖端科技将在加快疾病治疗进程、推动精准医疗实践方面扮演愈发重要的角色,持续鼓舞着科研工作者与企业勇闯科研无人区,不懈追求创新突破。