当药物研发遇上阿里云超算，GHDDI如何实现高通量分子筛选？

2020-06-04 10:44

于是，科学家尝试通过机器模拟分子化合物与靶点的相互作用等计算方式筛选出可能有效的化合物做小通量实验。其中一种传统虚拟筛选方式是通过小分子和靶点对接，对不同配体的结合效果打分或者通过分子动力学进一步计算，筛选出得分高且结合模式合理的配体作为候选药物进行实验验证，加速药物研究进程。

由于分子库巨大，哪怕用计算机实现虚拟筛选，需要在有限时间完成，也极大挑战了计算机性能。假设某化合物库有10，000个候选配体，以每个化合物在单核CPU平均处理时间1．5个小时计算，总共需要15，000 个小时（625天）才能完成此化合物库的分子筛选。而高性能计算集群的应用，为现代药物研发提供了必不可少的支撑。如果在高性能集群上，用625个CPU并行计算，一天则可完成上述任务。如果用高性能GPU训练好的人工智能模型进行预测筛选，在单个GPU上四分钟则可以完成上述任务。

云超算的药物研发场景验证

高性能计算又称超算，是一种用超级计算机或大规模的计算集群来解决需要大量计算能力（如并行计算、AI模型运算）需求的方法，在石油勘探、气象预报、药物研发中广泛应用。一般而言，为在规定时间内完成药物研发的分子筛选，研究者需要拥有强大计算能力的计算平台、大容量存储和大量配套的高性能应用软件，如Amber， NAMD等。

在高性能计算出现后的许多年中，由于虚拟化造成的性能损耗，云计算并不被从事高性能计算开发的专家看好。在单个节点实验中，物理机性能一定比虚拟机高，使用配置最好最快的物理机器几乎成为高性能计算领域的“潜规则“。

2017年，阿里云在云栖大会上发布神龙服务器。这款由阿里云自主开发的云服务器，主要通过自研芯片和MOC卡来实现虚拟化功能，并将存储网络的管控放上来，使得CPU本身不再浪费，100％地为计算者提供服务。

尽管理论上还是会耗掉资源，但神龙服务器的优势显而易见。容器在神龙服务器上运行的性能，比传统物理机上高20－30％。因为在传统物理机上高密度部署容器时，由于存储网络虚拟化的资源核心和业务所占的CPU的资源，之间会互相争抢，随着整体负载率提升，它的业务的延时会迅速恶化，最后导致业务不可用。而在神龙上面，因为？每一个容器之间的数据链路都是用芯片的硬件队列进行隔离的，不会互相影响，即便负载接近90％，延时的变化依然不大。

消除了虚拟化损耗的神龙让云超算得以实现，阿里云超级算计集群以神龙服务器作为算力底座，通过RoCE高速网络连接，加上并行存储文件系统CPFS，对外提供了完整高性能计算所需要的硬件基础设施。软件调度层面则提供了E－HPC（Elastic High Performance Computing）能够让用户自助在云上搭建自己的高性能集群系统，配置高性能服务器和大容量存储，提供软件多节点运行和高通量任务处理解决方案，直接满足药物研发人员对计算平台的需求。

新冠疫情期间，GHDDI在阿里云之上搭建了开放共享平台，使用E－HPC搭建高性能计算集群，用于药物研发的分子对接、分子动力学模拟、深度学习模型训练，同时为合作伙伴创建不同的云超算子账户，实现计算资源共享和数据共享。

阿里云资深专家何万青博士告诉动脉网，GHDDI的共享平台帮助科学家更便捷地将即时的想法转化为具有指导意义的创新探索，极大地提高了新冠肺炎相关药物、疫苗的开发效率。未来，阿里云超算将基于弹性的高性能计算能力，为更多的药物研发工作提供必要的算力支撑。

<上一页 1 2