北京某大学健康医疗研究院高性能计算集群建设
生命科学项目
项目背景
该健康医疗大数据国家研究院在国家卫生健康委员会指导下,由北京某大学发起申请,为该大学医学部直属单位。从2014年开始就积极以跨领域项目合作的方式大力开展智能技术、互联网技术、微纳科学技术与医学的交叉研究,建设全面尖端的健康医疗智能认知技术平台。
客户需求
- 用户计划建设一套软硬件一体的高性能计算集群,用于DNA分析及医学影像图形图片处理;
- 集群包含CPU节点及GPU节点,用于进行影像图像处理及组织学生物信息领域相关的高性能计算业务;
- 在计算过程中用户处理图片数据规模较大,对存储I/O带宽有较高需求,需要一套高效的集群存储系统满足用户需求;
- 并需要一套成熟、完善的高性能计算统一管理平台对集群调度和资源利用进行全面优化,配置与业务相匹配的应用环境,以满足研发部门在海量图像、数据、训练模型等方面的算力提升。
项目内容
- 平台硬件采用CPU、GPU计算节点,网络采用10Gb以太网LACP模式绑定支持,存储采用CentOS 7.8作为基础Linux操作系统,采用Lustre文件系统作为共享存储系统;
- 软件采用CHESS集群管理平台,提供一个高可靠、高性能的集群管理平台,帮助用户快速完成集群部署、集群监控、集群管理、提交作业、作业智能调度以及作业计费等任务。
项目亮点
- 该集群是具有CPU/GPU异构服务器的高性能计算平台,满足研发部门在海量图像、数据、训练模型等方面的算力提升;
- 平台适配生物信息领域多种应用软件,并高效满足用户存储需求。
客户收益
- CHESS提供一整套高可靠、高性能的集群管理系统,实现对不同架构服务器进行异构平台的统一管理;
- 智能调度系统可以在资源不足的情况下,自动将作业分配到其他可以运行作业的集群系统当中;
- 简化运维管理,灵活分配资源,自动化、智能化进行集群资源的调度、管理,提升应用性能,降低运营成本,提高研发效率。