中科院天津某生物技术研究所高性能数据与计算平台项目
生命科学项目
项目背景
该所是由中科院和天津市人民政府共建、从事生物技术创新推动工业领域生态发展的科研机构,围绕“以可再生碳资源替代化石资源、以清洁生物加工方式替代传统化学加工方式、以现代生物技术提升产业水平”的三大战略主题,重点开展“工业蛋白质科学与生物催化工程、合成生物学与微生物制造工程、生物系统与生物工艺工程”三个领域方向的基础研究和应用基础研究,发展新生物学指导下的工业蛋白质科学、工业系统生物学、工业合成生物学、工业发酵科学等学科体系。
客户需求
- 用户计划建立一套高性能计算、人工智能计算融合的算力平台,有效存储、管理、分析日常科学研究产生的大量数据,同时对外提供数据存储与备份、基础算力服务、超算租赁服务等业务。平台需支持生物信息、分子动力学、材料分析等应用软件,并支持TensorFlow、 PyTorch、MindSpore等各类主流的深度学习框架。
项目内容
- 平台硬件配置双路CPU节点、GPU 智能加速节点、全闪及混闪节点,集群管理软件采用CHESS平台集成统一门户、任务调度管理、运维监控、计费运营、安全管理与智能计算等多种功能;
- 根据用户需求对平台进行策略脚本适配、功能点优化、平台操作体验提升等二次开发,使管理更高效、使用更便捷;
- 对机房动环设备进行监控与告警联动,实现功率计费与机房异常下的设备联动应急处理。
项目亮点
- 用一套集群、一个平台实现CPU和GPU异构计算资源的统一调度、纳管和监控;
- 对平台进行二次定制开发,保障集群高效管理、运维便捷。
客户收益
- 保障集群的异构计算能力、存储能力、高速网络互联能力,集成生物信息、分子动力学、材料分析等应用软件,为研究所科研工作提供技术条件保障和支撑;
- 平台稳定运行,上线193个用户、50多个科研小组,完成了近9万条CPU/GPU计算作业,大大提升科研效率。