国家某中心高性能计算集群建设项目
政府机构项目
项目背景
该中心是中国气象局直属事业单位,主要负责风云气象卫星发展规划及工程建设、业务运行、卫星资料处理关键技术研发、定量产品生产、卫星资料应用服务、以及空间天气监测预警等方面工作。
客户需求
- 用户拟建一套用于运行气象模式的高性能计算集群,同时用户完成一个任务后需要根据前一个任务完成的结果执行下一个任务,由于任务的关联性,通常需要手工提交作业,用户需要一套工作流系统可以编辑作业之间的关系,作业可自动执行。
项目内容
- 该项目硬件采用CPU/GPU异构集群,选用CHESS平台解决用户常规管理、集群监控,为用户配备完备的并行计算开发和运行环境,针对不同模式可采用不同的应用模板进行提交作业;
- 为用户免费提供常用数值模式的安装、调试和培训服务,并配合用户完成数值预报业务系统的安装调试。
项目亮点
- 针对气象过程模拟涉及海量小文件的处理,为用户提供内存文件系统高带宽、高IOPS的解决方案为用户解决I/O瓶颈;
- 为用户提供了高效、实用的作业提交方式,用户可以采用多种方式进行作业提交;
客户收益
- 为国家卫星中心提供完备的并行计算开发和运行环境,配置CHESS集群管理软件、作业调度系统,以及针对气象作业需求开发的工作流管理系统,提高了高性能计算集群使用的效率,助力国家卫星中心用户准确的完成数据预报业务。