陕西某“985”、“211”大学“共享共建”高性能计算校级平台建设项目
基础科研项目
项目背景
高性能计算平台目前已成为高校学科发展、人才培养、应用创新的重要平台,是引进高水平人才、支撑国家重大课题申报的基本需求。目前,一流大学高校建设中已有78.57%的高校建有高性能计算平台。 2017年2月,中国西部科技创新港建设全面开工,高性能计算中心是创新港八大公共服务平台之一。 2019年7月,创新港高性能计算机房启用,陕西某“985”、“211”大学“高性能计算校级平台搬迁至创新港,成为创新港最早运行的科研公共服务平台。
客户需求
- 2015年12月,该校网络中心与材料学院共建校级公共服务平台。2016年-2019年,网络中心继续整合材料、电气、能动等学科科研团队完善校级平台,但当时在用的校级平台依然规模小,无法满足各科系研发需求,且各期集群独立运行,无法完全开放共享,急需搭建一套可拓展的高性能计算统一管理平台,形成统一的服务环境。
- 十四五建设期间,创新港高性能计算中心计划建设总规模3000万亿次,总CPU核心数超2.5万颗,存储容量5PB,辐射周边区域及超算中心。
项目内容
- 该项目的高性能计算集群由CPU计算节点、大内存计算节点、GPU节点、胖节点、管理/登录服务器组成,Mellanox HDR交换机堆叠网络,采用商业版BeeGFS作为并行文件存储系统。
- 由CHESS提供全套集群管理平台的搭建及众多学科的应用软件调优,定制化深度开发贴近用户需求的集群管理系统,提供校级平台部署、管理、监控、调度和计费等功能,用一套平台保证校内用户统一身份认证、校外用户统一授权登录,并统一高速网络、统一并行存储,集成多种应用软件可视化模板。
项目亮点
- 成功推行全校多学科共建、共享计算资源的服务模式,化解高校科研算力平台重复建设、各自为政、无法互通互联的难题;
- 全面满足HPC教育科研用户的AI计算需求,解决全新多元科研算力巨量化、分散化的短板;
- 打造公共算力基础设施,助力智能超算资源共建共享,打破“算力孤岛”;
- 该项目采用国产液冷服务器及国产集群管理软件联合打造的超算平台,是国产软硬件生态体系构建的典型应用。
客户收益
- CHESS搭建的集群统一管理平台,帮助该校完成各学院利旧机器、新购机器的整合及统一部署、管理,建设“万核大平台”,为建成西部最大超算中心夯实基础;
- 打破以往共建“硬件屏障”,搭建可拓展的高性能计算统一基础平台,利用“机时制”实现全资源的开放共享,实现储值、保值、增值,目前使用率已近80%;
- 多个学科的软件应用性能得到显著提升,支撑产出国际科技前沿的高水平论文300余篇,其中《自然》、《科学》4篇,影响因子10以上论文20余篇;
- 开创科研成果发布及项目转化新模式,可全面满足核反应堆压力容器、堆芯全尺寸热工水力数值模拟等国家重大工程应用需求;
- 助力国家重点研发计划高性能专项、法国电力集团(EDF)国际合作、国家自然科学基金等项目推进;
- 2021年3月,首期设备完成部署测试,集群开始正式运行,该校目前在陕西省高校校级超算中心排名位列第一,总体计算能力超1000万亿次/秒。