某煤制油技术公司高性能计算集群建设项目
生产制造项目
项目背景
某煤制油技术公司主要从事国家专项课题的研发、煤基合成油技术的研发、产业化技术转让、催化剂生产与销售、煤制油专有设备的研制与开发等业务,为国内外客户提供煤基合成油的技术支持和服务等。 作为以数据为基础,以可视化、可连接为核心要求的高新技术企业,该公司多年来致力于煤制油关键核心技术的科技攻关,不断顺应国内数字化转型、智能化升级的发展趋势,积极投入新型信息技术的应用,在保障国家能源战略安全方面做出了巨大贡献。
用户需求
- 该用户多年来改造旧集群、建设新集群,历经十年建设了多个集群、百余台高性能服务器,服务于公司的基础研究和工程研究。
- 原有集群采用开源集群管理软件,各期集群独立运行、相对分散,需要一套成熟、完善的高性能计算统一管理平台对集群调度和资源利用进行全面优化,配置与业务相匹配的应用环境,以满足研发部门在海量图像、数据、训练模型等方面的算力提升。
项目内容
- 该用户原有多套集群平台,此项目为新建扩容,计划分段采购、部署多套高性能计算集群,其中包括GPU节点、可视化RTX GPU节点及分布式文件系统,采用多台高速计算网络交换机堆叠网络组成,实现用户高性能计算应用的业务支撑。
- 部署CHESS高性能计算管理平台,将原有集群异构品牌设备并入新集群进行统一管理,优化系统性能。通过CHESS平台统一管理集群,实时动态分配、监控资源;建立调度规则,实现智能分配系统资源;业务报表提供集群数据,分析和调整集群调度策略,完善评价体系,掌握集群使用情况。
项目亮点
- 主体集群以OPA组网方式采用分布式存储,将各个集群数据统一管理和存储
- 原有IB网络保持现有的计算网络,连通管理网络用于信息数据统计
- 采用CHESS集群管理平台整合新旧异构品牌设备,实现新老设备的统一管理和高效利用
客户收益
- CHESS搭建的集群统一管理平台,帮助用户完成利旧机器、新购机器的整合及统一部署、管理,集群利用率超过80%;
- 软件应用性能得到显著提升,理论研究工作得到业界认可,支撑量化计算发表理论计算相关文章200余篇,包括《自然》、《科学》等国际科技前沿杂志。申请专利8项、软件著作权2项,并作为基础支撑部分获得多项国家级科学技术奖项。
- 为研发和设计人员提供工业实验无法取得的高时空分辨率、多相流场信息,缩短开发设计周期,降低开发风险。