应急管理部西南某消防研究所高性能计算集群建设
政府机构项目
项目背景
是应急管理部直属的公益性消防研究所,是国内最早成立的综合性建筑防火研究所。主要从事建筑火灾理论、建筑结构防火、火灾风险评估、建筑火灾烧损鉴定、建筑防排烟、自动喷水灭火、阻燃技术及建筑防火保护、火灾烟气毒性评价、人员疏散、火灾痕迹物证分析技术、自然灾害应急救援、消防员职业安全与健康等的研究,同时承担新型防火建筑构(配)件和防火阻燃材料的研发以及防火材料的检测,设有国家防火建筑材料质量检验检测中心、应急管理部四川消防研究所司法鉴定中心等30余个专业实验室和鉴定检测机构。
客户需求
- 该消防所建筑防火研究室主要从事火灾动力学模拟,使用FDS(Fire Dynamics Simulator火灾动力模拟工具)软件,原先用户在Windows平台上计算火灾中的烟气流动和热传递过程,并且采用串行计算效率较低,通常模拟一次火灾中气体的产生和移动需要几个工作日完成。现如今客户需要将原有串行计算改为并行计算,并且由Windows计算切换为Linux高性能计算集群进行计算,同时众多使用人员对Linux知识以及集群提交作业的方法并不是很了解,用户需要搭建一套易用、简便、同时方便管理的集群系统进行火灾模拟计算。
项目内容
- 使用CHESS为用户搭建Linux集群系统,对现有计算节点进行统一部署,实现了集群管理、作业调度管理、作业提交、集群监控以及数据统计等功能,极大地方便了系统管理员对集群的管理,防止用户提交作业时出现内存溢出等;
- 还为用户集群存储系统提供了数据分级存储以及Lustre文件系统解决方案,用户在高速硬盘上计算后将数据存储到普通存储系统,提高集群的I/O效率。
项目亮点
- 该项目是从串行的Windows计算切换到并行的Linux计算集群的典型应用;
- 在不改变用户原有硬件设备的基础上快速部署新的集群管理平台,最大限度控制成本的同时保证了集群性能。
客户收益
- 为用户提供了一整套高效、简易的HPC集群系统,简易的Web界面配置方便用户管理计算资源,页面提交作业简化了系统管理员作业调度配置;
- 使得客户顺利地从串行的Windows计算切换到并行的Linux计算集群,提高了整个集群的计算效率,加快研究进程。