某中英合资高端汽车企业高性能计算集群系统维护
生产制造项目
项目背景
该公司是国内首家中英合资的高端汽车企业,在国内的生产基地是该外资品牌首个本土以外的整车制造工厂,也是全球样板工厂。致力于成为中国高端汽车市场的卓越创领者,拥有世界先进水平的整车制造基地、完善的自主整车开发能力、专业创新的营销服务体系,将发挥高效的运营管理体系优势,不断践行向中国市场提供全球一流品质的产品和服务的承诺。
客户需求
- 用户于2019年搭建了用于CAE仿真的高性能计算系统,服务于PD VE和NEV团队,用于汽车的仿真研发需求。为了保证系统平稳运行、为高性能计算终端用户提供高质量的支持,需要对高性能计算系统进行专业的年度维护外包服务。
项目内容
- 通过功能分析为用户提供集群整体维护解决方案,包括系统监控、技术支持、预防性维护、灾难恢复过程、BCP(业务连续性计划);
- 维护、升级用户原有的集群管理系统、HPC作业调度系统、并行集群文件系统,定制应用程序和作业调度系统接口,不断优化集群作业调度策略,评估测试高性能计算集群系统,集成多种CAE应用程序/脚本;
- 协调用户IT部门进行知识转移,确保高性能计算操作知识库的成功建立,并与IT团队紧密合作,了解业务变化,了解收集和分析用户新需求,形成持续改进的知识文档。
项目亮点
- 在用户已建集群的基础上提供集群维护、性能优化服务,保证集群的系统性能及稳定性
- 满足集群系统和政策的要求,包括SLA/OLA和系统可用性,保障所有数据高度的安全性和保密性。
客户收益
- CHESS服务团队具有丰富的HPC集群设计、搭建、运维的知识和经验,能够理解和处理用户业务场景及工作流程,确保及时处理用户需求、维护仿真数据,提高集群性能;
- 技术人员了解HPC平台架构和开发语言,第三方合作伙伴沟通顺畅,具备良好的运营数据分析能力,具备持续改进运营流程的能力,帮助用户简化运维管理,优化集群运营模式;
- 对于严重故障或一般故障,可以第一时间提出系统优化解决方案,提高各团队之间的合作效率,保证研发进度。