随着AI技术在各行各业的深度应用,利用HPC+AI进行大数据分析的融合方案大势所趋。然而,传统HPC集群调度方案在设计之初,大多并未考虑后续深度学习对于GPU类加速芯片资源的调度需求,难以应对快速扩展的AI算力需求和业务需要,导致业务发展受限。
比如,很多高校和科研机构不得不将HPC和AI环境分别部署在相互独立的集群上运行,这意味着用户需要维护多套管理账号,运维压力大。同时,由于AI业务依赖大量GPU资源的支持,基于物理GPU资源的调度,对资源的充分利用和灵活调度带来了极大的挑战。因此,通过整合HPC和AI的算力资源来进行基础学科的研究也逐步成为未来智算中心的发展趋势。
在此背景下,联智科技携手软件定义AI算力技术的领导厂商趋动科技共同探索高校和科研场景,旨在基于各自技术优势,为客户提供HPC/AI融合的一体化管理平台。
趋动科技双子座(GEMINI)AI训练平台,提供强大的AI资源管理服务以及高效的AI算法开发和训练支持,能够化繁为简,帮助科研单位建好AI平台、管好AI资源、用好AI服务;底层结合趋动科技猎户座(OrionX)软件定义GPU技术,可细粒度切分GPU,远程调用GPU,跨服务聚合GPU,从而允许AI科研任务根据资源使用情况(利用率、使用周期、使用位置等)进行动态调整,能最大化地利用GPU资源,充分激活科研算力;联智科技自主研发的CHESS集群管理平台提供GPU池化资源的统一管理、监控和调度,并提供架构设计、集群部署、应用集成、性能调优、实施运维等服务,为用户搭建一套完善、高效的HPC/AI集群系统。
客户收益
> 平台式一体化管理,实现HPC和AI场景的统一管理和使用
> 提供敏捷的智能应用开发,加速科研智能化升级
> 满足科研、教学多种场景,实现一站式AI教学体系建设
> 更加灵活、多变的GPU资源调度技术,让算力资源具备弹性伸缩能力
> 基于GPU资源池化技术,满足数倍人员同时在线AI开发和训练
通过联合开发和测试,联智科技高性能计算集群管理软件CHESS 与趋动科技AI算力池化方案相互兼容、性能良好、运行平稳,测试结果满足双方公司兼容性认证的各项标准。
关于合作伙伴
北京趋动科技有限公司作为软件定义AI算力技术的领导厂商,专注于为全球用户提供国际领先的数据中心级AI算力虚拟化和资源池化软件及解决方案,已完成中关村高新、国高新、“专精特新”等企业认证。趋动科技的 OrionX AI算力资源池化软件能够帮助用户提高资源利用率和降低TCO,提高算法工程师的工作效率。趋动科技的双子座 GEMINI AI 训练平台,为客户提供强大的AI算力管理服务以及高效的算法开发和训练支持,能够化繁为简,帮助企业建好AI平台、管好 GPU、用好 AI 服务。依托全球领先的AI算力池化技术,趋动科技重磅推出趋动云VirtAI Cloud,为万千企业和AI开发者带来又便宜、又好用的AI算力池化云服务。