武汉某代谢生物科技公司高性能计算集群项目
生命科学项目
项目背景
该公司是国内领先的代谢组学公司,专注于提供领先的代谢组学技术服务及创新临床检测产品应用,致力于代谢基础研究、分子设计育种、疾病诊断、药物研发及与代谢组学相关领域应用研究,为生命科学研究、改善人类健康做出持续贡献。
客户需求
- 该公司计划建立高性能计算研发平台,对代谢组、蛋白组、基因测序、多组学等生物数据进行分析、并行计算和流程开发,目前现有数据平台的存储和计算资源不足以支撑日益增长的研发需求,需要对旧有集群进行存储和网络的优化,同时需要采购新设备对集群进行扩充、升级。
项目内容
- 在用户现有数据平台的基础上升级计算、存储资源,优化原有集群采用的国产化分布式文件系统,通过NFS共享给集群的每个节点。同时安装、调试后扩容的AMD高可用服务器,并优化网络、更换网线,保障新旧两套集群的高效平稳运行。
- 集群使用Slurm作为提交作业的调度器,采用CHESS支撑整个集群资源的调度、管理、监控、计费,并协助用户安装、优化BCFtools、BEDtools、VCFtools、vcflib、PLINK、Sambamba、SAMtools、Picard、Tabix、Seqtk、EIGENSOFT、bgenix、FastQC、Impute、BWA、GATK4、CNVKit等生命科学领域应用。
项目亮点
- 该集群存储架构采用国产化分布式文件系统,在现有存储方案的基础上对整个集群进行优化、调试,将集群性能发挥到极致;
- 用一套集群、一个平台对两个品牌的CPU计算资源进行统一纳管、监控。
客户收益
- 优化用户现有平台的计算资源、存储资源、网络互联,解决原集群采用的国产化分布式文件系统的短板,使集群整体性能提升50%以上;
- 集成多种生物信息应用软件,高效率、低成本地存储、分析代谢组数据,精准辅助各医药企业、医院的文献发表、药物研发、疾病诊断与治疗反馈