转载:https://news.zol.com.cn/888/8882832.html
2024-07-30 18:20:24·[??中关村在线 原创??]·作者:新闻快讯
报名了解飞腾全国产智算中心解决方案详情:
https://www.phytium.com.cn/marketingmanagement/questionnaire/Nw.ZqGpQA.lizFjC49n9SUvQedY7qNLqCNQkw/
背景描述
当前,以人工智能技术为代表的新质生产力,引导各行业智算需求爆炸式增长。智算中心作为最重要的算力基础设施,是大模型、图像类、自然语言类、预测类等智能应用的“动力引擎”,为各类智能化业务场景提供安全、稳定、高效的算力支撑,满足国家和行业需求,同时可有效带动相关产业增长,助力行业数智化转型和数字中国建设。
技术架构
飞腾积极响应国家和行业对智算中心的迫切需求,联合生态伙伴打造全栈国产化智算中心解决方案,整体系统架构包括智算芯片、智算设备、智算操作系统、智算平台、国产大模型、智能应用等6个部分,如下图所示。
该方案以飞腾新一代高性能CPU飞腾腾云S5000C为算力底座,兼容多款国产AI加速卡,实现通用算力与智能算力的异构融合,以此为基础研发国产AI服务器,设计适合大规模集群部署的智算中心网络拓扑,构建存算一体的智算平台体系架构,支撑大模型训练推理等应用,可为行业应用提供从端到云的智能化算力服务。
智算中心核心单元
1.算力底座
智算中心算力底座基于飞腾新一代服务器芯片飞腾腾云S5000C和国产AI算力卡。其中S5000C计算性能强大,IO吞吐量大,支持DDR5和PCIe5.0,可满足AI计算高带宽、低延迟的技术需求;国产AI算力卡具备自主可控、灵活拓展的特点,在性能上不断追赶并部分超越国际主流产品。
目前,飞腾腾云S5000C已与国产主流AI算力卡完成适配,整套智算中心算力底座具备自主化程度高、体系布局、生态开放、高可扩展、高性价比、平滑迁移等特点。
2.整机
基于飞腾腾云S5000C的智算设备产品多种多样,包含2U/4UAI服务器(2、4、8卡)、OAM服务器、高速交换机、全闪存储服务器、智能网卡等,上述产品可单独或自由组合形成成熟的整体方案,满足智算中心的多样算力需求,对标国际先进算力水平。
3.智算中心PoD单元
在单个机架上集成了AI服务器、存储服务器、管理服务器、交换机等设备,用于深度学习模型的大规模训练和推理。PoD单元可支持32张加速卡协同工作,采用200G低延迟网络和固态存储方案,既可作为独立计算设备实现开箱即用,亦可作为AI服务器集群的基本组成单元,实现大规模集群配置。目前PoD单元已适配多家厂商AI加速卡,打造出从高性能到高性价比的多套配置方案,具备超强算力、超强拓展性、超高易用性、低TCO、可一体化交付的特点。
4.千卡万卡集群
基于PoD单元模式可将AI服务器集群扩展至千卡、万卡规模,形成AI算力弹性资源池,借助智算平台管理软件和高性能网络互联技术,实现算力资源统一纳管、高效调度、智能运维。AI服务器集群支持大规模的数据处理和复杂的计算任务,适用于大模型训练推理场景,性价比高于国际主流集群方案,可为各类智能应用提供强大、可控的智能算力。
以450个POD、1800台4U 8卡服务器、14400张AI加速卡为例
5.大模型适配
基于飞腾AI算力底座适