北京时间8月4日23时,全球*具权威的AI性能基准评测组织MLCommons®正式发布了*新一轮MLPerfStoragev2.0存储性能基准测试的结果。华瑞指数云ExponTech作为AI-Native企业级全场景数据基础设施的领导者,与DDN,IBM,HPE,华为,Hammerspace等众多国际国内*的厂商同台竞技,凭借创新技术方案和产品参与测试,取得极为出色的成绩,多项指标位居世界榜首。
本次测试中,ExponTech与合作伙伴英伟达,Scaleflux,AIC深度合作,采用了软件,硬件均有显著创新的产品方案,目标是验证在AI场景下,采用新一代分布式存储软件栈驱动更加精简,高效的硬件方案,达到更高的性能密度,容量密度和更低的成本,同时在网络方面采用RoCE网络,验证其大规模组网能力以及整体存储方案的大规模扩展能力和并行访问能力。
与其他参测者采用的许多台高配置的存储服务器+IB网络的整体方案不同,ExponTech方案的存储节点仅使用一台2U的AIC盘框(JBOFF2026),盘框本身没有配置CPU内存,没有处理能力,主要提供很高的容量密度和硬件可靠性,2U空间可以*多配置26块SSD盘,本次测试配置24块ScalefluxCSD5000带压缩功能的SSD盘。
网络方面,采用4台英伟达Spectrum-X交换机组成一个2层的RoCE网络,验证大规模组网时的拥塞控制能力。基于这个2层RoCE网络以及ExponTechWADP分布式存储软件,可以扩展到连接1024台盘框,形成一个EB级容量,上百TB级存储带宽的超大规模高性能存储池。
1、基于1个2U的存储节点以及1个客户端和2个客户端的测试结果显示,可以轻松满足模型ResNet-50的训练需求,单客户端能够支持的GPU卡的数量*高达到240块,带宽23.6GiB/s,在存储节点硬件采用DPU+JBOF,CPU和内存都不是很强(AI控成本)的前提下,依然*参与测试的所有厂商方案,位居世界*。具体的测试结果数据如下:
通过上述测试数据测算,ExponTechWADP使用一个2U的存储节点,在配置4个客户端的场景下,可以支持超过700块A100GPU训练卡和约400块H100GPU训练卡的训练需求,稳定提供70+GiB/s的带宽,逼近存储节点网络带宽极限。ExponTechWADP也可以支持扩展到更多的2U存储节点,形成大规模高性能存储集群,支持超大规模的AI训练场景。
超高密度与能效,仅使用单台2UJBOF设备搭载DPU作为存储节点,硬件配置规格远低于其他的测试方案,展示出了超高的容量密度,性能密度和能效。
超高性能表现,在硬件规格非常低的前提下,依然展示了超高性能表现,在Resnet50模型训练测试中,单客户端支持的GPU卡数和带宽排世界*,Llama3模型的Checkpoint写入带宽排世界第三,但使用了*少的SSD盘数,以Checkpoint写入带宽/容量来计算写入效率,ExponTechWADP方案排名将遥遥*居*,展示了WADP存储软件极为高效的硬件利用效率。
弹性扩展能力,WADP分布式软件架构可并行扩展到1024个节点,实现存储容量,IOPS和带宽的同步并行扩展,同时保持稳定的微秒级时延。
存储效率倍增,AC米兰官网ScaleFluxCSD5000SSD提供透明数据压缩/解压缩,在零性能损耗、无额外资源消耗前提下实现存储容量与效率倍增。
首次参与即在MLPerfStoragev2.0AIStorage基准测试中取得优异成绩,这一成就不仅彰显了华瑞指数云ExponTech存储技术的强劲实力,更标志着华瑞指数云ExponTech在业界又达成了一个关键里程碑。此次测试延续了WADP(以其子产品WDS名义)在2023年创下的SPC-1基准测试世界纪录,印证了其在企业关键业务(SPC-1:全球存储性能委员会)与AI工作负载(MLPerfStorage)领域的双重竞争力,是目前全球*的一个能够在SPC-1和MLPerfStorage上都能够测试出*成绩的分布式存储软件,成为真正覆盖全场景的企业级AI统一平台。在未来企业把AI工作负载与企业关键业务进行结合,实现AI能力在企业业务流程中全面落地的过程中,ExponTechWADP平台将发挥出更加全面的价值。
未来,华瑞指数云ExponTech将在AI大模型领域持续深耕,不断突破性能极限,打造全球*的AI数据平台,为企业赋能新质生产力。在统一的数据平台产品上同时承载企业的核心生产系统和AI数据管道,帮助企业把核心生产数据与AI能力相结合,实现AI在企业级场景的快捷落地。近期,华瑞指数云ExponTech将正式发布ExponTechWADP的*新版本,一款融合支持企业级生产业务和AI训练推理业务,面向企业级AI的统一数据平台底座产品,欢迎持续关注。
SPC-1(全球存储性能委员会)是企业级存储领域*权威的Benchmark评测,是一个专注于存储行业供应商性能评测的中立机构。旨在评估存储系统处理复杂请求和大规模数据的能力,对IO吞吐量、读写响应时间敏感度、工作负载动态变化、存储容量利用率、用户多样化、数据持久性等多种数据特征进行严苛考量。
:13987489529
:
:241412eb@qq.com
:广东省广州市