据SemiAnalysis发表,华为云CM384根据384颗昇腾芯片构建,经过全互连拓扑架构完成芯片间高效协同,可供给高达300 PFLOPs的密布BF16算力,挨近到达英伟达GB200 NVL72体系的两倍。此外,CM384在内存容量和带宽方面相同占有优势,总内存容量超出英伟达计划3.6倍,内存带宽也到达2.1倍,为大规模AI练习和推理供给了更高效的硬件支撑。
报导剖析称,虽然单颗昇腾芯片功能约为英伟达Blackwell架构GPU的三分之一,但华为经过规模化体系规划,成功完成全体算力跃升,并在超大规模模型练习、实时推理等场景中展示更强竞赛力。SemiAnalysis也指出,华为的工程优势不只体现在芯片层面,更在于体系级的立异,包含网络架构、光学互联和软件优化,使得CM384可以充分发挥集群算力,满意超大规模AI核算需求。
此次华为云CloudMatrix 384的发布,标志着我国在AI核算体系范畴已具有与世界巨子正面竞赛的实力。SemiAnalysis在报导中特别指出,华为的规模化解决计划“领先于英伟达和AMD现在市场上的产品一代”,并以为我国在AI基础设施上的打破将对全球AI工业格式发生深远影响。