围歼英伟达|深氪

liukang20241天前群众吃瓜661

文|邱晓芬

独特的围剿英伟达|深氪的照片

访谈|邱晓芬 杨逍

修改|苏建勋 杨轩

抵挡

一个隐秘的微信群,在上海张江的AI芯片公司人士中口口相传,群名叫“国产芯片抱团取暖群”,进群的有必要是国产芯片公司职工,在这儿,即使是竞争对手,也会交流信息,交换商务资源。

“国产芯片抱团取暖群”圈定了一块停战区,同行可以暂时休战,互帮互助,只因为咱们都有一个一同的敌人:英伟达

因为英伟达的存在,国产芯片公司的出售,多少都尝过一点耻辱的味道。

李明(化名)是一家国产GPU公司的出售,这一轮AI热潮掀起时,他曾决心满满地去见客户,可来不及问寒问暖,客户开口便是连环诘问:

“你们的东西,和英伟达A100芯片比较,啥间隔?英伟达有NVLink,你们有什么?”(作者注:NVLink是把多个GPU芯片衔接起来,防止GPU的数据搬到CPU核算,以提高核算功率)

目睹用产品和技能感动不了客户,李明的团队开端想办法托关系,找“更有力的人士”去游说,但客户仍是摆摆手,“咱们仍是想用英伟达”。

英伟达A100,826平方毫米的面积上,塞了540亿个晶体管,是翻开AI大模型魔盒的钥匙。

大模型练习,像是在海量数据中“炼丹”,意图是找出数据改变的规则;而用英伟达芯片练习大模型,就比方让几亿个智商200的人来管用,而其它芯片的作用,只等同于找了几千个智商100的人来核算。

英伟达A100 图片来自英伟达官网

最顶尖的科技公司,都在张狂抢购英伟达。谁具有最多的英伟达高端GPU,谁就有时机练习出更聪明的大模型。

揭露信息显现,OpenAI现在掌握着全世界最多的英伟达高端GPU,至少达五万片;谷歌、Meta也是万卡集群的具有者(2.6万左右);而国内稀有有英伟达高端GPU万卡集群的互联网大厂,是字节跳动(1.3万)。

英伟达独占着全球工业链上最好的资源——具有台积电最足够的芯片先进制程产能、拉拢着全世界最大的工程师用户集体,掌握了一众AI公司的核算命脉。

肯定的独占,往往会繁殖不满、愤恨和逃离。

“今日一切做大模型的,根本都在严峻亏钱!只要一家在挣钱!英伟达”,一位职业人士口气忿忿不平——“英伟达的利润率让一切的客户都很难过,很损伤AI职业!”。

财报显现,英伟达毛利率到达71%,其间,抢手产品A100和H100系列,毛利率高达90%。作为一家硬件公司,英伟达竟然享有比互联网软件公司更高的毛利率。

高价暴利,让英伟达的大客户开端逃离。7月30日,苹果宣告其AI模型用8000片谷歌TPU来练习,而英伟达含量是0;音讯一出,7月31日,英伟达股价跌落超7%,创下近三个月最大跌幅,市值蒸腾1930亿美元,简直跌掉了一个拼多多。

英伟达最近一年股价跌幅图

关于一切想在英伟达身上撕下一块肉的国内GPU企业来说,2022年是个起色之年,美国数轮禁令下达,英伟达迫于生计,在我国持续推出阉割版别芯片,但又被快速禁用:

  • 2022年9月,A100/H00制止向我国出口,英伟达推出阉割版别A800/H800;2023年10月,A800/H800/L40/L40S/RTX4090被制止向我国出口;2024年6月,英伟达创始人黄仁勋称,将向我国推送阉割版其他L20、H20芯片。

但是,阉割版别引发了职业更剧烈的声讨。英伟达行将推送的H20,价格虽是英伟达H100的一半,功能却前者只要1/3。一位AI职业人士痛斥——“这不就抢钱吗?纯纯智商税!”

当英伟达的客户开端不满与愤恨,那些想代替英伟达的国产芯片公司,却在这种心情中得到了“滋补”。

曩昔,他们只能跟在英伟达的屁股后边,困难分食一点点蛋糕碎屑。半导体剖析公司TechInsights的一项数据显现, 2023年,英伟达在数据中心GPU出货量商场份额高达98%,国产芯片和一众芯片巨子加起来,只占弱小的2%。

现在禁令袭来,完美的英伟达在我国商场被扯开一道口儿,谁能代替英伟达?国产AI芯片厂商看到了活力。

“本年咔嚓,英伟达在我国的90%商场都给释放出来了,能不能抢到,各凭本事”,一家国产GPU公司创始人表明。

36氪曾在2021年宣布过《深氪|宁德年代:万亿电池帝国的裂缝》,在动力电池职业,宁德年代一骑绝尘,被竞争对手们凶相毕露。

现在,在AI芯片范畴一家独大的英伟达,也被许多同行视为眼中钉、肉中刺,但英伟达的不同在于,它的壁垒更高,与对手们的间隔更大。

咱们测验经过英伟达对手们的抵挡,去找到“英伟达的裂缝”,放眼GPU职业,国产GPU、AI芯片厂商尽管力气懦弱,但他们更懂我国商场,打法愈加本土化;而比方英特尔、AMD等老牌芯片巨子,则有着更足够的粮草弹药,正面临击英伟达。

短期内,英伟达不会被打倒,但它也不会毫发无伤,这注定是一场血腥的战役。

包围

想包围,就要找到对手的缺点。英伟达的缺点之一是:高傲。

芯片职业,本质上是一个To B软件职业。客户需求芯片厂商“陪同感”的服务,比方把硬件调试好、把软硬件兼容做好,陪同到位了,客户才有粘性,芯片产品就不简单被替换。

但多位国产芯片人士告知36氪,在我国商场,除了像BAT、字节这样几十亿规划的大收购方,其他大部分公司交易额纵使达几千万,简直很难得到来自英伟达的售后服务。

也便是说,当运用英伟达芯片的我国工程师们有疑问时,只能靠自己到英伟达官网上查找文档,或许去社区自学。

和英伟达协作时,我国客户们的种种需求常常得不到满意。一位芯片职业人士告知36氪,英伟达在我国一般会推最高配、最贵的全套计划,而当客户提出针对特定场景的定制化要求时,也一般会被否掉,客户们买完卡后,要“自己揣摩,或许再找凶狠的算法公司搞定”。

英伟达的这种做法,堆集了不少中小客户的诉苦。“英伟达现在作为大厂,对小客户现已不会像曩昔那样注重,他们的产品没有挑战者,不需求去吃力巴结客户”,前述人士表明。

但在曩昔,英伟达生态的兴起其实印证了服务关于芯片职业的重要性:2006年,CUDA生态刚起步时,英伟达产品和现在的国产芯片相同并不超卓。但英伟达团队先从高校的科研团队推起,再渗透到每一个细分职业的草创公司做软硬件适配,才有了现在的大片江山。

NVIDIA H100 图源:英伟达官网

我国芯片厂商们,也领悟到这一点,测验从客户服务开端切入。

国内某家不肯签字的AI芯片公司,2023年以来,测验让后台的研制人员走到一线亲身服务——不只要驻场联合调教,在出售打单后,给客户专门拉个有研制人员的小群。客单价小到几百万、几十万不等,都能享用7×24小时的咨询。

光供给本地化的交心服务远远不行,在英伟达我国大撤离之余,芯片职业而早已不简单是芯片产品自身对决,更检测着各自对时刻窗口期的掌握。我国芯片厂商就像一群狼扑上来,轰轰烈烈的打单开端了。

高质量的围剿英伟达|深氪的照片

华为来势最凶狠。华为此前联合讯飞,发布的设备「星火一体机」上,就搭载了「昇腾910B」。

这颗芯片,曾声称单卡才能“对标英伟达A100”。不为人知的是,光鲜事例背面困难的一面——36氪了解到,华为对此不吝人力本钱,调配了几百名工程师下场帮讯飞调教参数。

华为和讯飞发布星火一体机,图源讯飞

尽管这被职业称为“手艺打造”,但标杆事例一出,许多大模型公司、互联网公司都对华为抛出了测验的橄榄枝。

一家国产芯片出售惊奇发现,自从上一年7月份至今,只要是揭露招标的智能算力中心项目,都能看到华为等级不低的管理层在那驻场,“华为现在一个项目可以派几百个人上去服务,乃至一些要害项目不吝赔本,从其他项目取得收入”。

前述不签字芯片公司,也配齐了200名铁血出售——在国内芯片职业,这都是一个适当稀有的装备。他们的出售团队从大模型落地最炽热的三个范畴开端下手,金融、法令、工业,简直呈现在每一场与算力相关的展会, “芯片职业,资源榜首,跑的慢了就死掉了”。

国产芯片一场隐秘的价格战也开端了。

一位芯片职业人士告知36氪,他们的方针是,不吝单价,也要拿下更多标杆智能算力中心的单子。36 氪观察到,有的国产公司推理卡,为了降低本钱,不吝把价贵的HBM(高带宽内存)拿掉,乃至以低于本钱价50%的价格在出货。

“不论怎么样,咱们仍是期望从各个切入点打破,各自从英伟达那切走一小小块蛋糕,让英伟达不再是一家独大”。

但实际却是严酷的,详细到产品上,国产AI芯片不免呈现种种问题。

一位芯片人士向36氪举例:相同处理一个数据集,用英伟达的A100集群来跑,或许只需求十天,但用某些国产芯片产品,或许要跑上好几个月。国产芯片硬件上堆集的时刻太短,又缺先进制程,硬件上的间隔,导致运用功率不高。

软件短板也很明显。另一位职业人士测验发现,当运用国产芯片跑大模型时,若要在上面做更多酷炫使用,根底大模型做一旦改动,国产芯片就简单发生死机,“许多情况下,国产芯片咱们根本是捏着鼻子用起来”。

现在,各家真实看清了眼前的“围歼”战略,也逐步分解出了更实际的途径:

尽管还有少数派持续往万卡集群进发,侧重练习场景,和英伟达硬刚,其间以摩尔线程、华为为代表;但更多数派的挑选是,转而更重视大模型/小模型在各行各业的落地,从对硬件、软件要求都不高的推理场景抓起,以燧原、天数智芯等为代表。

(36氪注:大模型有练习和推理两个环节:练习是从几十亿数据库中寻觅规则的进程,是“造”大模型;推理是在“用”大模型的进程,难度更小、对软硬件要求更低、与工业衔接更严密)

摩尔线程在2024年人工智能大会上发布夸娥万卡集群 36氪拍照

“咱们现在没有盲目追逐英伟达,咱们追不起,不敢盲目做超大算力的芯片”,一位芯片职业人士直言。

国内芯片厂商们一个实际的考量是,英伟达的首要精力并不在此,国内厂商为此避开了英伟达的正面烽火。

此前,大部分公司依据本钱考虑,多选用英伟达消费级游戏显卡4090来跑推理——这些卡的问题一堆:功耗过高、内存不行、被禁用。英伟达官方也不允许这些消费级显卡被用于大模型推理。

国产芯片公司从英伟达这一空白处切入。天数智芯、燧原本年都在猛推对标4090的推理卡,打出了大内存、低功耗、供给安稳的卖点。

国产芯片厂商也清晰了找准细分商场的重要性。比方则针对一些功耗灵敏的场景,主打低功耗小芯片;或许扎进视频优化等细分场景,做小而美的生意。

巨子战场,一触即发

当国产GPU公司将“逾越英伟达”写进PPT,这更像一种夸姣的愿景,这群公司树立时刻不长,迎上了国产代替的风口,即使只逾越一点,也被视作是豪举,英伟达之于他们,是对手,也是标杆。

但论及与英伟达辈分适当的英特尔、AMD,气氛就愈加一触即发。

咱们内部将英伟达当作死敌”,AMD的一位MI系列产品线的研制人员告知36氪。

在本年6月的台北电脑展(Computex 2024)上,AMD创始人苏姿丰(她仍是英伟达创始人黄仁勋的表亲)也初次清晰了未来AMD在GPU上的产品节奏——每年迭代一款新的GPU产品,和英伟达更新节奏保持一致。

英伟达简直每上一款GPU,AMD都会榜首时刻从商场上买回来拆机,与还没上市的产品做比照。

“这儿要加点feature(目标)、那里参数要拉高”,他们寻求的是,“硬件上不能落后于英伟达,参数上微赢”,前述人士对36氪说到。

苏姿丰在本年台北电脑展上发布Instinct MI325X

2023年以来,AMD我国生态协作伙伴们,简直每隔两天,就会收到来自AMD的软件优化新诉求。为了推行他们的GPU,AMD高管们有时还会要求更优势的CPU部分,搭配着GPU去打单,顶着CPU或许卖不出去的危险。

AMD的人天天‘烧香拜佛’,就期望咱们把生态搞起来”,一家生态公司高管表明,据他泄漏,现在国内现已有10多家云厂商和To B客户,在和AMD芯片相关的适配和作用验证。

比较于一众焦灼的国产芯片厂商,国外芯片巨子们在硬件层面的优势在于,具有先进制程和HBM产能,因而,AMD、英特尔的产品,比较于英伟达产品其实不会有太大的间隔,某种程度上乃至更优异。

官方的数据显现,AMD的产品(2023年12月发布的MI300X)此前声称算力是英伟达H100的1.2倍;

英特尔的产品(2024年4月发布的Gaudi 3)在能效和推理功能上也远超H100。当然,也更廉价,AMD的GPU价格大概是英伟达对标产品的七多半。

但一切和英伟达正面硬刚的厂商都面临着一个一同的难题:咱们的硬件怎么有优势,都因软件下风而暗淡,好像木桶的短板。

在GPU还只能用于图形核算的年代,英伟达推出的软件途径CUDA,适当于给开发者供给了一套编程接口,让他们能最了解的编程言语,在GPU上自若编写核算程序。

“我给你们打个比方,CUDA为什么逾越不了,就比方你学会一种言语,这么多年,都是用这个言语干活的,假如我让你换一套言语,你会不会很难过,会不会不肯意?”一家芯片公司职工这样给36氪举例。

CUDA作为英伟达软件生态壁垒最深沉之处,纵是家大业大的英特尔、AMD也无法短时刻内弯道超车。

一位英特尔GPU团队前职工告知36氪,他们从前组织全球3000多名工程师、投入了三四年,却只把精度从0%提高到4%——他们用英特尔的芯片转化一张人像,等候良久,信息丢掉到“已看不出是一张人脸”。

英特尔CEO基辛格发布Gaudi系列芯片

真实的围剿英伟达|深氪的视图

“鸡生蛋仍是蛋生鸡”的谬论再现。正是因为AMD和英特尔的GPU用的人不多,其及对应的软件途径(ROCm、oneAPI)用的人也更少,因而很难有人能把它们真实的硬件才能彻底发挥出来。

“英伟达的CUDA一向有那么多开发者在上面迭代算法,帮英伟达把推理和练习做得很高效,导致英伟达一向能有议价权,他也永久知道他下一个芯片应该咋做,但这是AMD和英特尔都很头疼的事”,一家AMD生态公司CEO直言,现在AMD的软件东西ROCm,“就像20年前的英伟达CUDA一般”。

但关于下流客户来说,危险正是由此而生。

验证大模型本便是一项有不确定性的试验,若还要在一个没有被验证过的芯片上跑,适当于把两个不可控的变量放在一同——扔掉英伟达,意味着要付出巨大搬迁本钱,承载不确定性。

尽管如此,围歼英伟达,关于AMD和英特尔这两家来说,依旧是一场不得不打的仗。

全球芯片架构三分全国:X86架构辅导着PC范畴,是英特尔和AMD的全国;移动商场是Arm的全国;英伟达则主导着人工智能商场。

在全新AI革新引领年代的近一年半,英伟达一度跨过3万亿美金市值大关,现在也适当于7个英特尔+AMD市值的总和。

时隔20年后,芯片巨子们对英伟达的「围歼」,是又一场焦灼的战事,这也是一场后知后觉的反扑。

真实的裂缝

当国内AI芯片公司组成蚂蚁雄兵,AMD和英特尔竭尽全力,遭受此等围追堵截的英伟达,真的被撼动了吗?

英伟达帝国的裂缝,正在悄然延伸。

一个让英伟达有必要警觉的信号是,OpenAI、谷歌、微软……这些因AI崇奉,为英伟达充值的大客户们,正迈出“反英伟达”榜首步。

自研芯片是各家筹谋已久的棋局。一位谷歌TPU团队的前中心职工告知36氪,用掉了世界上1/4算力的谷歌,“或许年末就不对外收购芯片了”。

曩昔谷歌自研TPU更多依据本钱考虑,比方忧虑英伟达随意提价,或许供给不行安稳,现在谷歌的造芯战略更为急进——“简直是不计价值和本钱投入”。

OpenAI则有很多手预备,他们计划筹资高达7万亿美元,树立一个全新的AI芯片帝国。

在国内,36氪也从多方了解到——现在英伟达在国内最大的买方,阿里、字节、百度,根本都在隐秘研讨用于大模型练习的芯片。

海外云厂商、大模型厂商、明星芯片厂商产品发展,36 氪综合信息收拾、制图

不过,自研芯片毕竟是一个久远之计,这些大客户们短期内的另一项计划是,测验英伟达对手们的产品,削减对英伟达的依靠。

AMD便是这个Plan B。一位AMD内部人士告知36氪,AMD的GPU产品现已在欧洲、美国、韩国等地,翻开了大客户商场——微软现已收购上万片AMD的产品,特斯拉、Midjourney、美国国家试验室、韩国电信也都已批量提货。

在国内,AMD生态公司职工陈文表明,AMD某类型加快卡在2023年有几百片出货,虽不多,“但AMD的这款产品,此前在国内简直查无此人”。

依据AMD方面此前达观估计,在2024年年末,数据中心GPU将给AMD带来高达20亿美元的收入。

而我国芯片厂商的蚂蚁雄兵,尽管没有对英伟达形成实质性要挟,但星星之火,也有渐起之势。

36氪了解到,现在,国产练习、推理芯片的出售,现已跃进了一个新台阶——一个令人欣慰的活跃信号是,国内公认最难打单的互联网公司、大模型公司,已对国产芯片厂商开了口儿。

据36氪了解,现在,昇腾芯片现已困难包围进百度在内的互联网公司系统。

此外,国内比方智谱AI、MiniMax、阶跃星斗等AI公司,都在练习万亿参数规划的大模型,但在英伟达高端芯片有限的情况下,大模型公司们遍及挑选“混训”(即英伟达+其他芯片),比方,智谱AI的集群储藏了近半的昇腾芯片。

别的,天数智芯、燧原的推理芯片产品上一年以来,双双有了数万片的出货,出货途径包含国内各大智算中心,前者打进了大模型厂商百川的供给链;百度昆仑芯这边,曩昔两代推理芯片累计出货量3-5万片,来自百度和外部途径的出货量已各占一半。

“英伟达现在的价格和供给水位,正处于打听咱们干不干、怎么干的鸿沟线上”,一位职业人士直言。

英伟达创始人黄仁勋 图源视觉我国

假如把眼光拉得更到未来三五年,英伟达新的要挟也在逐步闪现。

职业里边也呈现了GPU之外的全新的AI芯片架构——比方此前推出LPU架构的硅谷芯片公司Groq,声称运转大言语模型比英伟达的GPU“速度快了十倍”;

还有发布了大模型ASIC芯片的硅谷芯片Etched,声称比英伟达GPU“快了一个数量级”。这些芯片创业公司,背面站着OpenAI这样的明星出资阵型。

36氪了解到,国内本年以来也冒出了全新的AI芯片创业公司。比方,上海市近来隐秘支撑了两家全新的AI芯片公司。

一家国产TPU公司「中昊芯英」CEO杨龚轶凡表明,GPU的全体晶体管利用率只要20%,其实缺点很明显,比较之下,TPU和ASIC等新的架构尽管通用性不强,但晶体管利用率可以到达60%-100%,“未来三五年国内外必定呈现一大堆GPU架构之外的AI芯片”。

星星点点,足以让英伟达这个巨物被撼动。

“你认为英伟达就像是表面看来一骑绝尘无对手?真不是”,一位英伟达职工告知36氪。正如黄仁勋常常挂在嘴边的一句话,“咱们间隔关闭,只要30天的时刻 ”。

英伟达做了十几年的预备,再撞上OpenAI这样的天才公司,才一同催化才呈现了英伟达的奇观。在曩昔,半导体职业最不缺少弯道超车巨子的故事。

围歼英伟达之战的硝烟,早已燃起。

end

end

告发/反应
标签: 伟达围歼

相关文章

英伟达再推“我国特供”芯片能否拯救我国市场

本报记者 杨舒宇 本报特约记者 陈 欣据路透社22日独家报导,四名知情人士泄漏,人工智能芯片巨子英伟达正在为我国商场开发一款新的旗舰人工智能芯片,该芯片将与美国现在的出口控制规定相兼容。其间两名消息人...

英伟达开发者大会上新 算力产业链“涨”声一片

本文共2100字阅读完约5分钟金融出资网记者 薛蕾3月18日至3月21日,英伟达GTC开发者大会时隔五年重返线下,发布了包含GB200 Grace Blackwell超级芯片体系、人形机器人根底模型P...

世界权威机构陈述:华为云CloudMatrix 384功能超英伟达旗舰计划

近来,世界闻名半导体研讨和咨询机构SemiAnalysis发布专题报导称,华为云最新推出的AI算力集群解决计划CloudMatrix 384(以下简称CM384)凭仗其颠覆性的体系架构规划与全栈技术立...

英伟达进军汽车行业,华为、大疆迎来潜在微弱对手?

金融界3月20日音讯 美国时刻3月18日下午,英伟达2024GTC大会在加州圣何塞中心举办。英伟达创始人兼CEO黄仁勋在大会上除了展现与AI这种新式技能有关的产品外,还提到了在轿车范畴的开展。众所周知...

“祛魅”英伟达:华为昇腾与谷歌TPU

【人工智能和多大模型的迅猛开展带动算力需求日益激增,AI芯片运用远景更加宽广。面临美国高端AI芯片对华封闭禁运,国产AI芯片正在加快包围。日前,美国D2D Advisory咨询公司CEO杰·葛德伯格(...

华为是英伟达最大对手!黄仁勋:对手AI芯片免费,也比不过英伟达

继轿车战打响之后,芯片战是也要跟上了吗?近来,英伟达(NVIDIA)首席执行官黄仁勋发表声明,英伟达的GPU非常好,虽然竞赛对手的芯片或许免费,但英伟达的 GPU 以其布置敏捷、功能杰出、高利用率及灵...

友情链接: