第207章 AI界的反应 二(1/2)
天才一秒记住本站地址:[笔趣阁]
https://www.ibqg.vip 最快更新!无广告!
与此同时,圣克拉拉,英伟达总部。
黄仁勋正穿着他那件标志性的皮衣,在会议室里来回踱步。
他的面前,同样摆着那篇论文。
「你们怎麽看?」老黄停下脚步,目光如电,扫视着在座的技术高管。
「Jensen(黄仁勋英文名),这个算法对我们的CUDA生态是个挑战。」一位首席架构师面色凝重,「它大量使用了min丶max这种非线性算子,而且数据依赖性很强,无法像矩阵乘法那样进行大规模并行流水线优化。在H100上跑这个,SM单元的利用率可能连20%都不到。」
【写到这里我希望读者记一下我们域名找台湾好书上台湾小说网,t??w??k??a??n??.c??o??m??超方便】
「也就是说,我们的显卡,在这个算法面前,变成了『废铁』?」老黄的声音很冷。
「不能说是废铁,但确实……性价比极低。」
老黄沉默了。
作为「AI军火商」,他最怕的不是竞争对手,而是「技术路线的变更」。
英伟达之所以能躺着赚钱,是因为全世界都在用Transformer,都在做矩阵乘法。他只要把矩阵乘法做到极致,就能垄断市场。
但现在,有人想换个玩法。
这才是英伟达最担心的事情。
英伟达的护城河,从来不仅仅是硬体性能,而是CUDA生态。数百万开发者习惯了调用cuBLAS丶cuDNN这些高度优化的库来构建模型。如果一种新算法绕过了这些库,甚至需要全新的硬体支持,那麽英伟达的垄断地位就会出现裂痕。
「AMD那边有什麽动静?」老黄问道。
「MI300系列的架构比较灵活,他们在标量计算单元上保留了更多的资源,理论上跑SLRM会比我们稍微从容一些。」技术部主管回答,「而且,他们最近在积极接触PyTorch团队,试图推动对非矩阵算子的原生支持。」
「不能给他们机会。」老黄的眼神变得冷峻。
他走回座位,双手撑在桌面上,下达了一系列指令。
「第一,软体层面。立即启动cuSLRM项目。抽调最精锐的CUDA工程师,针对SLRM的核心算子进行手写汇编级优化。我要让全世界看到,即使是跑几何逻辑,英伟达的GPU依然是最快的。」
「第二,硬体层面。Blackwell架构的设计已经冻结,来不及大改。但在下一代Rubin架构中,必须预留专门的『逻辑推理单元』。我们要把这种非线性计算,也变成硬体原生的指令。」
「第三,生态层面。」老黄顿了顿,语气中透出一丝商业巨头的狠辣,「联系PyTorch和TensorFlow的维护团队,以『技术合作』的名义,提供专项资金和人力,帮助他们优化基于CUDA的SLRM实现。我们要确保,当开发者想要尝试这个新算法时,他们最先想到的丶最好用的工具,依然是跑在英伟达显卡上的。」
「我们要用生态的厚度,去淹没任何试图另起炉灶的尝试。」
……
然而,就在谷歌和英伟达这两大巨头,如同两头被惊醒的巨兽,准备调整姿态在新的赛道上狂奔时,一张早已编织好的大网,无声地收紧了。
「老板,情况有点不对劲。」
谷歌的情报分析师冲进会议室,脸色苍白,同时也带回了让整个矽谷窒息的消息。
「怎麽了?是不是中国那边也有动作?」皮查伊敏锐地问道。
「不止是有动作……」分析师深吸一口气,投屏了几张截图。
那是GitHub上几个不起眼的开源项目,更新时间显示在一周前。
-OpenLPU-Compiler(开源逻辑处理单元编译器)
-SLRM-Pytorch-Extension(SLRM专用算子库)
-Chinese-Logic-Graph(中文逻辑知识图谱构建工具)
虽然这些项目还很初级,甚至有些简陋,代码提交记录也显示只是刚刚起步的「占坑」行为。
但它们背后的提交者ID,却让皮查伊感到一阵窒息。
-华为升腾
-寒武纪
-阿里达摩院
「还有这条新闻,」分析师调出一条不起眼的快讯,「上周,中国科技部批准了『新一代认知智能计算架构』重点专项,合作方囊括了中国几乎所有的半导体和网际网路巨头。据可靠消息,海丝的下一代LPU晶片,已经进入了秘密流片阶段……」
会议室里,死一般的寂静。
「怎麽可能?!」
一向沉稳的杰夫·迪恩都忍不住失声惊呼:「论文才发出来半个月,他们怎麽可能动作这麽快?简直就像是……早就拿到了答案一样!」
ⓘ 𝙱 𝕢 g. v ⓘ 𝑃
本章未完,点击下一页继续阅读。