GPU 再胜一局!2025 年 3 月,Loop Capital 爆出一则重磅音书:Apple 已向 NVIDIA 订购总数约 10 亿好意思元的 GB300 NVL72 GPU 集群做事器系统,由 Super Micro Computer(SMCI)与 Dell 蚁合请托。在 AI 鸿沟"掉队"的苹果,终于负责进入"大型做事器集群 Gen AI 游戏"。不论是科技巨头(如苹果、谷歌、Meta)如故初创公司,都在依赖 NVIDIA 的 GPU 来加快其 AI 计策。AI 鸿沟的旁边巨头正享受着属于他们的高光时刻。
苹果终转向商用 GPU?
苹果长久以来以自研芯片为中枢竞争力,其 Apple Silicon 系列通过深度软硬件协同,在移动开导和边际计较鸿沟赢得了庞大得手。此前,苹果软件工程高档副总裁 Craig Federighi 曾公开说明,Apple Intelligence 做事王人备运转在自研的 Apple Silicon 做事器上,并称之为"行业云表处理新圭臬"。
相关词,这次转向 NVIDIA 的商用 GPU,在 AI 策略上的迁徙,也反馈了苹果承认了 GPU 生态和 Gen AI 范式的优势,并镇静为此砸下重金。可能是在生成式 AI(Gen AI)鸿沟,自研芯片的开发周期和优化资本难以怡悦面前商场对高性能计较的蹙迫需求。据分析师 Ananda Baruah 的论说自大,苹果正测度打算订购约 250 台英伟达的 NVL72 做事器,每台做事器的资本辩论在 370 万至 400 万好意思元之间,总价近 10 亿好意思元。
Siri "失利"是导火索,业界对苹果 AI 一直以来都翘首以盼。相关词,Siri 连年来在与竞争敌手(如 Google Assistant 和 Alexa)的对比中逐步失去竞争力,原来辩论本年春季 iOS 18.4 会更新 Siri,然而,苹果已将 Siri Apple Intelligence 功能推迟到来岁,苹果在本年 3 月初冷漠地承认了这少许,并委婉地露出:"咱们还在勤恳打造愈加个性化的 Siri,让它更了解你的个情面况,并能够在你的应用内和跨应用为你采取行动。已毕这些功能需要比咱们预感的更长的时辰,咱们辩论将在来岁推出它们。"
生成式 AI 爆火了两三年,OpenAI、Anthropic、Google 等玩家在 Gen AI 赛说念上决骤,GPT-4、Claude、Gemini 依然已毕推理、多轮对话、文档操作、编程协助等中枢才调。AI PC 也依然逐步落地了。大模子重新界说了用户对"智能助理"的祈望,用户的神色预期已从"号召实施"跃迁至"智能协同"。而看成公共最大的手机厂商——苹果显著是有点"掉队了"。这也促使苹果重新评估其 AI 硬件策略,从传统的 AI/ML(机器学习)转向更前沿的 Gen AI 本领。
Apple 这次投下这 10 亿好意思元大单,它念念干什么?有几个推测:一是打造 Apple LLM,镶嵌 Siri 新版块,已毕开导级夹杂部署(腹地 + 云);二、构建 Apple AI Cloud,撑持 iOS/macOS 等开导烦躁 AI 增强;三、明天将 AI 深度集成到 iWork 套件、Health、Shortcuts 等应用中。
尽管这次采购 NVIDIA GPU,苹果不太可能王人备烧毁自研芯片。一种可能的旅途是:愚弄 NVIDIA GPU 进行模子练习和开发,而 Apple Silicon 则专注于推理(inference)和边际开导。这种夹杂策略能够均衡性能与资本,同期保留苹果在生态系统中的规章力。
GPU 的告捷
尽管苹果在自研 ASIC 鸿沟领有深厚蕴蓄,但最终采用投向 NVIDIA 阵营,自大出两大错误信号:最初,时辰优先级成为压倒性身分——苹果显著不肯恭候自研 Gen AI 专用 ASIC 的漫长开发周期;其次,GPU 在短期内的性能优势和生态老练度,盖过了定制化带来的斥逐红利。相配是 NVIDIA 的 GPU 搭配 CUDA 生态,已成为练习谎言语模子(LLM)的事实圭臬。这种"时辰与性能"的选定,明晰地驱动了苹果的决策。
生成式 AI(如 LLM)的崛起,对算力架构提倡了全新条目:超高的并行糊涂量、海量的内存带宽以及生动的计较结构。这些需求让通用 GPU 的优势进一步突显,而非通用架构(如传统 ASIC)在短期内难以匹敌 NVIDIA 在性能与生态上的卓著地位。
当年两年,NVIDIA GPU 的价钱已飙升至每颗 9 万好意思元,其财务施展也印证了这一统带力:在逝世 1 月 26 日的第四季度,NVIDIA 已毕营收 393 亿好意思元,同比增长 78%。英伟达的毛利率高达 70% 以上,远超竞争敌手 AMD 的 50%。这种高毛利不仅反馈了商场对其居品的蓬勃需求,也突显了其在 AI 硬件鸿沟的订价权。
表面上,腾贵的芯片资本可能推高 AI 做事(如 ChatGPT 或 Microsoft Copilot)的价钱,最终转嫁给阔绰者。相关词,当今硅谷科技巨头似乎更镇静自行消化这些资本,以霸占 AI 竞赛的先机。NVIDIA 约 41% 的收入来自微软、谷歌、亚马逊和 Meta 四大客户,这些公司均露出,GPU 供应不及已成为构建 AI 数据中心的瓶颈。
本年 1 月,英伟达的远景遭受了一次颠簸——中国初创公司 DeepSeek 发布了一个具有竞争力的 AI 模子,宣称其背后预算极为有限。英伟达的市值在一天之内险些挥发了 6000 亿好意思元。不外,英伟达在接下来的几周内大部分收复了这些亏空。行业的大都假定是,DeepSeek 模子所露出的这种更低价的 AI,将只会增多公共对 AI 做事和其背后硬件的需求。科技巨头们并莫得改革我方对 AI 基础模范的诞生,反而愈演愈烈:Meta 测度打算本年斥资 650 亿好意思元诞生 AI 基础模范,包括一个鸿沟堪比"曼哈顿大部分地区"的数据中心;微软、谷歌等公共九大科技公司辩论 2025 年在 AI 上的总开销将达 3710 亿好意思元,同比增长 44%。
有 AI 大家则合计,DeepSeek 的树立实质上只会牢固英伟达的地位,因为这仍然发生在英伟达的软硬件生态系统中。与此同期,大都合计 DeepSeek 是借助现存模子(如 OpenAI 的 GPT)进行开发的,而这些模子的构建依赖于庞大的计较资源。
在硬件层面,NVIDIA 最新推出的 GB300 NVL72 平台号称巅峰之作。这款机架级假想集成了 72 个 Blackwell Ultra GPU 和 36 个基于 Arm Neoverse 的 Grace CPU,形归拢个为推理和练习优化的巨型 GPU。与前代 Hopper 架构比拟,GB300 NVL72 在响应速率(TPS,每用户每秒事务数)上训导 10 倍,能效糊涂率(每兆瓦 TPS)训导 5 倍,举座 AI 产出才调跃升 50 倍。这种性能飞跃让自研 ASIC 或传统 x86 CPU 在面对大鸿沟并行计较时,险些无法与之抗衡。
起原:NVIDIA
NVIDIA 创举东说念主黄仁勋曾露出:" Blackwell 的需求令东说念主战抖。AI 推理引入了新的缩放定律——更多练习算力让模子更智能,更多推理算力让谜底更精确。"这一瞻念察不仅揭示了 AI 算力的双轮驱动逻辑,也预示了 NVIDIA 的增长势头。瞻望 2026 财年第一季度,公司辩论营收将达 430 亿好意思元,自大其在 AI 硬件商场的统带力仍在不竭。
从苹果的和洽,到科技巨头的狂热干与,再到 DeepSeek 的未必挑战,GPU 的告捷不仅是本剖析线的胜出,更是对时辰与性能极致追求的见证。在 AI 驱动的明天,GPU 的通用算力生态正成为不成撼动的基石。
ASIC 的"失败"
与 GPU 的注目树立比拟,ASIC(专用集成电路)在生成式 AI(Gen AI)海浪中的暂时"失利",为自研芯片阶梯敲响了警钟——在本领竞争中,"错过期辰窗口"比性能稍逊更为致命。
在半导体鸿沟,自研 ASIC(如 Apple Silicon)与商用 GPU 之间的本剖析线之争由来已久,中枢在于"定制化"与"通用性"的博弈。从本领特色来看,自研 ASIC 在特定任务(如 AI 推理阶段)上具备更高的斥逐,但其假想和考据周期漫长,难以跟上东说念主工智能鸿沟日月牙异的发展节拍。比拟之下,通用 GPU 凭借生动性和矫捷的生态撑持,在快速迭代的 AI 商场中占据了优势。
ASIC 的开发周期是其最大软肋。以苹果为例,看成公共芯片假想的杰出人物,其从架构假想到流片考据仍需数年时辰。相关词,Gen AI 的竞争是一场速率至上的竞走,谎言语模子(LLM)等本领的迭代周期以月计,商场需求移时万变。苹果显著无法承受自研 AI 专用 ASIC 逐步老练的恭候期。比拟之下,NVIDIA 的 GPU 看成老练的商用处理决策,可立即干与使用,平直怡悦苹果对算力的蹙迫需求。这种时辰上的差距,成为 ASIC 在短期内失利的错误。
ASIC 的另一大短板在于生动性不及。看成专为特定任务优化的"专用芯片",ASIC 在固定场景下(如推理或收集加快)施展出色,但在 Gen AI 的责任负载面前却显得捉衿肘见。LLM 的练习波及各种化的算法和不休膨胀的模子鸿沟,需要硬件具备高度的通用性和相宜性。而 ASIC 的假想初志正好与之违抗,其定制化特色难以快速响应 AI 鸿沟的动态需求。反不雅 NVIDIA GPU,凭借通用架构和 CUDA 生态的加持,不仅能掩饰练习与推理的全经由,还能生动相宜新算法的演进。这种生动性让 ASIC 在竞争中小巫见大巫。
博通和 Marvell 看成 ASIC 假想做事的两大厂商,也靠近不利场面。
昨年底,The Information 报说念称,苹果正与博通互助开发代号为" Baltra "的 AI 做事器芯片。这款芯片聚焦收集本领,辩论 2026 年量产,仅限苹果里面使用,并采取台积电 N3P 工艺(与 OpenAI 和 NVIDIA 的 AI 芯片工艺一致)。尽管博通在传统数据中心商场凭借收集加快器等定制 ASIC 施展坚毅,但其居品在 AI 练习鸿沟的竞争力仍无法与 GPU 抗衡。
Marvell 则通过 ThunderX 系列 Arm CPU 和定制芯片布局 AI 商场,但其决策更偏向推理而非练习,难以怡悦苹果在大鸿沟 LLM 练习上的需求。
苹果此前自大,它也在探索使用亚马逊的 Trainium2 芯片进行 AI 模子预练习。如今采用英伟达 GPU,如故佐证了通用 GPU 尤其是英伟达 GPU 短期地位难以撼动。
诚然,这并不虞味着 ASIC 绝对退出舞台。苹果明天可能采取" GPU 练习 +ASIC 推理"的夹杂策略,愚弄 NVIDIA 完成模子开发,再用 Apple Silicon 优化边际部署。相关词,在面前阶段,ASIC 的"失败"更多是时辰窗口的失利,而非本领的闭幕。
归来
苹果 10 亿好意思元豪购 NVIDIA GB300 NVL72 的决定,既是其 AI 计策的急转弯,亦然 GPU 在生成式 AI 时期统带力的又一注脚。在这场本领与时辰的竞走中,通用算力以其现成性和相宜性,打败了定制化决策的长久后劲,即使如苹果这般自研才调顾盼群雄的巨头,也不得不向施行俯首。Siri 的失利、Gen AI 的狂飙,以及用户对"智能协同"的新期待,共同将苹果推向了英伟达的怀抱。相关词,这并非 ASIC 的终曲开yun体育网,而是时辰窗口与生态博弈的阶段性斥逐。明天,当苹果的自研芯片与 GPU 的夹杂策略老练,AI 算力的王座之争概况会迎来新的更动。但至少在当下,英伟达的 GPU 不仅是本领的告捷,更是时辰铁律的化身——在 AI 的怒潮中,谁能更快站优势口,谁就捏住了界说明天的钥匙。