GPU[9]
英伟达50亿美元入股英特尔 联手打造CPU+GPU融合芯片重塑计算格局
2024年9月,英伟达斥资50亿美元入股英特尔并达成深度战略合作,共同开发融合CPU与GPU的下一代计算芯片,聚焦数据中心与个人计算领域。依托NVLink-C2C芯粒互联技术实现硬件原生一体设计,合作推动英特尔股价暴涨22.77%,有望重塑全球计算产业格局,开启半导体“融合时代”。
Triton团队发布Gluon:专为GPU底层性能调优的新型编程语言
Triton团队发布新型GPU编程语言Gluon,作为Triton生态“性能进阶工具”,共享编译器与开发工具链,通过暴露底层硬件控制参数(如CTA分配、数据布局)填补通用编程与极致性能优化空白。开发者可灵活切换抽象层级,平衡开发效率与算力释放,适用于AI大模型核心算子、HPC等场景,被社区称为“GPU编程的罗塞塔石碑”。
月之暗面开源Checkpoint Engine:Kimi K2模型参数更新突破20秒
月之暗面(Moonshot AI)开源Checkpoint Engine技术,针对大模型强化学习训练参数同步难题,将Kimi K2模型参数更新时间从10分钟压缩至20秒,大幅提升GPU利用率与训练效率,解决大模型训练隐形瓶颈,为行业提供高效工程优化方案。
英伟达推出NVIDIA Rubin CPX GPU:首款百万级token上下文AI推理芯片,性能与内存双重突破
英伟达发布新一代AI推理GPU Rubin CPX,专为超大上下文处理与生成式视频打造,配备128GB GDDR7内存、30 PFLOPS算力(NVFP4精度优化),集成视频编解码单元,投资回报率达50倍,2026年底上市,重塑AI推理效率与应用边界。
Skypilot研究:网络与存储优化让分布式生成式AI训练提速10倍,打破GPU性能瓶颈惯性思维
生成式AI训练中,网络与存储性能是被低估的隐藏瓶颈。Skypilot团队实验显示,在不更换GPU、不修改代码的情况下,仅优化网络带宽(10Gbps→100Gbps)和存储类型(标准云SSD→本地NVMe),分布式训练速度可提升10倍,打破“GPU决定一切”认知。这一发现凸显数据传输与读取效率的关键作用,Skypilot框架助力简化基础设施优化,为AI训练提速提供新路径。
英伟达发布突破性Rubin CPX GPU:重塑百万级长上下文AI推理
英伟达推出专为百万级长上下文推理设计的Rubin CPX GPU,采用解耦式架构与长序列处理单元(LSPU),实现3倍注意力机制处理速度,端到端延迟降低40%、能耗下降55%。其128GB GDDR7内存与动态资源分配技术,赋能代码生成、法律研究、长视频分析等场景,重塑AI推理基础设施,预计2026年底上市。
Triton官方GPU编程教程:破解AI大模型算力瓶颈,优化核心算子效率
AI大模型时代GPU算力需求激增,传统编程面临底层优化门槛高、算子效率低等痛点。Triton官方GPU高性能编程教程通过Python抽象与结构化实践,提供从调用API到定制高性能内核的进阶路径。教程涵盖基础运算、深度学习核心算子(矩阵乘法、融合注意力机制)及硬件级优化,重点解决Transformer注意力机制显存读写频繁、矩阵乘法算力浪费等问题。其中融合注意力在A100 GPU提速1.8-2.3倍,矩阵乘法吞吐量达GPU理论峰值85%,低内存Dropout显存占用降低30%以上。支持Libdevice函数调用,适配新GPU架构,助力开发者高效挖掘硬件性能,推动AI模型训练与推理效率革命。
英伟达15亿美元租Lambda H100服务器:巩固GPU霸权对抗自研芯片
2024年全球AI算力竞争白热化之际,英伟达与Lambda签署15亿美元GPU服务器租赁协议,涉及1.8万台搭载H100 Tensor Core GPU的服务器,总算力达1.8 EFLOPS。此举是英伟达应对亚马逊、谷歌等巨头自研芯片冲击的“内循环”战略落子:通过资本绑定Lambda等中小云服务商,以“投资-采购-回租”模式巩固GPU生态,如CoreWeave从挖矿公司逆袭为190亿估值巨头的案例所示。其核心逻辑在于依托CUDA软件生态壁垒,锁定开发者群体,对冲大客户流失风险。该交易不仅巩固英伟达GPU霸权,更推动AI算力市场分层——头部厂商主打通用算力,英伟达系服务商聚焦高性能训练,加速算力从稀缺资源向标准化商品转变,为AI技术普及注入动力。
英伟达Q2营收467亿创新高,股价下跌引AI周期市场分歧
英伟达2026财年Q2财报亮眼,营收达467亿美元创纪录,同比增长56%,数据中心业务以411亿美元营收占比88%,核心驱动力为Blackwell平台规模商用。该平台在MLPerf测试中性能领先,AI推理效率提升一个数量级,已落地特斯拉自动驾驶、梅奥诊所药物研发等场景。不过财报公布后股价盘后一度跌超5%,主因云厂商Q3资本开支增速放缓至15%引发采购担忧,叠加年内股价累涨58%后获利了结。长期看,英伟达全栈AI转型成效显著,软件收入同比增120%,300万开发者生态巩固技术壁垒,Blackwell在千亿模型场景的效率优势或成平衡周期波动关键。