算力[16]
《AI 2030》报告:2030年成AI分水岭,算力千亿级与科学突破重塑多领域
《AI 2030》报告由谷歌DeepMind委托Epoch发布,勾勒2030年AI发展分水岭,聚焦算力、数据、经济回报与科学突破。预测前沿算力集群成本将破千亿美元,2027年公开文本数据或枯竭,合成数据成新引擎;头部企业营收激增支撑投入,能源压力推动数据中心革新。马斯克认可趋势,报告揭示AI从工具向协作者蜕变的机遇与挑战。
英伟达斥资超9亿美元招揽Enfabrica CEO并授权其AI互联技术
英伟达斥资超9亿美元“人才收购”Enfabrica核心团队及AI互联技术,以解决十万级GPU集群协同瓶颈。该模式成科技巨头补位技术缺口新趋势,助力英伟达从GPU供应商向AI基础设施全栈方案商转型,强化“计算+连接”系统级优势,推动AI竞争进入“算力+互联”深度融合新阶段。
Triton团队发布Gluon:专为GPU底层性能调优的新型编程语言
Triton团队发布新型GPU编程语言Gluon,作为Triton生态“性能进阶工具”,共享编译器与开发工具链,通过暴露底层硬件控制参数(如CTA分配、数据布局)填补通用编程与极致性能优化空白。开发者可灵活切换抽象层级,平衡开发效率与算力释放,适用于AI大模型核心算子、HPC等场景,被社区称为“GPU编程的罗塞塔石碑”。
月之暗面开源Checkpoint Engine:Kimi K2模型参数更新突破20秒
月之暗面(Moonshot AI)开源Checkpoint Engine技术,针对大模型强化学习训练参数同步难题,将Kimi K2模型参数更新时间从10分钟压缩至20秒,大幅提升GPU利用率与训练效率,解决大模型训练隐形瓶颈,为行业提供高效工程优化方案。
谷歌MetaX联合发布SpikingBrain:脑启发大模型实现长上下文推理100倍加速,非NVIDIA平台高效运行
AI圈“SpikingBrain技术报告”引发讨论,宣称谷歌与MetaX联合开发脑启发大模型突破长上下文效率瓶颈,然经核查存诸多疑点:论文编号属未来未分配状态、MetaX C550 GPU平台虚构、性能数据与当前技术脱节。其提及的脉冲神经网络(SNN)和线性注意力是真实研究热点,公众可通过核查论文、硬件及数据辨别AI突破性新闻真伪,理性看待行业进展。
美国科技巨头在英投资逾310亿英镑 OpenAI“星门”项目落地伦敦郊外
美国科技巨头集体押注英国,微软、OpenAI、英伟达等投超310亿英镑布局AI算力。OpenAI星门项目落地,部署6万颗英伟达Blackwell芯片;英伟达联合伙伴投110亿建数据中心。英国政府加速审批、降电费吸引投资,助力巩固全球AI枢纽地位,推动主权AI时代算力竞赛升级。
Databricks AI负责人Naveen Rao离职创业 瞄准AI计算成本瓶颈
Databricks前AI负责人Naveen Rao离职创业,新公司聚焦AI算力成本优化,获Databricks战略投资。当前AI算力成本成行业瓶颈,推理成本占比超60%且持续增长,其将通过硬件架构创新破局。作为连续创业者,Rao过往项目曾推动AI训练部署成本下降,新方向或加速AI技术普及。
Skypilot研究:网络与存储优化让分布式生成式AI训练提速10倍,打破GPU性能瓶颈惯性思维
生成式AI训练中,网络与存储性能是被低估的隐藏瓶颈。Skypilot团队实验显示,在不更换GPU、不修改代码的情况下,仅优化网络带宽(10Gbps→100Gbps)和存储类型(标准云SSD→本地NVMe),分布式训练速度可提升10倍,打破“GPU决定一切”认知。这一发现凸显数据传输与读取效率的关键作用,Skypilot框架助力简化基础设施优化,为AI训练提速提供新路径。
甲骨文Q1财报:RPO激增359%股价暴涨27%,AI云服务驱动转型
甲骨文2026财年Q1财报发布后,股价盘后暴涨27%,核心驱动力为剩余履约义务(RPO)同比激增359%至4550亿美元,相当于过去25年营收总和。RPO中78%来自云服务合约(约3550亿美元),AI相关服务占比达64%,凸显转型成效。云基础设施(OCI)业务营收33亿美元,同比增长55%,增速持续提升,其与OpenAI合作集成GPT-5、与Google生态互补,满足企业AI算力需求,客户合同期限已延长至8年。此次RPO激增印证甲骨文从传统数据库厂商向AI云服务商转型,未来增长将深度绑定AI赛道。
斯坦福大学:大模型预训练优化器研究,矩阵型加速30-40%,AdamW仍是稳健首选
大模型预训练效率瓶颈下,优化器选择至关重要。斯坦福大学研究表明,AdamW仍是稳健首选,而矩阵型优化器经严格调优可实现30-40%单步加速。传统评估存在超参数调优偏心(如Lion需特定衰减值)和小规模测试误导(小模型加速比随规模衰减),需在大模型全周期评估最终性能。矩阵优化器通过预条件矩阵动态调整梯度,Muon以低秩近似、Soap以分块对角等方式平衡效率与精度。实际应用中,AdamW适合多数场景,矩阵优化器推荐用于大规模预训练且需严格调优。