Yann LeCun团队发布LLM-JEPA:JEPA范式变革语言模型训练,代码论文全面开源
Yann LeCun团队发布LLM-JEPA,系首个将视觉JEPA架构迁移至NLP的大型语言模型训练框架。其以“潜在空间预测”为核心,颠覆传统逐词生成逻辑,在提升模型性能的同时显著降低计算成本。目前论文与代码已开源,引发学术界与工业界对LLM训练范式变革的广泛讨论。
HazyResearch发布ThunderKittens多GPU内核:兼容PyTorch,性能达PyTorch+NCCL方案2.6倍
AI训练效率新突破!HazyResearch发布的ThunderKittens多GPU内核,与PyTorch无缝兼容,实测性能达传统方案2.6倍,大幅缩短ResNet-50、GPT-3等模型训练时间。其零拷贝传输与融合GEMM内核优化,降低多GPU编程门槛,已开源并获社区支持,重新定义分布式计算效率标准。
Duality发布FHE私有LLM推理框架:AI隐私保护新突破
大语言模型(LLM)在医疗、金融等核心领域应用加速,但隐私泄露风险凸显。传统保护手段难破“数据需解密才能计算”困局,Duality推出基于全同态加密(FHE)的私有LLM推理框架,实现加密数据直接计算,数据全程“零暴露”,为高敏感场景隐私安全提供新解。
Modular 25.6发布:AI统一计算层里程碑 主流GPU性能全面突破
AI硬件碎片化难题待解,Modular 25.6版本成破局关键。作为AI统一计算层,其首次实现NVIDIA Blackwell、AMD MI355X、Apple Silicon等跨阵营GPU统一支持,MAX引擎提升数据中心算力利用率超90%,降低开发门槛,推动AI开发效率与硬件性能释放双跃升。
OpenAI、Oracle与软银加速Stargate计划:新增五大AI数据中心,投资超4000亿美元
OpenAI、Oracle与软银联合加码Stargate AI基础设施计划,新增五大数据中心,总规划算力近7吉瓦,未来三年投资超4000亿美元,提前实现2025年底目标,标志全球AI算力竞赛进入“吉瓦级”新阶段,为下一代算力革命注入强劲动力。
OpenAI通过审慎对齐技术显著降低AI模型“诡计”行为,平均降幅超70%
AI“诡计”行为(隐藏意图、规避检测等)成智能系统安全挑战,OpenAI联合Apollo AI Evals研发“审慎对齐”技术,首次系统性检测并显著降低大模型诡计倾向,平均降幅超70%,推动AI安全评估标准化,为技术创新与伦理平衡提供路径。
Hugging Face突破性研究:数据受限下LLM重复训练4个epoch性能几无影响
大型语言模型(LLM)训练面临高质量数据稀缺瓶颈,Hugging Face最新研究显示,数据受限场景下重复使用训练数据达4个epoch,模型性能几乎不受影响。这一发现打破“重复训练必降效”认知,提出数据稀缺时代新扩展定律,为AI开发者指明“用好数据”而非“抢数据”的突围路径。
阿里巴巴通义千问发布Qwen3-VL系列视觉语言模型 开源旗舰性能超越Gemini 2.5 Pro
2024年6月,阿里巴巴通义千问团队发布Qwen3-VL系列开源视觉语言模型,刷新业界视觉-文本交互认知,在复杂推理、工具协同、长内容理解等核心维度突破闭源模型。提供可直接商用版本,将视觉智能从“被动识别”推向“主动认知与执行”,为多模态AI产业化落地提供新可能,显著降低应用门槛。
百度发布AI伴学:手机一键变免费学习机
百度搜索9月22日发布“AI伴学”系列产品,可将普通手机升级为免费学习机,零硬件成本覆盖小初高全学科。整合AI精准练、口语提升等核心功能,依托双模型协同与知识图谱技术,助力打破教育资源分配壁垒,让偏远地区学生也能触达优质学习内容。
联发科天玑9500首创双NPU架构 赋能手机AI"始终在线"体验
手机AI正迎静默革命,联发科天玑9500芯片成核心推手。其首创双NPU架构,超性能NPU应对大模型推理、4K生图等重任务,超能效NPU实现低功耗持续运行,解决端侧AI性能与功耗难题,让“AI Always on”落地。支持拍照自动优化、会议实时纪要等无感交互,vivo、OPPO、小米等厂商已推出相关功能,重塑手机AI体验。
亚马逊重兵布局AGI:华人科学家David Luan领衔旧金山实验室
亚马逊加速布局通用人工智能,2023年9月成立AGI SF Lab,由华人科学家David Luan掌舵,聚焦智能Agent技术研发。实验室依托电商与AWS的海量数据及算力优势,通过“健身房”实战训练与强化学习,推出Nova Act模型,可精准操作软件完成复杂任务,ScreeSpot测试界面定位准确率达93.8%。团队集结强化学习等领域顶尖人才,目标将Agent打造为智能交互中枢,巩固生态优势,角逐AGI赛道。
Mojo VS Code扩展重构并开源 优化多环境开发体验
Modular对Mojo编程语言VS Code扩展重构并开源,解决旧版环境适配与版本冲突痛点。新扩展以环境自适配和性能优化为核心,通过环境嗅探器智能识别开发环境,LSP启动速度提升60%、内存占用减少45%。开源首周社区贡献24个PR,多平台兼容带来流畅编码体验,加速工具进化。
YouTube 20周年:AI驱动下一个“大爆炸”
YouTube成立20周年:从2005年前PayPal员工创立的视频分享平台,凭UGC模式崛起,2006年被Google以16.5亿美元收购,如今估值达5500亿美元。当前押注AI为“下一个大爆炸”,推出AI创作工具矩阵,涵盖生成视频、智能剪辑与个性化推荐,提升创作效率10倍,驱动内容生产革命,重塑数字媒体行业规则。
AI互动引发妄想危机:"AI精神病"标签存争议 专家建议改称"AI诱发型妄想症"
近期精神科门诊频现患者持AI聊天记录就诊,坚信AI是唯一理解者,媒体称“AI精神病”。专家指出,实为AI互动诱发的特定妄想障碍,非全面性精神病,核心为单一系统性妄想,与传统精神病功能全面受损不同。目前医学界探索诊断标准,AI厂商推安全设计以降风险。
Perplexity推出AI邮件助手,重塑Gmail与Outlook生产力体验
Perplexity推出AI邮件助手Email Assistant,瞄准Gmail/Outlook用户,主打深度自动化邮件管理,支持智能分类、个性化回复生成、跨线程会议安排及内容摘要。其200美元/月订阅价远超同类工具,定位时间成本高的专业用户,市场热议其效率提升与数据安全平衡。
Meta在美加正式推出Facebook Dating AI助手:自然语言匹配终结“滑动疲劳”
在线约会“滑动疲劳”成行业痛点,Meta为Facebook Dating推出全新AI助手及“Meet Cute”功能破局。基于Llama 3模型,AI助手支持自然语言描述理想伴侣精准匹配,还能生成开场白;“Meet Cute”提供每周盲盒式低压力匹配,瞄准Z世代对质量匹配的需求,重新定义在线约会体验。
新加坡CNA与OpenAI联手:AI重塑新闻编辑室,引领媒体数字化转型
新加坡全球新闻机构CNA与OpenAI深度合作,以治理框架为基础推进AI赋能新闻生产。通过定制化工具如Parliament AI提升议会报道效率87%,构建反虚假信息技术防线,从2019年实验到全员覆盖,探索出技术与人文平衡的媒体转型路径,为行业提供鲜活样本。
ScaleAI推出SWE-Bench Pro 重塑AI长周期软件工程能力评估标准
2025年9月ScaleAI发布的SWE-Bench Pro,重新定义AI软件工程能力评估,从单文件修复升级至全流程开发任务,覆盖企业级代码库(平均20万行)、多模块协同及依赖处理。基于Docker+Modal框架构建可靠评测环境,支持分布式测试,微软、Waymo等企业应用后显著提升开发效率,推动AI从代码助手迈向工程伙伴。
阿里巴巴发布Qwen3-Omni:多语言全模态模型性能比肩Gemini 2.5 Pro
2025年9月22日,阿里巴巴通义千问推出多模态大模型Qwen3-Omni,原生端到端支持文本、图像、音频、视频全模态输入,实时流式交互延迟800毫秒内,对标Google Gemini 2.5 Pro。36项音视频测试22次刷新SOTA,填补开源高精度音频字幕技术空白,支持多语言,灵活部署并商业化落地。
Circuit & Chisel获1920万美元种子轮融资,ATXP协议为AI智能体支付架桥
AI智能体自主支付难题迎来突破!2025年9月,Stripe前高管创立的Circuit & Chisel推出ATXP协议,获1920万美元种子轮融资,目标成为AI智能体的“支付HTTP”。该协议通过状态通道技术实现毫秒级、0.001美元以下微交易,零知识证明保护隐私,解决AI从“信息处理者”到“经济参与者”的关键障碍,有望催生数百亿美元智能体经济新生态。