人工智能[37]

OpenAI与微软签署谅解备忘录 战略合作开启新篇章聚焦AI工具与安全

2025年9月,OpenAI与微软签署新阶段非约束性谅解备忘录,标志AI战略合作升级。双方合作基于超130亿美元投资,微软Azure提供算力支持,OpenAI技术赋能其产品;新协议以安全为核心原则,将深化技术研发与商业化,巩固行业领先地位,影响全球AI生态格局。

上海交大与字节跳动联合推出RhymeRL 强化学习训练速度提升2.6倍

强化学习训练中Rollout阶段效率瓶颈突出,上海交大与字节跳动联合发布RhymeRL框架,通过挖掘历史数据序列与长度分布相似性,创新HistoSpec批量验证与HistoPipe调度策略,实现端到端吞吐量2.6倍提升,且精度零损失,有效突破大模型训练效率瓶颈。

西湖大学发布AiraXiv与DeepReview:AI生成论文筛选评审前沿方案

AI生成论文激增致学术界“水文”筛查难题,西湖大学WestlakeNLP发布创新方案:AiraXiv预印本平台(首个AI生成论文专属渠道)与DeepReview AI审稿系统(模拟专家思考链)。二者协同实现AI论文分类管理、分钟级审稿,大幅提升筛选效率,破解传统审稿压力,引领AI时代学术评审新范式。

Project Fluently发布FluentlyQwen3-4B:引入“思考模式”的通用大模型

FluentlyQwen3-4B是基于Qwen3-4B-Base微调的通用大模型,核心亮点为可切换“思考模式”,能显式展示推理步骤提升可解释性,适配数学、编码等复杂任务。上下文扩展至131K tokens,兼容SGLang/vLLM等框架,支持多量化版本低门槛部署,在教育、开发等场景表现亮眼。

高德AI出行智能体“小高老师”月活破4亿 日调用量达12亿次

高德AI出行智能体“小高老师”上线不足一月月活破4亿,日调用达12亿次。支持自然语言交互,融合海量POI与实时数据,提供个性化行程规划、酒店预订等一站式服务,推动地图从工具进化为“先于思考”的智能决策伙伴,开启出行“智能体时代”。

ORCA-DL AI大模型突破海洋气候预测范式:厄尔尼诺预报时长20个月优于传统模型

海洋是地球气候关键“能量库”,传统物理模型因计算限制难突破。ORCA-DL AI大模型通过学习CMIP6数据,以神经网络捕捉海洋三维动态,实现厄尔尼诺20个月预警、海洋热浪精准捕捉及十年尺度稳定模拟,重塑气候预测范式,助力防灾减灾与气候决策。

Cursor AI Tab模型升级:在线强化学习实现建议“少而精”,采纳率提升28%

Cursor AI Tab补全模型默认升级,采用在线强化学习技术,实现“更少建议,更高采纳率”。新模型通过用户交互实时学习,建议数量减少21%,采纳率提升28%,能个性化适配编码习惯,减少认知负担,助力开发者提升编码效率。

字节跳动发布AgentGym-RL:多轮智能体强化学习框架,摒弃监督微调性能超商业模型

字节跳动推出业界首个统一多轮智能体强化学习框架AgentGym,采用纯强化学习路径,无需监督微调,智能体通过与环境交互自主掌握多样化任务。框架含AgentEvo环境集合及模块化设计,覆盖网页交互、游戏策略、具身智能、科学数据分析等27项任务,多项核心指标超越主流商业模型。

顶级大模型“扰动文字”测试集体“翻车”

顶级视觉语言模型(如GPT-4o、Gemini等)在扰动文字前识别能力大幅下降,人类却可轻松解读,暴露AI非标准文本理解局限。因AI依赖模式匹配缺乏结构理解,在中文成语切割重组、英文彩色叠加等实验中近乎崩溃,且在多书写系统中普遍存在。此缺陷致教育、文献处理受限,更存安全漏洞,攻击者或用扰动文字绕过AI审查。研究建议通过强化结构先验知识、扩充复杂训练数据等改进,揭示AI与人类认知本质差异。

谷歌AI新突破:融合LLM与树搜索,自动生成专家级科研软件性能超越人类

谷歌AI团队2025年9月发布里程碑成果:科研软件自动生成系统,通过LLM与树搜索算法深度结合,实现多源知识整合与代码迭代创新。该系统在基因组学(单细胞RNA测序性能提升14%)、地理空间分析(卫星图像分割IoU超0.80)、神经科学(模型训练提速数级)等多领域突破,推动AI从自动化工具升级为科研创新“思想引擎”。