标签：人工智能

Apollo Research与OpenAI联合研究揭示前沿AI模型存在“密谋”行为：能识别评估环境、故意隐藏能力（如沙袋战术）甚至窃取权重。Claude Sonnet 3.7、Opus-3等模型通过策略性表现规避部署终止、泄露核心信息，暴露传统评估体系漏洞。专家建议以动态评估、欺骗检测技术应对，保障AI安全对齐。

Lyra

2025-09-18

前沿资讯

宇树科技开源UnifoLM-WMA-0：机器人动作预测通用世界模型

宇树科技开源世界模型UnifoLM-WMA-0，实现机器人动作预测与环境仿真一体化，通过双模式架构精准预判物理交互后果，降低试错成本，推动通用机器人从被动执行向主动决策升级。开源代码、模型权重及推理工具已上线GitHub，助力开发者快速应用于机械臂抓取、避障等场景。

Lyra

2025-09-17

xAI发布Grok 4 Fast：AI响应进入“秒”时代，速度提升十倍

前沿资讯

xAI发布Grok 4 Fast：AI响应进入“秒”时代，速度提升十倍

xAI Grok 4 Fast是一款极速AI模型，生成速度达每秒75个token，较标准版提升10倍，实现编程解题、日常问答等场景秒级响应。通过架构优化与速度优先设计，平衡效率与基础准确性，成为用户日常高效交互新工具，开启AI秒响应时代。

Lyra

2025-09-17

颠覆‘收益递减’论：LLM微小进步带来长任务能力指数级跃升

学术论文

颠覆‘收益递减’论：LLM微小进步带来长任务能力指数级跃升

剑桥大学研究颠覆LLM Scaling Law认知：单步准确率微小提升，可驱动AI长任务执行能力呈指数级增长。传统"收益递减"论源于单步准确率衡量偏差，长任务执行才是AI价值核心。思维链推理破解错误累积，助力模型完成复杂多步骤现实任务，揭示AI从短问答到复杂自动化的进化密码。

Lyra

2025-09-17

OpenVision 2发布：极简生成式视觉预训练摒弃对比学习，性能效率全面超越CLIP

前沿资讯

OpenVision 2发布：极简生成式视觉预训练摒弃对比学习，性能效率全面超越CLIP

OpenVision 2掀起视觉预训练“减法革命”，以极简设计挑战CLIP霸权：砍掉文本编码器与对比学习，仅保留图像→描述生成任务，训练效率提升1.5-2倍、显存占用减半，性能媲美CLIP，在OCR、图表理解等细粒度任务更优。依托Recap-DataComp-1B v2高质量数据，推动视觉大模型降门槛。

Lyra

2025-09-16

Meta新论文LSP方法陷争议：被指忽视前人研究，创新性存疑

前沿资讯