AIPMGO

蚂蚁集团与人大联合发布业界首个原生MoE架构扩散语言模型LLaDA-MoE 即将开源

前沿资讯

蚂蚁集团与人大联合发布业界首个原生MoE架构扩散语言模型LLaDA-MoE 即将开源

蚂蚁集团与人大联合研发业界首个原生MoE架构dLLM——LLaDA-MoE。该模型基于20TB数据训练，性能比肩主流自回归模型，推理速度有数倍优势，即将完全开源。其融合动态路由与扩散机制，在代码生成、数学推理等任务表现突出，为AI领域提供新研究方向与高效解决方案。

2025-09-12

字节跳动发布AgentGym-RL：多轮智能体强化学习框架，摒弃监督微调性能超商业模型

学术论文

字节跳动发布AgentGym-RL：多轮智能体强化学习框架，摒弃监督微调性能超商业模型

字节跳动推出业界首个统一多轮智能体强化学习框架AgentGym，采用纯强化学习路径，无需监督微调，智能体通过与环境交互自主掌握多样化任务。框架含AgentEvo环境集合及模块化设计，覆盖网页交互、游戏策略、具身智能、科学数据分析等27项任务，多项核心指标超越主流商业模型。

2025-09-12

vLLM与Thinking Machines组建新研发团队加速开源推理引擎生态建设与大模型服务能力提升

圈内热议

vLLM与Thinking Machines组建新研发团队加速开源推理引擎生态建设与大模型服务能力提升

vLLM作为开源推理引擎明星，凭借PagedAttention技术突破LLM推理效率瓶颈。近日核心开发者Woosuk Kwon携手Thinking Machines组建新团队，聚焦Blackwell GPU适配、分布式推理优化及万亿参数模型支持，加速开源生态建设，助力企业低成本部署大模型，推动AI应用落地“最后一公里”。

2025-09-12

Skypilot研究：网络与存储优化让分布式生成式AI训练提速10倍，打破GPU性能瓶颈惯性思维

学术论文

Skypilot研究：网络与存储优化让分布式生成式AI训练提速10倍，打破GPU性能瓶颈惯性思维

生成式AI训练中，网络与存储性能是被低估的隐藏瓶颈。Skypilot团队实验显示，在不更换GPU、不修改代码的情况下，仅优化网络带宽（10Gbps→100Gbps）和存储类型（标准云SSD→本地NVMe），分布式训练速度可提升10倍，打破“GPU决定一切”认知。这一发现凸显数据传输与读取效率的关键作用，Skypilot框架助力简化基础设施优化，为AI训练提速提供新路径。

2025-09-12

NVIDIA发布SATLUTION：LLM自主进化SAT求解器

前沿资讯

NVIDIA发布SATLUTION：LLM自主进化SAT求解器

布尔可满足性问题（SAT）作为NP完全问题，是芯片验证、漏洞检测等领域的技术基石。传统SAT求解器依赖专家手工优化，面临代码复杂、迭代低效瓶颈。NVIDIA推出SATLUTION框架，以LLM驱动完整代码库进化，通过AI自主迭代与分布式验证，在国际竞赛中超越人类冠军方案，多场景性能领先，开启AI重塑复杂系统开发新范式。

2025-09-12

蚂蚁百宝箱发布Tbox超级智能体：多智能体协同驱动软件业进入“成果即服务”新纪元

产品速递

蚂蚁百宝箱发布Tbox超级智能体：多智能体协同驱动软件业进入“成果即服务”新纪元

蚂蚁百宝箱发布Tbox超级智能体，以多智能体协同推动AI向成果即服务（SaaO）跃迁。用户通过自然语言指令，无需代码即可分钟级获取PPT、网页等专业成果，支持按成果计费，重塑AI价值交付逻辑。

2025-09-12

Databricks AI负责人Naveen Rao离职创业瞄准AI计算成本瓶颈

市场动态

Databricks AI负责人Naveen Rao离职创业瞄准AI计算成本瓶颈

Databricks前AI负责人Naveen Rao离职创业，新公司聚焦AI算力成本优化，获Databricks战略投资。当前AI算力成本成行业瓶颈，推理成本占比超60%且持续增长，其将通过硬件架构创新破局。作为连续创业者，Rao过往项目曾推动AI训练部署成本下降，新方向或加速AI技术普及。

2025-09-12

Backprompting技术革新LLM健康建议防护栏：小模型准确率超GPT-4o

学术论文

Backprompting技术革新LLM健康建议防护栏：小模型准确率超GPT-4o

LLM健康建议安全需防护栏保障，数据稀缺成技术落地瓶颈。IBM提出Backprompting技术，通过四步流程生成合成不良数据，破解数据难题。其训练的1000万参数小模型健康建议识别准确率超GPT-4o，推动医疗等垂直领域AI安全防护普及，为AI安全提供新范式。

2025-09-12

YC W25新秀Adam AI：AI驱动CAD，以语言指令重塑物理世界设计流程

产品速递

YC W25新秀Adam AI：AI驱动CAD，以语言指令重塑物理世界设计流程

Adam AI是旧金山Y Combinator初创公司，以“语言即设计”的Text-to-CAD技术革新CAD设计。用户通过自然语言或语音即可生成CAD模型，大幅降低3D打印等领域设计门槛，兼容专业软件提升工程师效率，正重塑物理世界数字化构建方式。

2025-09-12

谷歌AI新突破：融合LLM与树搜索，自动生成专家级科研软件性能超越人类

前沿资讯

谷歌AI新突破：融合LLM与树搜索，自动生成专家级科研软件性能超越人类

谷歌AI团队2025年9月发布里程碑成果：科研软件自动生成系统，通过LLM与树搜索算法深度结合，实现多源知识整合与代码迭代创新。该系统在基因组学（单细胞RNA测序性能提升14%）、地理空间分析（卫星图像分割IoU超0.80）、神经科学（模型训练提速数级）等多领域突破，推动AI从自动化工具升级为科研创新“思想引擎”。

2025-09-11

全球最快开源大模型K2 Think推出：推理速度突破2000 tokens/秒，刷新性能纪录

前沿资讯

全球最快开源大模型K2 Think推出：推理速度突破2000 tokens/秒，刷新性能纪录

K2 Think开源大模型发布，推理速度突破2000 tokens/秒（最高2730.4），成已知最快开源大模型之一。基于通义千问Qwen 2.5-32B架构，数学推理表现优异（AIME’24得分90.83），依托六大技术创新支撑高速与精准。基于通义千问架构，已在HuggingFace等开源平台发布，助力AI技术普及。

2025-09-11

Vidu Q1参考生图全球上线：支持7张参考图刷新AI生图技术上限

产品速递

Vidu Q1参考生图全球上线：支持7张参考图刷新AI生图技术上限

Vidu Q1参考生图全球上线，支持一次性上传7张参考图，远超谷歌Nano Banana等主流工具（最多3张）。多图融合助力创意合成、时尚穿搭、专业海报及跨次元合照，主体一致性强，操作简洁，可生成1080p高清图。现免费试用，开启AI图像创作新可能。

2025-09-11

腾讯开源混元图像2.1：原生2K生图性能逼近商业模型，Hugging Face榜单跃居全球第三

前沿资讯

腾讯开源混元图像2.1：原生2K生图性能逼近商业模型，Hugging Face榜单跃居全球第三

腾讯混元图像2.1开源引发全球关注，原生2K生图达商业级水准，支持中英文复杂语义。采用DiT架构与双文本编码器，提升生成效率与质量，Hugging Face榜单快速攀升至第三。开源生态完善，助力开发者高效创作，推动视觉AI普惠化。

2025-09-11

AFAC2025金融智能大赛：中国AI应用创新加速见证行业转折

前沿资讯

AFAC2025金融智能大赛：中国AI应用创新加速见证行业转折

AFAC2025金融智能大赛揭示中国AI应用创新加速，全球人才归巢推动硬核技术落地。参赛项目融合光通信、卫星遥感等跨界技术，实现反洗钱效率提升3-5倍、风险识别率从10%升至55%，保险赔付周期缩至数天，凸显中国在AI金融应用落地的全球领先优势。

2025-09-11

上交大开源MobiAgent：全栈移动端AI Agent工具链

前沿资讯

上交大开源MobiAgent：全栈移动端AI Agent工具链

上海交大IPADS实验室开源MobiAgent移动端AI智能体工具链，含数据收集、训练、推理加速、自动评测四大模块，支持定制手机AI助手。7B参数模型性能超越GPT-5，AgentRR“肌肉记忆”技术提速2-3倍，端侧处理保障隐私，低功耗降30%-50%能耗，全流程工具链大幅降低开发门槛。

2025-09-11

顶级大模型“扰动文字”测试集体“翻车”

学术论文

顶级大模型“扰动文字”测试集体“翻车”

顶级视觉语言模型（如GPT-4o、Gemini等）在扰动文字前识别能力大幅下降，人类却可轻松解读，暴露AI非标准文本理解局限。因AI依赖模式匹配缺乏结构理解，在中文成语切割重组、英文彩色叠加等实验中近乎崩溃，且在多书写系统中普遍存在。此缺陷致教育、文献处理受限，更存安全漏洞，攻击者或用扰动文字绕过AI审查。研究建议通过强化结构先验知识、扩充复杂训练数据等改进，揭示AI与人类认知本质差异。

2025-09-11

YouTube多语言音频功能全面开放创作者国际观看时长显著增长

产品速递

YouTube多语言音频功能全面开放创作者国际观看时长显著增长

YouTube多语言音频功能已面向全球创作者开放，支持AI生成40+语言配音，大幅降低国际分发成本，非主要语言观众观看时长平均增超25%。配合多语言缩略图测试及数据洞察工具，助创作者精准定位全球受众，提升国际互动率与观看量，突破语言壁垒触达更广阔市场。

2025-09-11

Recall.ai发布桌面录制SDK：无需会议机器人，推动会议数据API化变革

产品速递

Recall.ai发布桌面录制SDK：无需会议机器人，推动会议数据API化变革

Recall.ai桌面录制SDK革新会议录制技术，告别传统机器人参会模式，终端本地采集+云端API输出，攻克大规模高可靠录制难题。具备动态发言人识别、智能视频合成等核心能力，提升数据质量与AI处理效率，服务金融、医疗、销售分析等2000+企业客户，低延迟高可靠，合规保障数据安全，助力企业挖掘会议数据价值。

2025-09-11

英伟达发布突破性Rubin CPX GPU：重塑百万级长上下文AI推理

前沿资讯

英伟达发布突破性Rubin CPX GPU：重塑百万级长上下文AI推理

英伟达推出专为百万级长上下文推理设计的Rubin CPX GPU，采用解耦式架构与长序列处理单元(LSPU)，实现3倍注意力机制处理速度，端到端延迟降低40%、能耗下降55%。其128GB GDDR7内存与动态资源分配技术，赋能代码生成、法律研究、长视频分析等场景，重塑AI推理基础设施，预计2026年底上市。

2025-09-11

ETH与MATS发布突破性研究：实时检测AI长文本实体幻觉筑牢高风险领域安全防线

学术论文

ETH与MATS发布突破性研究：实时检测AI长文本实体幻觉筑牢高风险领域安全防线

大模型“幻觉”问题制约医疗、法律等高风险领域应用，ETH与MATS团队提出创新实时检测方案。该方法突破传统局限，实现实体级精准识别，低成本实时标记错误实体，无需昂贵外部验证，支持700亿参数模型。可提升AI生成内容可靠性，相关数据集与代码已开源，助力高风险领域安全应用。

2025-09-11

1 … 10 11 12 13 14 … 18