智能体[57]
微软Anthropic深化合作:Claude模型全面接入Microsoft 365 Copilot,企业级AI添新动能
2025年9月,Anthropic与微软宣布将Claude Sonnet 4、Opus 4.1集成至Microsoft 365 Copilot,标志企业级AI进入“多模型协同”阶段。Claude模型以安全合规、长上下文推理及灵活代理构建为核心优势,差异化满足高端复杂任务(如战略分析)与日常办公自动化需求,助力企业提升办公效率与智能化水平。
Exa.ai完成8500万美元B轮融资 推出AI原生搜索API赋能智能代理
AI代理“实时数据大脑”来了!Exa.ai完成8500万美元B轮融资,推出专为AI设计的搜索API平台,通过RAG技术提供语义搜索、结构化摘要等“即插即用”服务,覆盖编程、金融、营销全场景。其在RAG基准测试中事实问答准确率达94%,远超传统搜索,成为AI代理高效开发的核心基础设施。
技术专家Simon Willison提出AI Agent安全核心原则:权限与信息作者对齐以防范提示注入风险
AI Agent技术快速发展,提示注入攻击因隐蔽性成主要安全威胁。知名专家Simon Willison提出权限对齐原则,主张Agent权限随摄入信息的作者权限动态调整,仅执行作者有权限的操作,从源头防御越权风险。该原则可有效应对直接与间接注入攻击,已被LangChain、Microsoft等框架采纳,为AI Agent安全提供新思路。
DeepSeek-AI发布V3.1 Terminus模型:强化Agent能力与语言一致性
2025年9月,DeepSeek-AI发布大模型新版本DeepSeek-V3.1 Terminus,聚焦语言输出规范性与智能体(Agent)工具使用能力升级:优化语言一致性解决中英文混杂问题,重构搜索Agent等工具链提升任务效率,经权威基准测试验证,通用推理与Agent任务得分显著增长,推动智能体向高效可靠方向迈进。
AI代理上下文工程实践:Manus项目的六大核心经验
AI代理规模化应用中,上下文管理是核心瓶颈。Manus团队总结六大上下文工程经验,通过KV-Cache优化、工具遮罩机制、外部记忆系统等,解决性能与成本难题,揭示AI代理从工具向智能体进化逻辑,助力高效落地。
阿里巴巴通义千问发布Qwen3-VL系列视觉语言模型 开源旗舰性能超越Gemini 2.5 Pro
2024年6月,阿里巴巴通义千问团队发布Qwen3-VL系列开源视觉语言模型,刷新业界视觉-文本交互认知,在复杂推理、工具协同、长内容理解等核心维度突破闭源模型。提供可直接商用版本,将视觉智能从“被动识别”推向“主动认知与执行”,为多模态AI产业化落地提供新可能,显著降低应用门槛。
亚马逊重兵布局AGI:华人科学家David Luan领衔旧金山实验室
亚马逊加速布局通用人工智能,2023年9月成立AGI SF Lab,由华人科学家David Luan掌舵,聚焦智能Agent技术研发。实验室依托电商与AWS的海量数据及算力优势,通过“健身房”实战训练与强化学习,推出Nova Act模型,可精准操作软件完成复杂任务,ScreeSpot测试界面定位准确率达93.8%。团队集结强化学习等领域顶尖人才,目标将Agent打造为智能交互中枢,巩固生态优势,角逐AGI赛道。
Circuit & Chisel获1920万美元种子轮融资,ATXP协议为AI智能体支付架桥
AI智能体自主支付难题迎来突破!2025年9月,Stripe前高管创立的Circuit & Chisel推出ATXP协议,获1920万美元种子轮融资,目标成为AI智能体的“支付HTTP”。该协议通过状态通道技术实现毫秒级、0.001美元以下微交易,零知识证明保护隐私,解决AI从“信息处理者”到“经济参与者”的关键障碍,有望催生数百亿美元智能体经济新生态。
斯坦福大学Paper2Agent:科研论文变身交互式AI智能体
斯坦福大学Paper2Agent框架,将静态科研论文激活为交互式AI智能体,通过多智能体协作解析论文与代码,整合知识、方法与工具,支持自然语言提问直接获取结果。解决传统论文理解门槛高、复用成本大难题,大幅降低知识迁移门槛,提升科研效率,推动科研协作从被动阅读转向主动对话新范式。
Windsurf发布Code-Supernova:智能编码模型开启200K上下文与图像输入新时代
Windsurf推出新一代智能编码模型Code-Supernova,以200K超长上下文窗口、原生图像输入能力为核心亮点,可处理大型代码库、直转设计稿/架构图为代码,搭配Agentic自我调试功能,直击复杂项目开发与跨界协作痛点。目前该模型限时向个人用户免费开放,刷新专用编码模型技术边界,为开发者工具生态带来新可能。