工具调用[14]
谷歌推出AP2协议 为AI助手与商家安全合规交易奠定技术基础
谷歌推出AP2协议,赋能AI助手实现安全自动支付,重塑商业交互。其核心为“授权书”机制,明确用户、AI身份及商品类型、价格上限等约束,基于W3C可验证凭证防篡改。联合万事达、银联国际、阿里等60+企业,覆盖支付、电商等领域,推动AI从信息处理迈向价值交换,开启智能支付新时代。
MCP社区激辩工具信任标注:SEP-1487提案提议新增trustedHint明确安全边界
Model Context Protocol(MCP)协议在AI工具生态扩张中面临工具安全与数据信任挑战。SEP-1487提案引发热议,核心为新增trustedHint注解明确工具信任状态,默认“不信任”以解决当前协议信任定义模糊问题。这场争辩不仅关乎技术细节,更推动AI工具生态对安全边界的深层探索。
Rowboat发布AI辅助IDE 推动多智能体系统开发进入新时代
多智能体系统成AI开发新趋势,破解单智能体上下文污染、知识盲区等痛点。Rowboat IDE作为一站式开发工具,以“AI工作流操作系统”定位,通过Skipper自动拆解任务、集成数百种外部工具、RAG增强信息准确性,降低开发门槛。支持会议助手、客户支持等场景,无需编写“胶水代码”,让多智能体协作开发更高效。
百度ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace文本模型趋势榜
百度ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球文本模型趋势榜,总榜位列第三,中国AI技术再获国际认可。该模型采用MoE架构与稀疏激活设计,210亿总参数仅激活30亿,实现轻量高性能。支持128K长上下文(约25万字)及高效工具调用,开源降低应用门槛,推动金融、医疗等复杂场景落地。
Anthropic Claude AI重大升级:可直接生成Excel/PPT/PDF办公文件
Claude AI迎来重大升级,新增服务器端隔离沙箱环境,支持直接生成和编辑Excel表格、PowerPoint演示文稿、PDF文档等20+格式办公文件,从智能顾问升级为主动协作者,大幅缩短需求到交付流程。通过独立Linux容器、完整工具链及原生文件引擎,实现“对话即生产力”——用户仅需自然语言描述需求,即可自动完成数据清洗、图表生成、格式排版,3分钟内交付可下载的成品文件,避免多工具切换。实测电商数据可视化、财务模型搭建等场景,可快速生成带动态公式的Excel或含趋势图表的PPT。相比ChatGPT等工具,其优势在于原生格式兼容、独立沙箱数据自动销毁保障安全,且直接输出成品文件。目前Max/Team/Enterprise版本已开放预览,Pro版即将上线,助力企业用户提升办公效率,实现人机协同新体验。
MIT团队DSPy框架:以模块化编程重塑LLM应用开发流程
DSPy框架是MIT主导的开源LLM应用开发工具,以“签名式编程”为核心,通过结构化代码替代传统提示词工程,显著提升复杂AI任务开发效率。其“签名-模块-优化器”三位一体架构,支持任务接口标准化(签名定义输入输出)、LLM调用逻辑封装(内置ChainOfThought、ReAct等模块)及自动化性能优化(如BootstrapFewShot、GEPA等工具),解决了提示词碎片化、系统难维护等痛点。GEPA框架结合遗传算法与帕累托优化,实现多目标(准确率、延迟等)平衡,适用于客服智能体等复杂场景。实战案例Support-Sam客服智能体基于DSPy构建,以不足200行代码实现工单分类、知识库检索等全流程自动化。目前,Shopify、DeepLearning.AI等机构已将其用于生产环境,推动LLM应用开发从“作坊式调优”迈向工程化、模块化新阶段。
Interfaze LLM Alpha:模块化多模态架构成开发者工具链新选择
2025年9月推出的Interfaze LLM Alpha,是专为开发者打造的多模态AI工具链。其核心创新在于Router-Modules架构,通过“小模型专精+大模型统筹”模式,高效解决结构化数据提取、网页信息抓取、代码安全执行及OCR解析等开发痛点,冷启动延迟降低75%,内存占用节省70%。工具兼容OpenAI API协议,开发者可无缝迁移现有应用,无需重构代码。实测显示,其LinkedIn公司描述抓取准确率达92%,结构化数据提取F1值95.3,成本较GPT-4.1低57%,适合高频爬虫与批量处理场景。作为模块化架构代表,Interfaze推动AI模型从“参数竞赛”转向“架构优化”,为开发者提供高效、低成本的多模态开发解决方案。
上海AI Lab发布自主科学发现综述,提出Agentic Science框架并上线Intern-Discovery平台
上海人工智能实验室(上海AI Lab)联合顶尖机构发布综述《A Survey on Autonomous Scientific Discovery》,首次提出“Agentic Science”(科研智能体)理论框架,揭示AI从“被动工具”到“主动科研驱动者”的进化路径,标志科学研究迈入AI自主发现新纪元。综述将AI科研角色划分为四阶段:Level 1计算工具(如AlphaFold)、Level 2自动化助理、Level 3自主合伙人(如斯坦福Coscientist系统7分钟合成药物)、Level 4生成式架构师(如伯克利A-Lab 8个月发现41种新材料)。
AI科研智能体依托规划推理、工具使用等五大核心能力,通过动态闭环科研流程,已在生命科学(酶催化效率提升10倍)、材料科学(缩短超导材料发现周期)等多领域突破。上海AI Lab同步上线的Intern-Discovery平台,兼容38种实验室设备接口,支持AI直接操控硬件,降低自主科研门槛,推动跨学科协作。该综述为AI驱动的自主科学发现提供理论蓝图,开启科研范式革新新阶段。
Slashy AI:自然语言跨应用自动化,解放办公30%耗时
Slashy AI:跨应用智能执行者,破解职场多应用切换效率困境。据调研,职场人日均切换8-10个应用,30%工作时间耗于重复数据搬运。Slashy AI通过连接Gmail、Notion、LinkedIn等15+主流办公应用,以“自然语言驱动的自动化”实现跨平台任务主动执行,从被动回答转向主动行动。其自研工具链直连应用底层API,单一智能体架构提升任务准确性,错误率较多智能体降低40%,响应速度提升30%。对比Zapier需手动配置、ChatGPT仅输出信息,Slashy可动态拆解任务(如“整理会议attendees背景生成Notion文档”),自动调用工具完成闭环。典型场景如会议背景生成,5分钟替代1小时人工;LinkedIn批量获客自动筛选发送邮件。用户反馈重复性操作减少60%,每天多2小时深度工作。现公测中,免费版每日100积分,企业版提供定制化方案,助力职场人告别复制粘贴,提升办公效率。
Anthropic Claude Code四个月11.5万用户:揭秘“自用自改”产品增长逻辑
Anthropic的Claude Code成2025智能编程赛道黑马:发布四月用户破11.5万,73%为付费企业用户,从Cursor夺取38%市场份额,周活增长12%。其秘诀在于“自用自改”哲学:团队60%工作时长用产品,24小时反馈bug、36小时修复,红队测试组通过极端场景训练,使复杂边界案例正确率提升27%。面对“智能退化”争议,48小时推出Expert Mode,专业用户留存回升至92%。产品以“极简入口+深度扩展”设计,从CLAUDE.md上下文注入演进到Hooks系统与子智能体,支撑任务分解与多步骤执行。它正推动编程范式变革,从代码生成转向目标导向、交互式协作,重新定义开发者与AI协同模式。