RAG[11]
Elastic发布Agent Builder:破解Agentic AI数据上下文难题,加速企业智能化落地
Agentic AI成下一代AI效率革命核心,企业落地却受困于非结构化数据碎片化,导致AI上下文不准确。Elastic推出Agent Builder,以上下文工程破解难题,整合RAG升级与MCP协议技术,助企业激活散落邮件、文档等数据,实现私有数据与AI无缝协作,提升AI代理任务处理可靠性。
Airweave发布开源AI代理搜索工具 赋能LLM跨应用数据检索
数据孤岛制约AI代理效能,YC X25团队开源工具Airweave通过深度索引与智能检索技术,连接SaaS应用、数据库及文档系统,将分散数据转化为结构化知识块,提供语义搜索与关联分析能力,助力法律、编程、科研等场景AI代理高效理解数据,提升自动化决策与智能推荐效能。
Exa.ai完成8500万美元B轮融资 推出AI原生搜索API赋能智能代理
AI代理“实时数据大脑”来了!Exa.ai完成8500万美元B轮融资,推出专为AI设计的搜索API平台,通过RAG技术提供语义搜索、结构化摘要等“即插即用”服务,覆盖编程、金融、营销全场景。其在RAG基准测试中事实问答准确率达94%,远超传统搜索,成为AI代理高效开发的核心基础设施。
智跃Agent一体机:AI私人助理开启CEO管理新纪元
2025年AI硬件新品智跃Agent一体机,定位CEO专属AI助理,6.8万元本地化部署软硬件一体化设备。主动整合企业信息生成决策报告,穿透层级信息直达,实时监控项目动态,保障数据安全,助力管理者提升决策效率,开箱即用适配非技术背景管理层。
Rowboat发布AI辅助IDE 推动多智能体系统开发进入新时代
多智能体系统成AI开发新趋势,破解单智能体上下文污染、知识盲区等痛点。Rowboat IDE作为一站式开发工具,以“AI工作流操作系统”定位,通过Skipper自动拆解任务、集成数百种外部工具、RAG增强信息准确性,降低开发门槛。支持会议助手、客户支持等场景,无需编写“胶水代码”,让多智能体协作开发更高效。
腾讯优图开源Youtu-GraphRAG:图检索增强技术实现成本与效果双突破
GraphRAG是大模型处理复杂领域知识的核心技术,却面临成本高、推理弱、适配难痛点。腾讯优图开源Youtu-GraphRAG框架,通过Schema引导等三大技术创新,实现知识图谱构建成本降30%+、复杂推理准确率升16%+,跨领域适配成本降60%+,支持医疗多跳推理、企业知识库管理等场景,已开源助力多行业落地。
蚂蚁集团AQ-MedAI提出DIVER框架:RAG技术从关键词匹配迈向逻辑链推理
传统RAG技术依赖关键词匹配,在医学诊断、数学证明等复杂任务中难以挖掘深度逻辑关联。为此,BRIGHT基准应运而生,聚焦推理密集型检索评价。蚂蚁集团提出DIVER框架,通过“预处理→查询扩展→推理检索→重排序”四阶段协同,将推理嵌入检索全流程,实现从关键词到逻辑链的跨越。该框架登顶BRIGHT基准,nDCG@10得分45.8,在医学、数学、编程等场景显著提升检索准确率,且泛化性强。目前论文、代码及模型已开源,助力AI从信息匹配迈向逻辑推理,赋能医疗辅助诊断、教育解题等领域发展。
MIT团队DSPy框架:以模块化编程重塑LLM应用开发流程
DSPy框架是MIT主导的开源LLM应用开发工具,以“签名式编程”为核心,通过结构化代码替代传统提示词工程,显著提升复杂AI任务开发效率。其“签名-模块-优化器”三位一体架构,支持任务接口标准化(签名定义输入输出)、LLM调用逻辑封装(内置ChainOfThought、ReAct等模块)及自动化性能优化(如BootstrapFewShot、GEPA等工具),解决了提示词碎片化、系统难维护等痛点。GEPA框架结合遗传算法与帕累托优化,实现多目标(准确率、延迟等)平衡,适用于客服智能体等复杂场景。实战案例Support-Sam客服智能体基于DSPy构建,以不足200行代码实现工单分类、知识库检索等全流程自动化。目前,Shopify、DeepLearning.AI等机构已将其用于生产环境,推动LLM应用开发从“作坊式调优”迈向工程化、模块化新阶段。
Meta REFRAG框架:四步流程突破LLM长文本处理效率瓶颈,速度提升30倍
LLM在处理长文本时面临计算量平方级增长、响应延迟等效率瓶颈,Meta推出的REFRAG框架通过“智能压缩+选择性处理”创新思路破解难题。其四步流程(压缩、缩短、加速、选择)将输入文本16:1语义浓缩,输入长度缩短16倍,计算量减少至1/256,结合RL策略锁定关键信息,信息保留率达92%。实测显示,REFRAG在16k token场景首个token生成时间加速30倍,单次可处理8倍检索结果,GSM8K推理准确率提升80%,128k上下文节省89%计算量,在医疗病历分析、法律案例检索等RAG场景中吞吐量提升27倍,推动LLM长文本应用落地。
AWS S3 Vectors:向量存储成本革命与专业数据库协同之道
AWS S3 Vectors作为首个在S3对象存储中原生支持向量嵌入存储与查询的服务,正引发向量存储领域变革。其依托S3 Express One Zone存储类与分层索引架构,将存储成本压降至传统方案1/5,支持百亿级数据,冷查询延迟可满足归档场景需求。该服务并非专业向量数据库“终结者”,而是通过“冷数据归档+热数据实时服务”协同模式,与Milvus、Pinecone等形成互补:S3 Vectors承担90%历史数据低频检索,专业数据库负责10%高频热数据毫秒级响应,助力企业实现“成本-性能”动态平衡。适用于企业知识库、电商商品检索等场景,推动向量存储进入“成本民主化”阶段。