人机协作[23]

慕尼黑工业大学GUIRepair登顶SWE-bench多模态榜单 自动化视觉软件缺陷修复迎来新里程碑

慕尼黑工大GUIRepair框架实现前端视觉bug自动修复突破,以多模态“看见即修复”理念,通过Image2Code和Code2Image组件实现视觉与代码双向理解,登顶SWE-bench Multimodal榜单,修复成功率35.98%刷新SOTA,开启多模态软件工程新范式,提升前端开发效率。

VS Code Insiders测试200K上下文窗口:GPT-5与Claude Sonnet 4迎来新突破

微软VS Code Insiders开启200K token上下文窗口实验,解决AI编程助手因上下文过长"断片"问题。该功能需搭配GitHub Copilot Chat使用,支持Claude 3系列超长上下文,可轻松处理数万行代码、跨文件逻辑关联,助力开发者实现全局视角开发,提升AI协作效率。

AI医疗平台Doctronic完成2000万美元A轮融资,以生成式AI推动从初筛到诊疗的“AI医生”服务普及

AI医疗平台Doctronic完成2000万美元A轮融资,Lightspeed领投。其“AI前置初筛+人类医生兜底”模式,依托生成式AI+代理式架构实现高效问诊,累计处理1500万次医疗对话,每周服务5万次,助力解决挂号难、偏远地区就医不便等医疗可及性痛点,推动“AI+医疗”创新落地。

OpenAI推出GPT-5-Codex:智能编程迈入新时代,Codex平台全面升级

OpenAI 2025年发布GPT-5-Codex,深度优化的AI编程助手。核心“agentic coding”实现从辅助到自主协作,能主动规划任务、处理复杂项目(如大规模重构),动态平衡效率与深度:简单任务token减93.7%,复杂任务推理时间翻倍。结合Codex CLI开源及IDE扩展,重新定义开发者与AI协作,提升开发效率。

全球首个商业化叠衣机器人Isaacs正式上岗洗衣房

全球首个商业化叠衣机器人Isaacs于旧金山Tumble Laundry洗衣房正式上岗,由前苹果AI高管团队创立的Weave Robotic研发。其搭载自主VLA模型,实现70%自主叠衣,AI主导+人工辅助提升效率,解决传统机器人痛点,开启智能叠衣服务商业化时代。

马拉维农民借AI聊天机器人Ulangizi应对气候危机,农业生产模式悄然变革

马拉维农民灾后借AI助手Ulangizi重获生机。这款基于LLaMA模型、依托WhatsApp的工具,提供病虫害诊断、种植管理及气候适应建议,助农户如Alex Maere改种土豆增收超800美元。Ulangizi推动经验种植转向科学管理,为非洲应对气候变化、农业数字化开辟新路径。

OpenAI董事长Bret Taylor:AI代理重塑客户服务,AI热潮再现互联网泡沫盛况

硅谷老兵、OpenAI前董事长Bret Taylor创立Sierra,以AI代理重塑客户服务。其AI代理具备自主性,可理解需求、访问企业系统执行复杂任务(如套餐变更),区别于传统聊天机器人。采用“按成功处理案例收费”模式,已助力企业处理70%-80%客服请求,平均耗时2分钟,大幅降本增效。

西湖大学发布AiraXiv与DeepReview:AI生成论文筛选评审前沿方案

AI生成论文激增致学术界“水文”筛查难题,西湖大学WestlakeNLP发布创新方案:AiraXiv预印本平台(首个AI生成论文专属渠道)与DeepReview AI审稿系统(模拟专家思考链)。二者协同实现AI论文分类管理、分钟级审稿,大幅提升筛选效率,破解传统审稿压力,引领AI时代学术评审新范式。

Cursor AI Tab模型升级:在线强化学习实现建议“少而精”,采纳率提升28%

Cursor AI Tab补全模型默认升级,采用在线强化学习技术,实现“更少建议,更高采纳率”。新模型通过用户交互实时学习,建议数量减少21%,采纳率提升28%,能个性化适配编码习惯,减少认知负担,助力开发者提升编码效率。

谷歌AI新突破:融合LLM与树搜索,自动生成专家级科研软件性能超越人类

谷歌AI团队2025年9月发布里程碑成果:科研软件自动生成系统,通过LLM与树搜索算法深度结合,实现多源知识整合与代码迭代创新。该系统在基因组学(单细胞RNA测序性能提升14%)、地理空间分析(卫星图像分割IoU超0.80)、神经科学(模型训练提速数级)等多领域突破,推动AI从自动化工具升级为科研创新“思想引擎”。