人机协作[23]

Cognition融资4亿估值102亿,AI编程代理赛道迎里程碑

2024年AI编程代理赛道迎来里程碑,Cognition公司完成4.1亿美元融资,投后估值达102亿美元,由硅谷顶级风投Founders Fund领投,Lux、8VC等现有投资者及Bain Capital Ventures等新资本加持。其核心产品Devin作为“端到端自动化编程代理”,颠覆传统代码辅助工具,具备从需求到部署的全流程开发能力,代码生成准确率超90%,可替代20%-30%常规开发任务,实现从“辅助”到“独立代理”的跨越。本轮资金将用于Devin技术研发与全球扩张,推动AI编程进入“人机协作”新纪元,凸显资本市场对AI重构软件开发模式的高度认可。

Anthropic Claude AI重大升级:可直接生成Excel/PPT/PDF办公文件

Claude AI迎来重大升级,新增服务器端隔离沙箱环境,支持直接生成和编辑Excel表格、PowerPoint演示文稿、PDF文档等20+格式办公文件,从智能顾问升级为主动协作者,大幅缩短需求到交付流程。通过独立Linux容器、完整工具链及原生文件引擎,实现“对话即生产力”——用户仅需自然语言描述需求,即可自动完成数据清洗、图表生成、格式排版,3分钟内交付可下载的成品文件,避免多工具切换。实测电商数据可视化、财务模型搭建等场景,可快速生成带动态公式的Excel或含趋势图表的PPT。相比ChatGPT等工具,其优势在于原生格式兼容、独立沙箱数据自动销毁保障安全,且直接输出成品文件。目前Max/Team/Enterprise版本已开放预览,Pro版即将上线,助力企业用户提升办公效率,实现人机协同新体验。

Chan Zuckerberg基金会rbio1:虚拟细胞软验证破解AI科学推理幻觉

传统AI在科学推理中常因缺乏自我验证陷入“幻觉”,导致科研资源浪费。美国Chan Zuckerberg基金会提出的rbio1框架,通过“虚拟细胞软验证”机制破解这一困局。其核心为LLM模块与高精度虚拟细胞模拟器的“双引擎”架构,形成“假设生成-虚拟验证-反馈修正”闭环,让AI从“凭空猜测”转向“基于证据推理”。实测显示,rbio1预测准确率提升21%,幻觉率降低65%,KEGG通路机制解释一致性达92%。在生物学研究中,已助力CRISPR实验效率提升60%,并有望延伸至材料科学、气候模型等领域,重塑实验科学研究流程,为AI科学推理提供“先模拟,再发言”的全新范式。

Alterego:“意念打字”革命,Silent Sense技术开启无声人机交互

Alterego:重新定义人机交互的“意念打字”革命。其搭载的“Silent Sense”技术,无需出声或动手,通过捕捉默念时口腔、喉部肌肉细微肌电信号,经深度神经网络实时解码为文字或指令,误码率低于5%。核心优势在于无声交互与免提操作,适配图书馆、会议、驾驶等多场景,且通过个性化校准和本地加密保障隐私。可提升办公效率、辅助飞行员等专业人士作业,更能为语言障碍者搭建沟通桥梁。2024年商用在即,Alterego正以“一念直达”的体验,开启人机交互新篇章。

Claude Code复活25年ftape驱动:Linux内核2.4至6.8迁移全解析

老旧磁带机驱动“复活”:AI助力Linux内核代码跨25年迁移,破解历史数据恢复难题。上世纪90年代广泛使用的QIC规格磁带机依赖Linux ftape驱动,因维护中断仅支持2.4内核,致政府档案、科研数据等历史资料恢复遇兼容性瓶颈。迁移至6.8内核需应对三大挑战:内核API重构(如register_chrdev转cdev_init)、硬件通信参数硬编码错误、构建系统模块化转型。 Anthropic的Claude Code通过AI驱动的代码现代化工具链,实现自动替换弃用函数、生成独立模块化Makefile、协助定位I/O端口基地址等关键调试,结合人类工程师提供硬件上下文与日志分析,成功完成驱动适配。对比显示,新版驱动API兼容性提升、支持跨版本编译,硬件检测成功率达100%。据IBM数据,AI可减少70%代码迁移时间,尤其擅长API替换、语法适配等模式化任务,人机协作(人类把控安全校验与硬件细节)成为遗留系统改造核心范式。该成果不仅解决历史数据恢复刚需,更验证AI在技术遗产保护中的实用价值。

Predoc获3000万美元融资:AI革新医疗文档管理,为医生减负

医疗行业长期受“文档泥潭”困扰,医生大量时间耗于病历检索与文书工作。为此,AI驱动的健康信息管理初创公司Predoc应运而生,其基于自然语言处理(NLP)的医疗记录自动化系统,可精准识别非结构化病历关键信息并生成标准化报告,助医生节省75%文档处理时间。近日,Predoc完成3000万美元种子轮及A轮融资,由Base10 Partners领投。全球医疗文档管理市场2025年预计达58亿美元,年增速12.3%,但AI渗透率不足15%,市场潜力巨大。Predoc凭借临床医生深度参与的产品设计,在提升效率的同时保障信息准确性,正推动医疗文档管理革新,让医生重归核心诊疗工作。

OpenAI解析AI幻觉:评估机制鼓励猜测,改革路径降低错误

AI幻觉是指AI生成自信却错误答案的现象,已成为AI信任危机主因。OpenAI研究显示,问题根源在于评估机制:当前以“准确率”为核心的规则,奖励“猜答案”、惩罚“承认无知”,导致模型偏爱“宁错勿空”。如SimpleQA测试中,早期模型为98.5%准确率付出12.7%幻觉率代价,优化评估后GPT-5幻觉率骤降至4.3%。此外,语言模型“预测下一个词”的训练逻辑,使其难辨“事实”与“模式”,低频事实易靠概率猜测。解决需重构评估(如惩罚自信错误、奖励弃权)、技术优化(置信度评分、验证链)及场景化动态调节。目前HaluEval 2.0等新基准推动行业变革,OpenAI已将“降低幻觉”纳入产品级建设,标志AI从“准确率崇拜”转向“可信协作”。

OpenAI开放ChatGPT对话分支功能:一键解决多思路探索难题

ChatGPT于2024年7月推出“对话分支”功能,打破单线程对话局限,支持用户在任意对话节点创建独立分支,实现主线与多探索路径并行。该功能通过轻量化触发(消息右侧↗️图标)、结构化管理(分支命名、跨设备同步)及上下文共享,大幅提升多思路探索效率:较传统方式,代码调试步骤减少60%,多版本回答管理成本降低80%。核心应用覆盖学术(多理论框架并行验证)、开发(多方案实时调试)、创作(剧情平行推演)等场景,技术底层采用类似Git的“对话树”模型,避免上下文污染。目前移动端仅支持查看,分支功能正推动AI从工具向“思维协作伙伴”进化,竞品如Google Gemini、Anthropic Claude已跟进相关研发。

Anthropic Claude Code四个月11.5万用户:揭秘“自用自改”产品增长逻辑

Anthropic的Claude Code成2025智能编程赛道黑马:发布四月用户破11.5万,73%为付费企业用户,从Cursor夺取38%市场份额,周活增长12%。其秘诀在于“自用自改”哲学:团队60%工作时长用产品,24小时反馈bug、36小时修复,红队测试组通过极端场景训练,使复杂边界案例正确率提升27%。面对“智能退化”争议,48小时推出Expert Mode,专业用户留存回升至92%。产品以“极简入口+深度扩展”设计,从CLAUDE.md上下文注入演进到Hooks系统与子智能体,支撑任务分解与多步骤执行。它正推动编程范式变革,从代码生成转向目标导向、交互式协作,重新定义开发者与AI协同模式。

2025外滩大会:沪蚂蚁集团主办 全球科技领袖共探重塑创新增长

2025 Inclusion·外滩大会将于9月10-13日在上海黄浦世博园区举办,以“重塑创新增长”为主题,汇聚16位院士、图灵奖得主及550余位全球科技领袖。大会设40余场论坛,聚焦AI、具身智能、芯片等前沿领域,主论坛将探讨大模型进化、智能体应用,王坚院士现场发布接入20万物联网设备的“城市神经计算平台”。5000平米“机器人小镇”展示100余款具身智能机器人,呈现优必选、傅利叶等企业硬件突破及行业三层产业链架构,中国占全球具身智能融资38%。新加坡、香港、上海三地联动推进金融科技协同,共建监管合规数据共享链。万平米科技展设概念-转化-应用三层体验,8000支战队角逐AI赛事,8家顶级创投现场对接。AI创作主题曲《Hello Future》等科技人文融合项目同步亮相,打造思想碰撞、技术展示与产业对接的科技嘉年华。