开源生态[24]
Perceptron发布Isaac 0.1:2B参数开放权重感知语言模型挑战大型模型性能极限
AI初创公司Perceptron发布感知语言模型Isaac 0.1,以20亿轻量级参数,通过统一编码框架甩掉视觉外挂,核心感知任务超越更大模型。开放权重策略加速物理AI落地,适用于机器人、智能家居等场景,开启效率革命新方向。
宇树科技开源UnifoLM-WMA-0:机器人动作预测通用世界模型
宇树科技开源世界模型UnifoLM-WMA-0,实现机器人动作预测与环境仿真一体化,通过双模式架构精准预判物理交互后果,降低试错成本,推动通用机器人从被动执行向主动决策升级。开源代码、模型权重及推理工具已上线GitHub,助力开发者快速应用于机械臂抓取、避障等场景。
Meta开源LlamaFirewall:LLM安全防护工具免费开放,防御越狱、目标劫持等威胁
Meta开源LlamaFirewall,为LLM筑起免费安全防线。针对越狱攻击、目标劫持、代码漏洞三大威胁,采用输入/推理/输出分层防御架构,实时拦截攻击提示词、审计推理过程、扫描代码漏洞。7亿MAU以下项目免费使用,助力开发者零成本保障AI安全。
阿里巴巴发布通义DeepResearch:全球首个完全开源Web Agent,300亿参数(激活30亿)实现OpenAI级性能
阿里巴巴通义实验室发布全球首个完全开源Web Agent通义DeepResearch,以"小参数撬动高性能"引发关注。其采用MoE架构,300亿总参数推理仅激活30亿,实现与OpenAI同类产品相当能力,代码及权重全开源且允许商用,三大权威基准验证性能,推动Web Agent普及落地。
蚂蚁开源发布《大模型开源开发生态全景图2.0》:AI开源生态百日巨变
蚂蚁《大模型开源开发生态全景图2.0》揭示AI开源生态100天剧变:TensorFlow被除名,PyTorch成开发者首选,生态版图替换率达35%。报告显示,AI开源正经历三大核心变革:从技术理想主义转向商业现实平衡,从功能堆砌走向性能内卷,从单点创新演变为全球格局分化,迭代加速与商业平衡成新趋势。
华为发布全新机器人学习开源Python框架Ark
华为诺亚方舟实验室等联合推出开源Python机器人学习框架Ark,旨在解决传统机器人开发依赖C/C++、学习门槛高、工具链分散等瓶颈。框架深度兼容PyTorch等AI生态,支持仿真与实机无缝切换,兼顾Python易用性与高性能,助力降低开发门槛、加速机器人自主智能创新。
语音语言模型(LSLM)破局:全球首个开源端到端框架LLaSO树立研究新基准
在语音语言模型(LSLM)面临架构碎片化、数据不透明等瓶颈时,北京深度逻辑智能推出全球首个完全开源、端到端语音大模型框架LLaSO。该框架含数据对齐(1200万样本)、指令微调(1350万样本)、评估基准(1.5万测试样本)三大核心组件,解决行业痛点,推动语音AI迈向开放可及未来。
OpenVision 2发布:极简生成式视觉预训练摒弃对比学习,性能效率全面超越CLIP
OpenVision 2掀起视觉预训练“减法革命”,以极简设计挑战CLIP霸权:砍掉文本编码器与对比学习,仅保留图像→描述生成任务,训练效率提升1.5-2倍、显存占用减半,性能媲美CLIP,在OCR、图表理解等细粒度任务更优。依托Recap-DataComp-1B v2高质量数据,推动视觉大模型降门槛。
Trigger.dev开源平台发布:状态快照技术赋能AI代理与工作流开发
Trigger.dev是Y Combinator孵化的开源AI工作流平台,基于CRIU技术实现任务"存档读档",解决Serverless超时限制与长时任务资源占用痛点。支持小时/天级任务无间断运行,等待时释放资源,跨服务器恢复,内存压缩率超60%。对比传统工具,冷启动减少83%,状态一致性更高,已助力AI视频生成、招聘匹配等场景降本增效,开发者可自托管或使用云服务快速接入。
全球大模型开源生态报告2.0发布:中美贡献超四成核心力量,AI编程工具爆发式增长
《全球大模型开源开发生态全景与趋势报告2.0》发布,蚂蚁开源联合Inclusion AI勾勒AI开源生态。数据显示,62%核心项目诞生于“GPT时刻”后,平均年龄30个月,迭代加速至2-3个月;中美开发者贡献超40%,成“双核引擎”。技术上,MoE架构突破参数瓶颈,多模态成主流,AI编程工具爆发重塑开发流程,中国以开放权重策略推动生态创新。