1. 报告核心

2025年9月13日,在Inclusion·外滩大会AI开源见解论坛上,蚂蚁开源与Inclusion AI联合发布了《全球大模型开源开发生态全景与趋势报告2.0》。这份报告并非空泛的趋势预测,而是通过数据驱动的方式,对全球AI开源生态进行了一次“CT扫描”——基于GitHub全平台项目分析,采用OpenRank算法(一种综合考量Star、Fork、贡献者活跃度等维度的开源影响力指标)筛选出114个最受关注的项目,覆盖22个技术领域,聚焦AI Agent与AI Infra两大核心方向。

Tips:什么是OpenRank算法?
OpenRank是衡量开源项目影响力的重要指标,不同于单纯的Star计数,它综合考虑了项目的贡献者活跃度、代码更新频率、社区互动等多维度数据,能更客观地反映项目的真实价值和健康度。报告通过这一算法确保入选项目是生态中真正的“核心玩家”。

蚂蚁开源技术委员会副主席王旭在现场表示:“我们希望通过数据客观呈现生态现状,既为行业提供参考,也展现中国在AI开源领域的角色。”这份时隔百余天发布的2.0版本报告,相比5月的首版,更吸纳了开源社区的最新动态,堪称2025年全球AI开源生态的“全景快照”。

2. “年轻”项目主导的高速迭代时代

报告揭示的第一个核心趋势,是AI开源生态的“极度年轻”与“高速迭代”。数据显示,62%的入选项目诞生于2022年10月“GPT时刻”(ChatGPT发布)之后,平均“年龄”仅30个月。这意味着,当前全球AI开源的核心力量,几乎都是“GPT时刻”后爆发的新生项目。

这种“年轻态”背后,是技术创新的加速迭代。以模型训练框架为例,2023年主流框架的更新周期约为6个月,而2025年已缩短至2-3个月,新特性(如多模态支持、分布式训练优化)的上线速度远超预期。王旭指出:“这反映出AI开源生态的活力——没有固化的巨头,只有快速涌现的创新者,行业格局仍在剧烈演化中。”

3. 中美双核驱动的贡献力量

开源生态的繁荣,离不开全球开发者的共同推动。报告数据显示,参与114个核心项目开发的约36万开发者中,美国占比24%,中国占比18%,两国合计贡献超40%的核心力量,构成全球AI开源的“双核引擎”。印度(8%)、德国(6%)、英国(5%)紧随其后,形成“中美领跑,多极参与”的格局。

这一数据与GitHub历年Octoverse报告的趋势高度吻合——中美开发者始终是全球开源生态的绝对主力。例如,在AI框架、大模型工具链等核心领域,两国开发者贡献的代码量占比超过50%,直接影响着技术路线的走向。

国家/地区 开发者占比
美国 24%
中国 18%
印度 8%
德国 6%
英国 5%

4. 开源策略的“开放权重”与“闭源API”路径

尽管中美开发者共同主导生态,但两国厂商的开源策略却呈现明显分化。报告指出,中国厂商更倾向于“开放权重”的开源模型路线——即不仅开放代码,还公开模型权重(参数),开发者可直接基于权重进行微调或二次开发;而美国头部厂商则多采用“闭源API”模式,仅通过接口提供服务,不开放核心模型权重。

典型案例中,中国的百川智能、智谱AI、DeepSeek等均发布了开放权重的大模型,而美国的OpenAI(GPT系列)、Anthropic(Claude)、Google(Gemini API)等则以闭源服务为主。王旭用“数字积木”比喻这两种路径:“中国厂商更愿意把‘积木’(模型权重)共享出来,让开发者自由组合搭建新应用;而美国厂商更倾向于直接提供‘成品玩具’(API服务)。前者降低了创新门槛,后者则在商业化效率上更具优势。”

这种分化的背后,是对“生态建设”与“商业壁垒”的不同优先级选择。中国的开放策略催生了大量基于开源模型的应用创新(如垂直领域小模型、行业解决方案),而美国的闭源策略则在技术领先性和数据安全上更易把控,两者共同推动着全球AI生态的多元发展。

5. AI编程工具爆发

报告中最引人关注的趋势,是AI编程工具的爆发式增长。这类工具能自动生成、修改代码,甚至理解复杂需求并输出解决方案,成为2025年开源社区最热门的赛道。

从形态上看,AI编程工具主要分为两类:命令行工具(如Google的Gemini CLI)和集成开发环境(IDE)插件(如Cline)。前者以轻便灵活见长,适合快速调试和脚本编写;后者则深度整合开发流程,支持代码补全、错误修复、文档生成等全链路功能。

2025年新出现的AI编程工具平均获得3万以上开发者Star关注,其中Gemini CLI开源仅3个月,星标数已突破6万,成为增长最快的项目之一。蚂蚁开源团队观察到:“做模型的厂商(如Google)喜欢从命令行工具切入,因为能直接展示模型的代码理解能力;而注重用户体验的团队则从IDE插件入手,因为更贴近开发者日常工作流。两种路线正共同推动编程效率的‘革命’。”

工具名称 形态 开源时间 Star数量
Gemini CLI 命令行工具 3个月 60,000
Cline IDE插件 2025年 30,000+

报告预测,随着大模型代码能力的提升,未来程序员可能将60%以上的重复性工作(如基础功能开发、单元测试编写)交给AI工具,而专注于创意设计和复杂问题解决。这种分工模式的转变,有望重塑软件开发行业的人才需求和工作流程。

6. 技术趋势

蚂蚁开源同步发布的“2025大模型发展时间线全景图”,梳理了2025年以来主流厂商的技术进展,揭示了四大明确的技术趋势:

6.1 参数规模化:MoE架构突破计算瓶颈

模型参数在MoE(Mixture of Experts,混合专家)架构下持续扩大。传统模型中所有参数均参与计算,而MoE架构将模型分为多个“专家”子模型,输入仅激活部分专家,从而在控制计算成本的同时,将参数规模推向万亿级。例如,某头部厂商的MoE模型参数已达1.8万亿,但单次推理成本仅为同参数传统模型的1/5。

Tips:为什么MoE架构是参数规模化的关键?
传统大模型的计算量与参数规模呈正相关,参数越大,推理成本越高。MoE架构通过“稀疏激活”机制,让模型在“大容量”(参数多)和“高效率”(计算少)之间找到平衡,成为2025年大模型参数突破的核心技术。

6.2 推理能力提升:强化学习成关键路径

强化学习(RLHF,基于人类反馈的强化学习)成为提升模型推理(Reasoning)能力的重要手段。通过让模型从人类反馈中学习“思考过程”,而非仅关注结果,大模型在数学计算、逻辑推理、复杂任务拆解等方面的准确率提升了30%-50%。

6.3 多模态主流化:从“文本为主”到“万物皆可输入”

支持文本、图像、语音、视频等多模态输入的模型逐渐成为行业标准。例如,2025年发布的主流大模型中,80%以上支持至少3种模态,能同时处理“文字描述+图像生成+语音交互”等复合需求,应用场景从内容创作延伸到智能交互、工业质检等领域。

6.4 评价方式多元:主观与客观并行

模型评估不再依赖单一指标,而是主观投票(如人类对回答质量的打分)与客观评测(如MMLU、GPQA等标准数据集)并行。这种多元评价让模型能力的衡量更具包容性,既关注“准确率”,也重视“安全性”“实用性”等维度。

7. 未来展望

报告总结认为,全球AI开源生态正处于“加速变革期”。开放共享与闭源主导的路线分化,推动了不同技术范式的竞争与融合;AI编程工具的爆发预示着软件开发模式的深刻变革;而MoE架构、多模态、强化学习等技术则在持续拓展大模型的应用边界。

对于中国而言,在开源生态中的积极角色将进一步凸显——通过开放权重的模型策略,中国正成为全球AI创新的“基础设施提供者”,为开发者和中小企业降低技术门槛。正如王旭所言:“每一次技术迭代,都是全球开发者共同书写的未来。开源的价值,就在于让更多人参与到这场‘未来书写’中。”

随着开源社区的持续活跃,未来AI创新将更加多元、开放、协作,而数据驱动的生态洞察(如这份报告),则为行业把握技术脉搏、制定发展策略提供了重要参考。

参考链接

机器之心