1. Transformer之父的“逆潮流”选择:从商业项目到开源基础研究的战略转向
在AI领域,最近有一个名字再次引发热议——Ashish Vaswani。作为Transformer架构的核心发明者(正是这一架构支撑了ChatGPT、GPT-4等所有现代大模型),他的每一次动向都被行业视为风向标。而今年,这位AI权威做出了一个“逆潮流”的决定:彻底放弃Essential AI原有的企业财务自动化业务,将公司全面转向开源基础AI研究。
这一转型并非心血来潮。Vaswani在接受《Forbes India》采访时直言,当前AI行业正陷入“创新陷阱”:“当OpenAI、Anthropic这些巨头将技术锁在‘围墙花园’里,我们离真正的科学探索越来越远。”他的目标很明确——让Essential AI成为“西方世界的DeepSeek”,用开源模式重新点燃AI基础研究的火种。
2. 闭源AI的“创新悖论”:当商业化压倒科学探索
要理解Vaswani的选择,首先需要看清当前AI行业的“闭源困境”。近年来,随着大模型商业化落地加速,头部公司逐渐将资源向产品化倾斜:优化对话体验、开发API接口、抢占企业客户……这些动作虽推动了AI的应用普及,却也让基础研究沦为“配角”。
Vaswani在《Economic Times》的采访中尖锐地指出:“闭源模式正在阻碍科学进步。当一家公司掌握顶级算力和数据,却为了维护投资者利益而对技术成果严格保密时,整个行业的创新都会被拖慢。”更严重的是,这种模式导致“重复造轮子”——多家公司在相似方向上投入资源,却因信息不互通而难以突破瓶颈。
Tip:什么是“闭源AI”的核心问题?
闭源AI的本质是“技术垄断”:模型参数、训练数据、核心算法均不公开,开发者只能通过API调用功能,无法深入研究底层原理。这不仅限制了学术界的探索,也让中小企业难以参与创新,最终导致技术红利集中在少数巨头手中。
3. Essential AI的“重生”:从工具开发者到开源先锋的蜕变
Essential AI的转型之路并非一帆风顺。这家2022年成立的公司,最初聚焦于企业财务数据自动化分析,甚至已推出几款商业化工具。但2024年初,Vaswani突然向董事会提出“all in基础研究”的方案——令人意外的是,这一提议竟获得了资方的一致支持。
“投资者也看到了市场的真实需求。”Vaswani在官网公告中解释,“当企业和研究者都在寻找OpenAI的替代方案时,开源基础模型就是答案。”随后,AMD Ventures等机构宣布追加投资,而Essential AI的团队也迅速扩充:官网信息显示,其核心成员大多来自Google、Meta、OpenAI,平均拥有10年以上基础模型研发经验。
如今,Essential AI的使命已清晰地写在官网首页:“Building machines that understand the world to help humanity thrive”(构建理解世界以帮助人类繁荣的机器)。这不再是一家单纯的商业公司,而是一个以“开源普惠”为核心的研究机构。
4. 对标DeepSeek:为何这家中国公司成了西方开源标杆?
Vaswani多次在公开场合提到一个名字——DeepSeek(深度求索)。这家中国AI公司因开源模型“DeepSeek-V2”而闻名,而它正是Essential AI的“对标对象”。
那么,DeepSeek究竟做对了什么?在Hugging Face开源社区,DeepSeek-V2的介绍页显示,这是一个采用“混合专家(MoE)”架构的大模型:总参数2360亿,但实际激活参数仅210亿。这种设计让它在性能上媲美Llama 3 70B、GPT-3.5,训练和推理成本却降低了60%以上。更重要的是,DeepSeek将模型权重、训练代码全部开源,允许研究者自由修改和二次开发。
Tip:MoE架构为何重要?
“混合专家”(Mixture of Experts)是一种高效的模型设计思路:将模型分为多个“专家子网络”,输入数据仅由部分专家处理,而非全部参数激活。这既能提升模型容量(总参数),又能控制计算成本(激活参数),是当前开源模型实现“高性能+低成本”的核心技术之一。
Vaswani认为,DeepSeek的成功证明了“开源≠低质”:“他们用有限资源做出了世界级成果,靠的就是社区协作。这正是Essential AI要走的路——我们不追求‘最大参数’,而是‘最有价值的开源贡献’。”
5. “交叉补贴”商业模式:开源项目如何摆脱“用爱发电”?
开源项目的最大痛点是“钱从哪来”。过去,许多开源模型依赖捐赠或公益资助,难以持续。而Vaswani为Essential AI设计了一套“交叉补贴”模式,试图打破这一困境:
Essential AI商业模式拆解
业务类型 | 收费模式 | 核心作用 |
---|---|---|
开源基础模型 | 完全免费(含权重、代码) | 推动技术普惠,吸引社区贡献者 |
企业定制服务 | 按需求收费(如定制训练、部署) | 产生稳定收入,反哺开源研发 |
行业解决方案 | 授权合作(如医疗、教育场景) | 扩大影响力,验证技术落地价值 |
这种模式并不新鲜——Google靠免费浏览器+广告盈利、RedHat靠开源系统+企业服务赚钱,本质都是“基础产品免费获客,增值服务变现”。Vaswani在采访中强调:“闭源不一定带来更高回报。当开源模型成为行业基础设施,围绕它的生态收入将远超单一产品。”
目前,Essential AI已启动首个开源项目:一个针对科学计算场景的小参数模型(暂未命名),计划2025年底发布。团队透露,该模型将重点优化数学推理和文献分析能力,直接服务于科研人员。
6. 开源生态的“复利效应”:为什么说“共享”才是AI的未来?
Vaswani的坚持背后,是对“开源生态复利效应”的深刻理解。在闭源模式下,技术进步依赖单一公司的资源投入;而开源生态中,全球研究者可以“并行协作”——你优化训练效率,我改进推理速度,他补充多语言数据,最终形成“1+1>10”的创新合力。
这一点在行业数据中已得到验证:斯坦福HAI《AI Index Report 2024》显示,2023年开源大模型数量同比增长217%,其中超过30%的模型性能达到闭源模型的80%以上。Meta首席AI科学家Yann LeCun更是直言:“最安全、最强大的AI必然是开源的——没有任何一家公司能独自应对AI带来的所有挑战。”
对普通用户而言,开源的价值更直接。Vaswani举例:“当开源模型能在本地设备运行,偏远地区的孩子可以用它学习英语,小诊所医生能用它辅助诊断——这才是AI该有的样子:不是少数人的‘黑箱工具’,而是全人类的‘知识引擎’。”
7. 结语:从“技术垄断”到“科学共享”,一场关乎AI未来的选择
Ashish Vaswani的转型,本质上是一场“理想主义的实践”。当他放弃短期商业利益,选择站在开源阵营时,背后是对AI本质的追问:这项技术究竟该服务于资本,还是科学与人类?
Essential AI的故事才刚刚开始。目前,其团队已发表两篇基础研究论文,涉及“预训练阶段反思能力培养”“低资源多语言模型优化”等方向,均已开源在arXiv。而行业的反应也印证了Vaswani的判断——AMD、Intel等硬件厂商主动寻求合作,高校研究者开始提交代码贡献,甚至有闭源公司的工程师私下表示“期待Essential AI的模型”。
或许,正如Transformer论文中那句经典的“Attention is all you need”(注意力就是一切),AI的下一个突破点,可能不在于参数规模,而在于“开放与共享”的力量。当越来越多像Essential AI这样的机构加入开源阵营,我们离“AI普惠”的目标,或许就不远了。
参考链接
评论