文|未来图灵
“我们正处在一个开源的黄金时代。”在2025年4月底的首届Llama Con开发者大会上,Meta首席产品官Chris Cox高调公布了Llama系列模型的成绩,他表示其“开源”人工智能模型家族Llama的下载量已达到12亿次,2025年3月中旬,该模型的下载量就已突破10亿次。
然而,就在两年前,开源还被多数科技巨头视为“难以商业化的理想主义”。2022年,Chris Cox在接受《The Information》采访时曾直言:“当你试图将模型商业化时,开源会带来巨大挑战。”
彼时,Meta、谷歌等公司仍将AI模型视为核心壁垒,开源意味着技术优势的流失。
转折点发生在2023年,Meta率先拆掉围墙,开源Llama 1,随后在7月发布可商用的Llama 2。压力传导至整个行业。
随后微软2023年12月推出Phi系列,定位为高效替代方案;
谷歌在2024年2月开源轻量级模型Gemma,强调“开放协作”;
曾宣称“开源模型是智商税,永远应该选择闭源模型”的百度,也在2025年2月中旬宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
这场变革的本质并非技术共享,而是一场商业博弈。
开源从“边缘”到“大势”
在计算机技术的萌芽期,开源曾是行业默认模式。进入AI时代后,开源生态呈现出更复杂的博弈格局。
2022年8月,Stability AI开源的Stable Diffusion模型,自发布后,迅速点燃AI绘画圈的热情,大量开发者基于它进行创新。据GitHub年度报告显示,其代码仓库在2023年被fork(系统调用)次数突破25万次
与此同时,非营利组织Eleuther AI(美国最著名的数据开源组织之一)自2020年成立以来,通过发布GPT-J等系列开源大模型,建立了“开放预训练+社区协作”的创新研究范式,其2022年发布的GPT-NeoX-20B模型在Apache 2.0许可下开放全部权重,成为当时参数规模最大的可商用开源模型。
商业公司的策略则呈现分化态势,彼时的OpenAI、DeepMind则严守核心模型。
OpenAI创立之初期望实现AI民主化,但后续发展中战略有所转变。2019年马斯克因战略分歧退出后,公司结构改变,重心倾向商业化。从GPT-1的完全开源,到GPT-2部分开源后因担忧被不良利用而未完全开源,再到GPT-3闭源并发布未公开的Beta版API。
DeepMind同样对其核心模型采取较为封闭的策略,虽在某些研究成果上有影响力,但核心技术并未广泛开源,不过在2024年5月14日,其研发人员宣布将在6个月内发布alphafold3(包括权重)模型以供学术界使用,其研究总监Pushmeet Kohli表示“这是为了加速生命科学领域的集体突破”。
中央财经大学数字经济融合创新发展中心主任陈端曾表示,“开源模型的崛起改变了整个AI行业的竞争格局,巨头们意识到,如果不参与开源,就可能会失去在开发者社区的话语权,进而影响到整个生态系统的构建。”
中国AI企业是跟进还是突围?
中国企业正试图通过差异化竞争实现突围。在通用大模型竞争日益激烈的背景下,中国企业另辟蹊径,选择深耕垂直场景的发展路径。
2025年1月28日,阿里巴巴达摩院宣布开源视觉理解模型Qwen2.5-VL,提供3B、7B和72B三个版本。据国际测评榜单Live Bench数据显示,其旗舰模型Qwen2.5-VL-72B在13项视觉任务中超越GPT-4o与Claude3.5。
此前,通义实验室负责人周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。
5月6日,国际权威大模型测评榜Live Bench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3斩获全球开源模型冠军。
大模型“六小虎”之一的阶跃星辰(StepAI)在不久前的2月18日,开源了两款阶跃Step系列多模态大模型,Step-Video-T2V视频生成模型和Step-Audio语音模型。阶跃星辰副总裁李璟对媒体表示,阶跃Step-Audio是业内首款产品级的开源语音交互模型。
“开源是面向开发者和面向应用的一种方式。视频生成模型(Step-Video-T2V)是目前开源社区参与量最大、效果最好的一类模型。大家对于文生图、文生视频的模型能力期待了很久,我们把这两个亮点模型贡献给开源社区,一起为全球开源社区贡献来自中国的多模态力量。”李璟在2025全球开发者先锋大会上说道。
开源的“阳谋论”
自媒体人卢克文在分析开源现象时指出,开源,是一个阳谋,它起到的是一个“强己”和“击敌”的作用。既增强自身生态影响力,同时削弱竞争对手的市场主导地位。
开源AI模型往往与企业的云计算业务深度绑定。阿里巴巴在开源通义千问大模型的同时,推荐用户使用阿里云的PAI(机器学习平台)进行训练和推理。
红杉资本在2024年12月9日发布的报告《AI in 2025:Building Blocks Firmlyin Place》中提到,Meta通过开源的Llama模型以及强大的分发平台Instagram、WhatsApp和Facebook,正在塑造一种全新的AI竞争模式,其开源战略使其在AI技术的传播与应用上占据独特优势。
开源策略的核心似乎不再是单纯的技术共享,而是通过降低使用门槛,扩大自身生态的覆盖范围。
开源大模型的训练和推理通常依赖高性能GPU集群,而Meta、微软等公司在开源模型的同时,也间接推动了英伟达等芯片厂商的市场增长。Meta在发布Llama 3时强调,该模型针对英伟达H100和AMD MI300X等GPU进行了优化。
DIGITIMES研究中心于2024年发布报告显示,2024年高端服务器GPU产值比重超过80%,预估将达到1022亿美元;2024年高端服务器GPU出货量将达到482万片,其中英伟达占有率92.5%,AMD公司占有率为7.3%。开源模型的普及进一步加剧了对高性能计算硬件的需求,使得芯片厂商成为开源浪潮的隐形受益者。
尽管开源模型允许自由使用和修改,但科技巨头仍通过技术标准和生态体系维持控制力。Llama 2采用一种慷慨的宽松式许可证,但禁止使用Llama来“改进其他任何大语言模型,Llama 2除外”,如果产品的月活跃用户(MAU)超过7亿,用户必须申请特殊的商业许可证。这一条款被业内人士解读为限制竞争对手直接使用其技术。
从种种迹象来看,开源潮的背后,似乎是一场关于生态控制权的暗战。巨头们“拆掉围墙”的同时,正在构筑更隐蔽的护城河。