企业客户在部署使用大模型时,面临的经典问题是,选择开源模型,还是闭源模型。
从 Menlo Ventures 在 2025H1 更新的企业调研看,开源模式在性能方面仍然落后于前沿的闭源模式 9~12 个月。
围绕企业如何部署生成式 AI,在实现途径上有哪些选择?在甲子光年 2025 年的调研显示,Top 3 为:
(1) 调用第三方 API;
(2) 基于开源模型定制开发;
(3) 云服务集成。
其中 (1) 和 (3) 有利于云端,而 (2) 有利于推动本地算力的采购。
附图黑色是闭源的大模型 GPT-4 不同版本的价格(每百万次 Token 使用,输入输出 4:1),蓝色是开源的大模型 Llama3.1 405B 在 Together 和 Fireworks 上的价格。
开源 vs. 闭源,这个争夺推动了持续的价格下滑。而大模型成本的下滑,有助于生成式 AI 应用更早达到的经济性。
Chip Huyen 研究发现,GitHub 上拥有至少 500 颗星的 AI 项目库共计 845 个,由超过 20,000 名开发者贡献,做出了百万次的代码提交。2022 年下半年开始数量陡增。
从 AI 技术堆栈层次看,每个层次都有增加,相对而言基础设施层变化少一些,模型开发、模型库、AI 工程和 AI 应用占据了更高的数量。
在互联网上看到一张图,归纳了 2019 年以来代表性大语言模型(LLM)的上线时间表。2021 和 2022 有一个明显的加速过程。
值得留意的是,哪些模型是 “开源 Open Source”,哪些不是?就附图而言,开源的项目比例貌似在减少?
Linux 生态的关键三个层次:开发者、发行商、用户。
三个层级之间保持隔离,创建了一种非常灵活的内部市场(Internal Market)改善机制
开发者在软件质量上互相竞争,为的是获得发行商和用户的注意。发行商在选择策略上以及给软件带来的附加价值上竞争,为的是从用户那里赚钱。
内部市场的几个效应:(1) 没有哪个节点是必不可少;(2) 角色专业化减少开销并提升效率。
Eric Raymond 在讨论开源社区的激励时,提及了不同的做法(附图)。我认为看似矛盾其实也并不矛盾。
类似公司管理中,宽松的环境对于自律性很强的人,更有利于发挥能力,会体现惊人的创新和效率。
但对于不够自律,相对普通的业者,则意味着产出平庸;时间混久后,员工自己再就业市场的竞争力也会下滑。
从人数总量看,前者可能是后者的 1/100~1/1000。
开源项目和工业模式的比例可能也是如此,对于少数 Top 开源项目,比如 Linux 必然是超级成功。
但如果随机抽出同等数量的曾经开源的项目和商业开发项目,前者可能成功率很低,后者会
社区和生态合作等概念在现在已经成为主流。几乎每家公司都会说自己要打造一个开发者或用户社区之类,让这些社会力量可以加入产品的创新进来。
但很大比例的社区的最大特点就是:冷清,而且是极为冷清。根本没有多少开发者会参与进来。
如果要研究这背后的机制,最好的标杆案例可能就是开源世界,尤其是 Linux 社区的运作模式。
而这背后的故事则是,产品开发的两种经典模式:大教堂模式和集市模式。
以 Linux 社区为例,看似松散的开发队伍但质量还非常之好,除了若干天才程序员之外,还有更多是工程方面的原因
① 只要有足够多的 Beta 测试和合作开发者,几乎所有问题都会很快显现,并且自然有人会把问题解决;
② 高品质的 bug 反馈,要求报告者对源代码有了解:一个仅描述外部可见症状的 bug 报告,和一个直接关联到源码的分析型 bug 报告,两者的价值是天壤之别。
联想到 MVP 和迭代式开发,频度高快节奏是表象,核心是保持一定质量的迭代,而不是从垃圾中迭代垃圾。
#东施效颦现象无处不在
罗宾 5G 社群的成员应该都经历过 Web 2.0 时代,而一部分资深的成员经历了完整的 Web 1.0 时代。
现在也许要进入 3.0 即 Web3 时代。
当然,概念整体还处于早期的状态,还充满不确定性。就概念本身,Benedict Evans 认为可以从两个角度来类比:
(1) 角度 I:Web3 是下一代的互联网。
Web 1.0 时代是用户浏览网页,内容发布商赚钱;Web 2.0 时代是用户创造内容(博客,自己传视频等),互联网公司赚钱;Web3 时代可能是用户创造内容,用户来控制网络和赚钱。
区块链和去中心化体系设计是 Web