罗宾 5G 知识社群

知识块 #2503303VC5ML

大模型 API 的 “降价强度”

Robin | 2025-03-30

定价反映了供需和竞争关系。

投资银行 UBS 汇总了国内外代表性大模型服务商的 API 价格变化情况。

从整体看，一年前后时间单价降 80% 是规律。

API LLM 定价

数据来源 UBS

分享链接 http://robin5G.com/2503303VC5ML

延伸阅读

大模型 Martian

生成式 AI 发展大趋势下，各种大语言模型（LLM）如雨后春笋般出现。除了 OpenAI 的 GPT 和 Google 的大模外，还有各种开源模型。在 Hugging Face 上宣称有 30 万种模型可供选择。

对于应用开发商而言，一种主流的手段就是像使用云计算算力一样，通过互联网 API 去调用大模型服务商的模型能力，然后按照使用次数去付费。

由于不同大模型的计算质量以及品牌有差别，此类 AI 算力服务的价格也差别很大。例如，GPT-4 会比 GPT-3.5-Turbo 贵 30x 倍；GPT-4 比其他某些模型服务商贵甚至 100x 倍。

这就给应用商带来一个问题，对于 “普通的计算请求” 是否也需要用 “很贵的 GPT-4” ？可否用便宜一些的其他模型服务来代替 GPT-4。

创业公司 Martian 就在走类似事情，其提供了...

MaaS IDC

IDC 咨询公司研究显示，2025H1 中国大模型公有云服务市场的总调用量为 536 万亿 Token，而去年全年才 114 万亿 Token。仅 2025 上半年的总调用量就是去年全年的 5x 倍。

对于普通开发者来说，大模型部署的难度和经济性都面临挑战。而采用 API 调用的方式，MaaS（模型及服务）有广阔的应用前景。

Gen AI Andrew Ng

附图黑色是闭源的大模型 GPT-4 不同版本的价格（每百万次 Token 使用，输入输出 4:1），蓝色是开源的大模型 Llama3.1 405B 在 Together 和 Fireworks 上的价格。

开源 vs. 闭源，这个争夺推动了持续的价格下滑。而大模型成本的下滑，有助于生成式 AI 应用更早达到的经济性。