知识块 #2503303VC5ML
大模型 API 的 “降价强度”
Robin  |  2025-03-30

定价反映了供需和竞争关系。

投资银行 UBS 汇总了国内外代表性大模型服务商的 API 价格变化情况。

从整体看,一年前后时间单价降 80% 是规律。

数据来源 UBS
分享链接 http://robin5G.com/2503303VC5ML
延伸阅读
大模型 Martian

生成式 AI 发展大趋势下,各种大语言模型(LLM)如雨后春笋般出现。除了 OpenAI 的 GPT 和 Google 的大模外,还有各种开源模型。在 Hugging Face 上宣称有 30 万种模型可供选择。

对于应用开发商而言,一种主流的手段就是像使用云计算算力一样,通过互联网 API 去调用大模型服务商的模型能力,然后按照使用次数去付费。

由于不同大模型的计算质量以及品牌有差别,此类 AI 算力服务的价格也差别很大。例如,GPT-4 会比 GPT-3.5-Turbo 贵 30x 倍;GPT-4 比其他某些模型服务商贵甚至 100x 倍。

这就给应用商带来一个问题,对于 “普通的计算请求” 是否也需要用 “很贵的 GPT-4” ?可否用便宜一些的其他模型服务来代替 GPT-4。

创业公司 Martian 就在走类似事情,其提供了...

MaaS IDC

IDC 咨询公司研究显示,2025H1 中国大模型公有云服务市场的总调用量为 536 万亿 Token,而去年全年才 114 万亿 Token。仅 2025 上半年的总调用量就是去年全年的 5x 倍。

对于普通开发者来说,大模型部署的难度和经济性都面临挑战。而采用 API 调用的方式,MaaS(模型及服务)有广阔的应用前景。

Gen AI Andrew Ng

附图黑色是闭源的大模型 GPT-4 不同版本的价格(每百万次 Token 使用,输入输出 4:1),蓝色是开源的大模型 Llama3.1 405B 在 Together 和 Fireworks 上的价格。

开源 vs. 闭源,这个争夺推动了持续的价格下滑。而大模型成本的下滑,有助于生成式 AI 应用更早达到的经济性。