延伸阅读
大模型
Martian
生成式 AI 发展大趋势下,各种大语言模型(LLM)如雨后春笋般出现。除了 OpenAI 的 GPT 和 Google 的大模外,还有各种开源模型。在 Hugging Face 上宣称有 30 万种模型可供选择。
对于应用开发商而言,一种主流的手段就是像使用云计算算力一样,通过互联网 API 去调用大模型服务商的模型能力,然后按照使用次数去付费。
由于不同大模型的计算质量以及品牌有差别,此类 AI 算力服务的价格也差别很大。例如,GPT-4 会比 GPT-3.5-Turbo 贵 30x 倍;GPT-4 比其他某些模型服务商贵甚至 100x 倍。
这就给应用商带来一个问题,对于 “普通的计算请求” 是否也需要用 “很贵的 GPT-4” ?可否用便宜一些的其他模型服务来代替 GPT-4。
创业公司 Martian 就在走类似事情,其提供了...
MaaS
IDC
IDC 咨询公司研究显示,2025H1 中国大模型公有云服务市场的总调用量为 536 万亿 Token,而去年全年才 114 万亿 Token。仅 2025 上半年的总调用量就是去年全年的 5x 倍。
对于普通开发者来说,大模型部署的难度和经济性都面临挑战。而采用 API 调用的方式,MaaS(模型及服务)有广阔的应用前景。
Gen AI
Andrew Ng
附图黑色是闭源的大模型 GPT-4 不同版本的价格(每百万次 Token 使用,输入输出 4:1),蓝色是开源的大模型 Llama3.1 405B 在 Together 和 Fireworks 上的价格。
开源 vs. 闭源,这个争夺推动了持续的价格下滑。而大模型成本的下滑,有助于生成式 AI 应用更早达到的经济性。
