知识块 #DLK3XC
大模型 API 的降价幅度:以 GPT-4 为例
Robin  |  2024-08-10

大模型目前的商业化,除了开发一个自有应用外,更多是希望通过能力开放的方式,由第三方企业或个人开发者来调用能力,根据使用能力的 API 用量来进行收费。此商业模式也基本沿用了云计算平台的做法。

以 OpenAI GPT 模型为例,假设 80% 的 Token 用于输入,20% 的 Token 用于 输出,2023 年 3 月 1M Token 的 GPT-4 能力消费需要 36 美元,而 2023 年 11 月则为 14 美元。同样 1M Token 2024 年 5 月为 7 美元,8 月则进一步下降为 4 美元。

通过低价策略来保持性价比,是互联网科技行业的典型手法。但如何让自己能提供 “低价” 并量大的产品服务呢?

以 OpenAI 为例,留意 GPT-4、GPT-4-Turbo、GPT-4o 这几款细分产品的成本差别。

数据来源 OpenAI
分享链接 http://robin5G.com/DLK3XC
延伸阅读
大模型 POE

POE 是国际市场代表性的大模型 ”套壳应用”,用户可以在一个对话窗口中选用自己心仪的多个大模型。

从 POE 这个第三方角度,各家大模型公司的用户使用份额是怎样呢?附图来自 POE 披露的数据,截取自 2024 年 1 月到 2025 年 2 月底。

GPT-4o 以 38.3% 排名第一,Claude-3.5 和 Claude-3.7 分别以 22.3% 和 11.9% 排名二三位。

从 POE 的角度,OpenAI 的优势远没有 ChatGPT 在最终用户出的份额那么大。侧面也反映了,为什么基础大模型公司 “最好” 还是要有自己的原生对话应用,体现了用户入口,或者用户品牌心智占据的重要性。

安全 Akamai

根据 Akamai 的数据观察,2021 年 6 月的一天内观察到 1.138 亿次攻击,是 2020 年 6 月观察到的攻击次数的三倍多。

和网络流量的增长类似,Web 攻击数量也与日俱增。

值得关注的是,随着 API 经济的崛起,API 安全问题正在凸显。API 通常隐藏在移动应用程序中,让人们误以为它们不易受到操纵。

实际情况是 API 调用能更容易、更快速地实现自动化,这是其设计使然,可也是一把双刃剑,不但方便了开发人员,也方便了攻击者。

Gartner 认为,2022 年 API 滥用将从原本频率较低的攻击类型变为导致企业 Web 应用程序数据泄露的最常见攻击媒介。

iPhone Asymco

Asymco 绘制了一张图,展示了 2007 年初代 iPhone 上市以来所有款型的价格。可以清晰的看到 IPhone 是如何变得 “越来越贵的”。

定价是一门艺术。早期的 iPhone 3 最贵的款型是 700 美元,最近三年 iPhone 最贵的款型是 1,600 美元。

留意最下面那条黑色线条,Android 手机的平均单支售价。