IDC 咨询公司研究显示,2025H1 中国大模型公有云服务市场的总调用量为 536 万亿 Token,而去年全年才 114 万亿 Token。仅 2025 上半年的总调用量就是去年全年的 5x 倍。
对于普通开发者来说,大模型部署的难度和经济性都面临挑战。而采用 API 调用的方式,MaaS(模型及服务)有广阔的应用前景。
大模型的部署,可以在公有云,也可以在企业自己的私有化环境。
IDC 咨询公司研究显示,中国大模型公有云市场在 2025H1 的市场表现中,字节跳动的火山引擎获得了接近半数的份额(49.2%),阿里云(27%)和百度(17%)位居二三位。
Gartner 预测 2025 - 2029 年,Gen AI 模型的企业支出将从 2025 年的 140 亿美元,提升到 2029 年的 750 亿美元,CAGR 为 67%。
预测到 2028 年,33% 的企业会应用公司级别的 Agentic AI,会在 15% 的日常工作中自动运行。
MIT 的一项关于 AI 应用的调研,关于任务分配时,哪些受访者倾向于让 AI 做,哪些请i吸纳高于给初级员工(同事)做 ?
写邮件、归纳摘要、基础分析等,70% 受访者倾向于找 AI 工具,而复杂的 “项目” 类(持续几个兴起的工作、客户管理等)90% 受访者都会倾向于找同事。
AI 对人类工作(尤其是白领类)的替代已经在逐步成为现实。而 AI 时代,个体如何寻求职业发展是热门话题。
有能力胜任有一定复杂度的工作,是区别 AI 的(暂时)有效手段。即便是初级员工,也应考虑这个角度。
MIT 最近发布的一份报告,关于企业客户在使用大模型工具的成功(部署)的比例。
如果是 ChatGPT 类的通用工具,成功部署的比例为 40%;而如果是面向企业特定的专属任务则成功率只有 5%。
这个现象由来已久,也不仅是 AI 主题。以白领办公常用的即时消息 IM 为例,微信等通用工具的应用体验一定是远好于企业自己开发的专属 IM 的。
就大模型应用而言,OpenAI 的技术实力和研发投入,任何企业客户个体都是无法比拟的。
以训练数据为例,企业把自己手头哪些 PDF 资料给 “搞整齐”,就是一件非常之困难的事情,尤其是考虑到有限的 IT 成本条
Morgan Stanley 汇总了代表性大模型公司(Google Cloud、字节火山引擎/豆包、微软 Azure)披露的大模型 Token 使用量数据。
Google 在 2025 年 7 月接近 1,000 万亿 Token,对比 4 月份涨了一倍。无论是绝对值,还是增幅都体现了业界对大模型能力调用的需求。
以 50% 的成功率为目标,大模型工具来自动完成软件工程的任务的任务时长(Task Duration for Humans)在 GPT-4 及以前都处于很低的状态。
从 Claude 3.5 Sonnet 开始,这个时长在显著增加。即,AI Coding 开始发挥明显作用。而 GPT-5 可以将时长提升到 2 个小时以上。
企业客户在部署使用大模型时,面临的经典问题是,选择开源模型,还是闭源模型。
从 Menlo Ventures 在 2025H1 更新的企业调研看,开源模式在性能方面仍然落后于前沿的闭源模式 9~12 个月。
Menlo Ventures 调研显示,Anthropic 正在持续赢得更多企业客户的大模型 API 支出的市场份额。而 OpenAI 的市场份额则从 2023 的 50% 持续下滑到 25%。
OpenAI 和 Anthropic 貌似正在走向不同的侧重点。OpenAI 通过 ChatGPT 牢牢的获得绝大部分消费者 2C 的份额,而 Anthropic 似乎更侧重于企业 2B 侧。
风险投资机构 Menlo Ventures 研究发现,全球企业客户在大模型 API 支出正在加速提升。对比 2024 年的 35 亿美元,仅 2025 年上半年的支出就翻了一倍还多,达到了 84 亿美元。
而 2023 年大模型 API 还是一项新出生的 “物种”。