知识块>
#A8R5NT
AI 训练的加速器数量与算力互联网络的关系
Marvell 认为,如果以 2023 年为分水岭,AI 算力集群的互联网带宽在之前年份大约每隔 4 年会翻倍;而之后年份会提升到每隔 2 年翻倍。
带宽速度是一方面,互联的连接数量也会急剧增加。ChatGPT 在 GPT-3 模型训练时,大约使用了 1,000 个加速器的集群,这需要大约 2,000 个光纤互联连接;而 GPT-4 模型的训练则需要使用 2.5 个加速器的 GPU 集群,这需要大约 7.5 万个光纤互联连接。
光纤互联的连接增长速度将比 XPU/GPU 要块,比例达到 5:1,甚至 10:1。


数据来源
Marvell
分享链接
http://robin5G.com/A8R5NT
延伸阅读
GPU
Yole
Yole 数据显示,2024 年全球数据中心用的 GPU 市场空间为 880 亿美元,AI AISC 为 250 亿美元。
预计 2029 年 GPU 市场空间会提升到 1720 亿美元,CAGR 29%。AI ASIC 会提升到 560 亿美元,CAGR 30%。
无论是 GPU,还是 AI ASIC 均保持了很高的增长态势。
LLM
Gartner
Gartner 预测 2025 - 2029 年,Gen AI 模型的企业支出将从 2025 年的 140 亿美元,提升到 2029 年的 750 亿美元,CAGR 为 67%。
预测到 2028 年,33% 的企业会应用公司级别的 Agentic AI,会在 15% 的日常工作中自动运行。
