知识块 #250330AQCZJV
相当大比例的 AI 计算需求并不需要 “实时性”
Robin  |  2025-03-30

围绕 CPU 和 GPU 的目标任务差别,有研究认为,有非常多的 AI 计算需求,并不需要 “实时性”。从后台批处理(Batch Processing)、中度延迟(Mid Latency)、低延迟(Low Latency)接近实时(Near Real time)、实时(Real time),计算任务可以分为很多种。

通过 GPU 和 CPU 的组合,可以提升 GPU 任务执行的经济性。

数据来源 社群
分享链接 http://robin5G.com/250330AQCZJV
延伸阅读
云计算 ODMIA

Intel x86 处理器一直是服务器市场 “接近唯一” 的供应商,尤其是从出货量百分比角度。

不过,这个现象正在发生变化,尤其是在大型公有云服务商采购服务器越来越多背景下。

根据 OMDIA 的研究,预计在 2023 年 ARM 处理器的出货量将超过 10% (大型公有云服务商)。

典型的 ARM CPU 应用场景,例如 AWS 为 Netflix、Twitch、和 Turner Broadcasting 等视频业务提供的云计算服务。

GPU Nvidia

英伟达 Nvidia 不仅是直接销售 GPU 给云服务商或企业,自己也与云服务商合作,通过 DGX Cloud 的形式,销售封装好的软件和模型 AI 能力(服务)。

附图来自 The Information 的整理,Nvidia 承诺在云服务上的金额投入承诺。

数字化 The Economist

The Economist 引用德勤和麦肯锡的调研,新冠疫情暴发后,企业对数字化技术应用的倾向性。

调研归纳了四个方面:(1) 供应链数字化;(2) 数字化的消费渠道 ;(3) 消费者互动与协作;(4) AI 与自动化。

可以看到,几乎每项数字化技术的倾向性(加速、明显加速)都增加了。