围绕 CPU 和 GPU 的目标任务差别,有研究认为,有非常多的 AI 计算需求,并不需要 “实时性”。从后台批处理(Batch Processing)、中度延迟(Mid Latency)、低延迟(Low Latency)接近实时(Near Real time)、实时(Real time),计算任务可以分为很多种。
通过 GPU 和 CPU 的组合,可以提升 GPU 任务执行的经济性。
光缆长度是造成传输时延的主要因素之一,每 1000 公里长度的光纤的传输时延约 5ms。附图来自中国联通,不同地区枢纽节点之间的物理层时延。
对比物理层时延,路由器、网关之间的每次跳转会增加更多时延。
NSR 的研究显示,以纽约到伦敦的数据传输为例。如果用光纤传输,最低延迟是 55ms ,而通过 LEO(低轨道卫星)的 Inter-Satellite Links (卫星之间直连),可实现 43ms 的低延迟。
LEO 连接经历的节点可能比传统固网要少,而且光在光纤中的传播速度比电磁波在真空中慢 40% 左右。
“低延迟” 已经是高频词,经常出现在包含工业应用的专网讨论中。但实际上,工业网络中最重要的因素不只是延迟,还应考虑 “低抖动”。
在自动化控制应用场景中,数据和控制指令的传输须在给定的时间段内完成。该时间段决定了最大允许的端到端时延。
基于 R15 版本标准的5G专网,时延加上抖动有可能达到 100ms 以上,无法满足运动控制等实时性要求高的工业自动化应用要求。
传统卫星通信的一大特点就是延迟大,因为传输距离遥远。但 Starlink 星链由于运行在近地轨道距离短得多,有机会获得更低的延迟。
即便如此,仍然面临不同位置性能不稳定的问题。Starlink 最新披露的数据显示,其在近期显著降低了全球用户的中位延迟(p50)和最差延迟(p99)。以美国地区为例,高峰期中位数延迟从 48.5ms 降低到 33ms;最差延迟也从 150ms 降低到 65ms。