罗宾知识库

#消费者 #家庭 #5G #政企 #算力 #车联网 #元宇宙 #Web3 #算力 #创业 #SaaS #云计算 #CAPEX #DOU #ARPU

Gen AI #MRNBJP

Llama3.1 大模型推理速度对比：Cerebras vs. 基于 Nvidia GPU 的公有云

Robin | 2024-08-31

初创公司 Cerebras 披露的数据显示，以 Meta 开源大模型 Llama3.1-70B 为例，其推理解决方案的速度是基于 Nvidia GPU 的公有云服务商速度的 20x 倍以上。

从披露的信息看，Cerebras 制造的推理芯片尺寸比 GPU 要大得多。

附：Llama3.1 有三种规格，8B 适合在消费者级 GPU 上进行高效部署和开发；70B 适合大规模 AI 原生应用；而 405B 则适用于合成数据等。

Gen AI GPU Llama 大模型

数据来源 Cerebras

分享链接 http://robin5G.com/MRNBJP

延伸阅读

广告 2022-10-20 GroupM

二十年来广告行业与 GDP 的增速对比

附图是 GroupM 和世界银行的数据，全球广告行业收入和 GDP 二十年来的增速对比。可以看到 2000 年后的大部分时间，广告行业和 GDP 呈现很大的相关性；而且在 2000 年互联网泡沫破灭和 2008 金融危机，广告行业的下行远超 GDP。...

安全 ESET 2022-10-20 GSMA

电信运营商消费者用户的安全增值需求

GSMA 之前有过调研，围绕消费者用户是否有意向在移动套餐中包含安全类增值服务。有 50% 的反馈已经或有意愿采用安全服务。附图是 ESET 的一个方案简介，在用户访问互联网时，会对不安全站点进行一系列的过滤。...

零售星巴克 2022-10-20 SVPG

The Supermarket of Software: Changing How You Decide Which Problems To Solve

Consider your neighborhood supermarket. When you walk in, you see somewhere between 40,000 – 50,000 products. How do you decide. By Jon Moore and Marty Cagan This is the second of a three-part sequence on defining transformation. Changing how you...