LLM #2505044T6ZRP
大模型的 “小型化过程” 带来的影响
Robin  |  2025-05-04

当前,30 亿参数的 “小模型“ 的性能已经达到最开始 ChatGPT 所使用的 1750 亿参数模型的效果。这得益于更好的压缩技术(distillation 蒸馏、quantization 量化等),以及更高质量的训练数据。

这个小型化过程会带来显著的好处:边缘侧和端侧通常算力是有限的,没办法部署大模型,但小型的模型如果性能够,就可以用的起来。(而边缘和端侧等低延迟特性就可以发挥起来了)。

与此同时,我们也想到了另一个问题,甲方企业 CIO 的难题。通常一个 IT 项目从立项招标到部署应用,起码要耗费几个月,甚至更久的时间。而模型改进(如下图所示)是以月为单位进步的,很可能甲方企业根据标书购买的大模型还没有部署上线,就已经落后,而且落后很多。

大模型时代的 IT 投资保护是一个值得思考的话题。

数据来源 Abdin Translink Capital
分享链接 http://robin5G.com/2505044T6ZRP
延伸阅读
广告 2022-10-20 GroupM
二十年来广告行业与 GDP 的增速对比
附图是 GroupM 和世界银行的数据,全球广告行业收入和 GDP 二十年来的增速对比。可以看到 2000 年后的大部分时间,广告行业和 GDP 呈现很大的相关性;而且在 2000 年互联网泡沫破灭和 2008 金融危机,广告行业的下行远超 GDP。...
安全 ESET 2022-10-20 GSMA
电信运营商消费者用户的安全增值需求
GSMA 之前有过调研,围绕消费者用户是否有意向在移动套餐中包含安全类增值服务。有 50% 的反馈已经或有意愿采用安全服务。附图是 ESET 的一个方案简介,在用户访问互联网时,会对不安全站点进行一系列的过滤。...
零售 星巴克 2022-10-20 SVPG
The Supermarket of Software: Changing How You Decide Which Problems To Solve
Consider your neighborhood supermarket. When you walk in, you see somewhere between 40,000 – 50,000 products. How do you decide. By Jon Moore and Marty Cagan This is the second of a three-part sequence on defining transformation. Changing how you...