知识块 #2505046S5PWL
不同垂直领域的数据占比:互联网数据 vs. 物理数据
Robin  |  2025-05-04

公开资料显示 GPT-3 模型的训练数据几乎都是来自互联网的数据。而大模型要走向垂直行业领域,从训练数据角度自然需要引入大量的来自垂直行业的数据,尤其是物理数据。

附图来自甲子光年的判断。我们认为此图表还遗漏了一个领域,就是企业的内部数据。每家企业无论大小,都有自己的私有数据。

数据来源 甲子光年
分享链接 http://robin5G.com/2505046S5PWL
延伸阅读
运营商 GSMA

传统通信业务饱和状态持续多年,Top 运营商纷纷探索新业务,但进展如何呢?

GSMA 选择了典型的六类新业务(付费电视、媒体内容和广告、金融和电子商务、安全、云计算和 IoT),看代表性运营商在这些领域在 2020 年度的收入贡献。

(1) 付费电视:16 家运营商的平均收入贡献为 5%;

(2) 媒体内容和广告:AT&T 数字很高是因为了做了大型并购;Verizon 和 Softbank 5~6% 更有参考意义;

(3) 金融和电子商务:日韩运营商,高的可以做到 14~16%,低一些的 3~4%;

(4) 云计算:< 3%;

(5) IoT:~1%。

传统通信业务虽然饱和,但提供了非常稳定的现金流,以及稳定的客户基础关系,这是运营商转型的资源禀赋。当然成效还得看具体战略水准和执行力。

PPT HBR

类似很多企业自己没做好,怪 PowerPoint,说是 PPT 文化不对。

文中举例的富国银行,就是帐务造假和合规性问题。

AI KPMG

KMPG 和澳洲 The University of Queensland 大学开展了一项调研,针对 AI 时代,民众对人工智能的信任度话题。这项调研覆盖了 17 个国家和 17,193 受访者。

在 AI 的应用类别中,AI 用于医疗的民众信任度是最高的,AI 用于人力资源的信任度则最低。

从不同国家看,印度和中国的受访者对 AI 的信任接受度是最高的,北欧和日本则最低。