知识块 #K2PB3Z
语音 AI 的技术栈与代表性玩家
Robin  |  2024-06-02

自电话通信发明起,线上语音就是人类沟通的重要方式。语音作为一种形态,经历了自动化语音(例,呼叫中心的语音菜单)或 Siri 这种基于语音的初级 AI 助理。

风险投资机构 a16z 认为基于大模型 LLM,语音正在成为一种新的与技术互动的方式,并有机会成为新生产力应用的核心。

数据来源 a16z
分享链接 http://robin5G.com/K2PB3Z
延伸阅读
音频 中信证券

2021 年 1 月开始,美国 Clubhouse 语音社交迅速爆红。国内也出迅速出现多家类似产品。

声音或语音,是一个有相当历史的赛道。最早可追随到早期的网页版的语音聊天室,甚至更早的声讯台。

曾经在游戏这一个细分领域的语音通信,都可以诞生 YY 等火爆的产品。

附件是中信证券的一个总结。

AI BCG

BCG 预测全球 AI Agent 的市场空间将从 2024 年的 57 亿美元提升到 2030 年的 521 亿美元,涨幅接近 10x 倍。

从技术类别看,最大的技术类别是机器学习、NLP 自然语言处理、深度学习和计算机视觉。

Deep Tech Mckinsey

Deep Tech(深科技)通常指一些偏基础的技术,对人类社会潜在影响巨大的技术。对于 Deep Tech 的投资和成长过程,与传统科技项目有很大不同。

附图来自 Mckinsey,对比而言,传统科技项目在项目初始不久,就开始有收入(通常也意味着产品化成形,有了成型的产品,才会获得收入)。

而 Deep Tech 在较长时期是 “零收入” 的未商业化状态。