AI大模型的成熟，对创业公司来说意味着什么？

1 引子：为什么这次不一样

最近几乎所有大型人工智能的前沿突破，都来自巨头公司，因为他们拥有强大的资金和算力。ChatGPT与上一波人工智能产品苹果Siri、微软小冰的核心不同是，过去都是小模型，而如今是真正的大模型。

以前，小模型的人工智能中，其实包含了若干Agent（类似于执行具体任务的程序），一个专门负责聊天对话、一个专门负责诗词生成、一个专门负责代码生成、一个专门负责营销文案等等，如果想添加新功能，可以去训练新Agent。一旦用户的问题超出了这个范围，人工智能就会变成人工智障。

而如今的ChatGPT之所以被称为真正的人工智能，就在于采用了成百上千亿参数的大模型，比如GPT-3模型就有1750亿个参数。而GPT本身是一个单项模型，是从左到右进行阅读，所以更擅长“写作文”。与谷歌BERT不同，BERT是一个双向模型，可以联系上下文进行分析，更擅长“完形填空”，但GPT与人类的思维方式更接近，所以我们能看到基于ChatGPT的创意写作应用，或是制作绘本。

InstructGPT的技术逻辑：RLHF的主要改变在于人工监督数据与调整后的奖励模型；图片来源：OpenAI

但大模型的高昂投入，让普通创业公司难以为继，因此参与者都是科技巨头。2022年OpenAI的收入为3000万美元，但净亏损总额预计为5.445亿美元。而GPT3训练一次的费用，大概是460万美元。当模型被训练好之后，仍然有使用成本，目前ChatGPT单轮对话的平均费用，大概在0.01-0.2美元之间。

并且先发优势会非常明显，因为这里有一个“数据和模型的飞轮效应”。在GPT-3之后，OpenAI所有的模型都没有开源，而是提供了API调用。在这个过程中，OpenAI可以借助ChatGPT建立真实用户调用和模型迭代之间的飞轮，OpenAI非常重视真实世界数据的调用，以及这些数据对模型的迭代。

文本模型的训练成本；图片来源：东吴证券

对于AI的发展来说，工程的重要性不亚于科学，创建一个迭代反馈的闭环至关重要。这也将是后来者，赶超ChatGPT的重要难点。

那么，这股AI新浪潮对于创业公司来说，意味着什么？

2 对创业公司来说意味着什么？

OpenAI的创始人山姆·阿尔特曼（Sam Altman），曾对AI产业生态有过一个预测，他认为：

“将来应该会出现几个大型的基础模型，开发人员都将基于这些基础模型研发AI应用。但目前的情况依然是某一家公司开发出一个大型语言模型，然后开放API供他人使用。

我认为，将来在基础模型和具体AI应用研发之间会有一个中间层：出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功，但这取决于它们能在「数据飞轮」上走多远。

创业公司会训练自己的模型，只不过不是从头开始。他们将采用基础模型，这些模型已经经过大量的计算和数据训练，然后在这些模型之上进行训练，为每个垂类创建模型。

他们所做的 1% 的训练，对于应用来说至关重要。我认为，这些创业公司将会非常成功，并且与众不同。可能包括一段时间内存在的 prompt engineering（提示工程）或基础核心模型（core base model）。

将来承担模型训练角色的应该不会是初创公司，但这些企业可以在上述的中间层角色中发挥巨大价值。我认为中间那一层会创造很多价值。”

总结来说，这个产业生态可能会是：

1、基础设施层：在最底层，是提供芯片、云计算等基础能力的厂商。

2、模型层：大公司负责训练基础大模型，这种基础能力可能会逐渐走向开放。一种可能是，最终形成类似iOS 和Android两大阵营，或是类似云计算的格局，一般这种量级的生态圈最终不会容纳太多家，但也不会被一家垄断。目前来看微软（OpenAI拔得头筹）vs谷歌（旗下有Deepmind）已经开战，但巨头的基础模型之间是否会形成差异？以及会形成怎样的差异性？这个问题也值得观察。但无论如何，这将会是继移动互联网之后，下一个史诗级的重大战略窗口，中国公司也需要积极加入战局。

国内外互联网大厂纷纷推出自研AI大模型；图片来源：安信证券

3、应用中间层：在大模型的基础上，不同垂直领域会有各自的特殊情况，比如医疗、司法等等领域，这些特定领域的数据本身也是稀缺的。创业公司可以扎根各自的垂直领域，基于特定的数据集行业knowhow，形成各自的商业化路径，并保护用户数据和隐私。

4、重构“AI应用”？此外，在Sam Altman所说的应用中间层之上，在AI应用端本身，是否存在一个重构当下App的机遇？是现有玩家往AI转型，还是会涌现新玩家，这个问题也值得持续观察，还未达成市场共识。

在现有玩家往AI的转型中，最典型的莫过于微软。微软计划将ChatGPT模块，应用于搜索引擎Bing中，以对抗占据主导市场份额的谷歌，New Bing可能在今年一季度就能落地。搜索引擎还只是前菜，微软还计划将OpenAI与自身业务进行更大程度的融合，比如嵌入Word、PowerPoint、Excel、Outlook等等，对于用户来说，只需给人工智能直接下达指令，就能获得自动生成的文章、Excel表格、PPT，或是电子邮件，这将是AI进入C端的一次巨大突破。

而在新玩家中，涌现了一批AI绘画、AI编程、各类自动化工具等等方向的创新项目，类似当年移动互联网，这些新方向也有可能诞生一批优秀的新公司。

现在，已经有一些新老玩家，在使用已经训练好的基础模型，然后再基于这些模型进一步优化，例如GitHub的Copilot功能，以及Notion的协助功能，都是基于OpenAI的相关模型开发而来。随着模型不断被AI应用平台使用，下一步就是训练数据，甚至整个业务逻辑。新老玩家们，未来可能会在一些领域激烈竞争。

这个发展过程也许可以类比云计算。当年云计算最初通过便利性，来吸引用户把计算放在云端。然后随着计算逐渐迁移到云端，数据也开始搬迁到云上，然后再是整个公司的业务逻辑，都在云上运行。基于OpenAI GPT-3、Deepmind Gopher等基础模型，各个应用层面的新老玩家，未来都会在“云”上提供更丰富的服务，最终形成庞大生态。

本站文章收集整理于网络，原文出处：，本站仅提供信息存储空间服务。如若转载，请注明出处。

AI大模型的成熟，对创业公司来说意味着什么？

相关推荐

GEO优化业务爆火的背面，又是谁在给AI投喂“垃圾”？

麦肯锡《2025年AI现状：智能体（Agent）、创新与转型》报告解读

AI交锋传统商业，流量入口到交易引擎升级全新商业闭环正在形成

人工智能感知时代，企业营销增长战略要如何重塑？

企业该在哪三个营销领域优先投入 AI

三个月卖出数万台，AI+玩具赛道将创造新的销售奇迹？

发表回复