AI大模型的成熟,对创业公司来说意味着什么?

基于OpenAI GPT-3、Deepmind Gopher等基础模型,各个应用层面的新老玩家,未来都会在“云”上提供更丰富的服务,最终形成庞大生态。

1 引子:为什么这次不一样

最近几乎所有大型人工智能的前沿突破,都来自巨头公司,因为他们拥有强大的资金和算力。ChatGPT与上一波人工智能产品苹果Siri、微软小冰的核心不同是,过去都是小模型,而如今是真正的大模型。

以前,小模型的人工智能中,其实包含了若干Agent(类似于执行具体任务的程序),一个专门负责聊天对话、一个专门负责诗词生成、一个专门负责代码生成、一个专门负责营销文案等等,如果想添加新功能,可以去训练新Agent。一旦用户的问题超出了这个范围,人工智能就会变成人工智障。

而如今的ChatGPT之所以被称为真正的人工智能,就在于采用了成百上千亿参数的大模型,比如GPT-3模型就有1750亿个参数。而GPT本身是一个单项模型,是从左到右进行阅读,所以更擅长“写作文”。与谷歌BERT不同,BERT是一个双向模型,可以联系上下文进行分析,更擅长“完形填空”,但GPT与人类的思维方式更接近,所以我们能看到基于ChatGPT的创意写作应用,或是制作绘本。

AI写作、绘画、游戏、编程…从十款AI应用一窥AIGC时代APP新趋势(ai写作软件)

InstructGPT的技术逻辑:RLHF的主要改变在于人工监督数据与调整后的奖励模型;图片来源:OpenAI

但大模型的高昂投入,让普通创业公司难以为继,因此参与者都是科技巨头。2022年OpenAI的收入为3000万美元,但净亏损总额预计为5.445亿美元。而GPT3训练一次的费用,大概是460万美元。当模型被训练好之后,仍然有使用成本,目前ChatGPT单轮对话的平均费用,大概在0.01-0.2美元之间。

并且先发优势会非常明显,因为这里有一个“数据和模型的飞轮效应”。在GPT-3之后,OpenAI所有的模型都没有开源,而是提供了API调用。在这个过程中,OpenAI可以借助ChatGPT建立真实用户调用和模型迭代之间的飞轮,OpenAI非常重视真实世界数据的调用,以及这些数据对模型的迭代。

AI写作、绘画、游戏、编程…从十款AI应用一窥AIGC时代APP新趋势(ai写作软件)AI写作、绘画、游戏、编程…从十款AI应用一窥AIGC时代APP新趋势(ai写作软件)

文本模型的训练成本;图片来源:东吴证券

对于AI的发展来说,工程的重要性不亚于科学,创建一个迭代反馈的闭环至关重要。这也将是后来者,赶超ChatGPT的重要难点。

那么,这股AI新浪潮对于创业公司来说,意味着什么?

2 对创业公司来说意味着什么?

OpenAI的创始人山姆·阿尔特曼(Sam Altman),曾对AI产业生态有过一个预测,他认为:

​“将来应该会出现几个大型的基础模型,开发人员都将基于这些基础模型研发AI应用。但目前的情况依然是某一家公司开发出一个大型语言模型,然后开放API供他人使用。

我认为,将来在基础模型和具体AI应用研发之间会有一个中间层:出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功,但这取决于它们能在「数据飞轮」上走多远。

创业公司会训练自己的模型,只不过不是从头开始。他们将采用基础模型,这些模型已经经过大量的计算和数据训练,然后在这些模型之上进行训练,为每个垂类创建模型。

他们所做的 1% 的训练,对于应用来说至关重要。我认为,这些创业公司将会非常成功,并且与众不同。可能包括一段时间内存在的 prompt engineering(提示工程)或基础核心模型(core base model)。

将来承担模型训练角色的应该不会是初创公司,但这些企业可以在上述的中间层角色中发挥巨大价值。我认为中间那一层会创造很多价值。”

总结来说,这个产业生态可能会是:

1、基础设施层:在最底层,是提供芯片、云计算等基础能力的厂商。

2、模型层:大公司负责训练基础大模型,这种基础能力可能会逐渐走向开放。一种可能是,最终形成类似iOS 和Android两大阵营,或是类似云计算的格局,一般这种量级的生态圈最终不会容纳太多家,但也不会被一家垄断。目前来看微软(OpenAI拔得头筹)vs谷歌(旗下有Deepmind)已经开战,但巨头的基础模型之间是否会形成差异?以及会形成怎样的差异性?这个问题也值得观察。但无论如何,这将会是继移动互联网之后,下一个史诗级的重大战略窗口,中国公司也需要积极加入战局。

AI写作、绘画、游戏、编程…从十款AI应用一窥AIGC时代APP新趋势(ai写作软件)

国内外互联网大厂纷纷推出自研AI大模型;图片来源:安信证券

AI写作、绘画、游戏、编程…从十款AI应用一窥AIGC时代APP新趋势(ai写作软件)

3、应用中间层:在大模型的基础上,不同垂直领域会有各自的特殊情况,比如医疗、司法等等领域,这些特定领域的数据本身也是稀缺的。创业公司可以扎根各自的垂直领域,基于特定的数据集 行业knowhow,形成各自的商业化路径,并保护用户数据和隐私。

4、重构“AI应用”?此外,在Sam Altman所说的应用中间层之上,在AI应用端本身,是否存在一个重构当下App的机遇?是现有玩家往AI转型,还是会涌现新玩家,这个问题也值得持续观察,还未达成市场共识。

在现有玩家往AI的转型中,最典型的莫过于微软。微软计划将ChatGPT模块,应用于搜索引擎Bing中,以对抗占据主导市场份额的谷歌,New Bing可能在今年一季度就能落地。搜索引擎还只是前菜,微软还计划将OpenAI与自身业务进行更大程度的融合,比如嵌入Word、PowerPoint、Excel、Outlook等等,对于用户来说,只需给人工智能直接下达指令,就能获得自动生成的文章、Excel表格、PPT,或是电子邮件,这将是AI进入C端的一次巨大突破。

而在新玩家中,涌现了一批AI绘画、AI编程、各类自动化工具等等方向的创新项目,类似当年移动互联网,这些新方向也有可能诞生一批优秀的新公司。

现在,已经有一些新老玩家,在使用已经训练好的基础模型,然后再基于这些模型进一步优化,例如GitHub的Copilot功能,以及Notion的协助功能,都是基于OpenAI的相关模型开发而来。随着模型不断被AI应用平台使用,下一步就是训练数据,甚至整个业务逻辑。新老玩家们,未来可能会在一些领域激烈竞争。

这个发展过程也许可以类比云计算。当年云计算最初通过便利性,来吸引用户把计算放在云端。然后随着计算逐渐迁移到云端,数据也开始搬迁到云上,然后再是整个公司的业务逻辑,都在云上运行。基于OpenAI GPT-3、Deepmind Gopher等基础模型,各个应用层面的新老玩家,未来都会在“云”上提供更丰富的服务,最终形成庞大生态。

本站文章收集整理于网络,原文出处: ,本站仅提供信息存储空间服务。如若转载,请注明出处。

(0)
上一篇 2023-05-18 08:29
下一篇 2023-05-19 11:41

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注