AI热点 3小时前 52 阅读 0 评论

OpenAI预告了AI时代「Windows系统」的诞生

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

OpenAI在进一步探索如何通过对话式交互,实现服务与信息的获取、分发。

这是《窄播Weekly》的第68期,本期我们关注的商业动态是:OpenAI在今年的DevDay上更清晰地向我们展示了如何构建一个AI时代的超级系统。

上周用Sora 2引爆AI圈之后,本周OpenAI继续贡献了AI领域的两个热点话题。一个是在DevDay上公布的Apps in ChatGPT和Agent Kit,让大家看到了OpenAI准备如何围绕ChatGPT的对话式交互,去构建一个AI时代的「Windows」系统。另一个则是OpenAI在算力采购领域的大手笔投资,有估算认为采购总额已经接近1万亿美元。

就像OpenAI的CEO山姆·奥特曼在一档播客节目中所说,ChatGPT上线之后经历了两个关键的「惊喜」时刻,首先是用户增长和黏性都远超预期,其次则是科技巨头们没有及时跟进,给ChatGPT留出了建立竞争优势的空间。

也因此,在过去的两年多时间里,OpenAI得以稳步推进自己的战略布局。

这个布局的全景就是要构建起三个相互依存的AI基础设施:第一,通过大规模投资算力基础设施,掌握足够充裕的算力资源,支撑大模型的进化和应用;第二,通过不断优化,建立性能强悍的大模型家族,在核心技术层面保持领先优势;第三,依托算力和模型基础,推动构建以ChatGPT为核心的AI应用生态。

相比OpenAI在算力层面的投资,我们会更关注OpenAI将如何围绕ChatGPT构建奥特曼口中的一个「真正强大的AI超级系统」。这是普通用户更有直观感知,并且更能够给到当下国内的AI产品启发的一个层面。

其中,刚刚推出的Apps in ChatGPT尤其值得关注。这个功能将AI助理与浏览器进行了更深层次融合,探索了传统App与AI助理的结合,让用户可以像在电脑上浏览网页一样,在ChatGPT的对话中去实时唤起不同App。沿着这个路径发展下去,浏览器未来可能只会作为一个帮助AI助理处理复杂任务的操作台存在,其入口地位会被AI助理所承接。

这也可以说明,为什么奥特曼不愿用「超级App」,而是选择「超级系统」来描绘OpenAI的发展前景。因为OpenAI不是要为ChatGPT集成不同的功能,而是想围绕对话式交互,打造完善的账号体系、开发生态和商业模式,让App和Agent们都跑在OpenAI为其提前铺设好的轨道上。

现在,OpenAI在进一步探索,如何通过对话式的交互,实现服务与信息的获取与分发,真正扮演好入口的角色。

01 不成熟但有新意的Apps Inside ChatGPT

在OpenAI发布的信息中, Booking.com、Canva、Coursera、Expedia、Figma、Spotify、Zillow是首批参与App Inside ChatGPT的伙伴。并且,在今年晚些时候会公布开发者如何通过应用盈利的细节。

但当我打开ChatGPT体验App Inside ChatGPT功能时,发现这个功能目前只能完成一些简单和粗糙的操作,并没有如预想中那样可以支持更为复杂的操作。

参照OpenAI在发布会上的演示,我在ChatGPT的对话框中让Booking帮我找几家北京的、可以提供停车位的酒店。然后会弹出将ChatGPT与Booking进行连接的授权界面,点击确认后会显示正在调用App。然后就可以在聊天界面内嵌的Booking窗口中,看到几家酒店的推荐,每个酒店下面都会有跳转到Booking的链接。

当我再继续要求Booking给我介绍一家酒店的详细信息时,ChatGPT会显示目前不支持查看App内的酒店的详细信息,只能像之前一样整理成文字信息呈现在聊天界面中。这也就意味着,Booking在ChatGPT内的嵌入,目前还只能给我们提供一个以网页形态呈现的搜索结果,和之前的列表方式没有本质区别。

然后我又尝试了唤起Zillow和Spotify,前者的打开速度很慢,后者则没有成功唤起,依然是ChatGPT自己整理了一份文字歌单给我。

显然,OpenAI还需要一个过程来打消App们的顾虑,建立起一个共赢的生态,进而在ChatGPT内提供更丰富、深度的App能力。

奥特曼提到,OpenAI本来可以设计出更流畅的使用体验,但这会对合作伙伴极为不利,所以他们选择将用户引导进原生App中。

「用户明确指定要使用某类服务时,我们会主动推荐合作方;合作方接管交互界面并关联用户账户,确保用户能与原服务保持直接、透明的连接。这种方式或许在用户体验的流畅度上略有妥协,但从长远来看,更有利于整个行业的健康发展。」奥特曼表示。

02 重新理解AI助理

在OpenAI目前选择的这条路径下,作为AI助理的ChatGPT,扮演了最核心的角色。

所有的交互方式、开发工具和商业生态都是围绕这个核心来构建的。其中,对话是最主要的交互方式,未来点击、滑动可能只会作为辅助操作存在;开发工具则主要服务于应用生态的搭建;商业生态是开放的,可能会出现更多基于效果的分成机制。

这样的一个系统下,我们对于AI助理的理解会变得更为清晰。

第一,AI助理就是要扮演管家的角色,负责统筹这个家庭中的不同工作人员,为主人提供服务。用奥特曼的话说就是,AI助理的目标是提供单一且高效的AI服务,贯穿于用户的「整个生活轨迹并持续输出价值」。

这样的AI助理就需要横跨不同硬件端,有自主可控的模型能力,有长久记忆能力,以及拥有庞大用户体量。ChatGPT的全球周活跃用户数已经达到了8亿,规模入口能吸引更多产品和应用嵌入到ChatGPT当中。

第二,AI助理与浏览器的「主次关系」会变得更为明确。作为入口的AI助理会获得更大的主动性,浏览器则作为人与AI共用的操作台存在。Booking目前在聊天框内嵌入的就是一个网页,那未来可能会在聊天框内唤起更复杂的网页,让人和AI助理能够基于网页呈现进行更效率更高的对话。

长期来看,Apps Inside ChatGPT不能做到的复杂交互很可能会以Agent的形式在ChatGPT内实现。从App到Agent的发展,会很像微信小程序的发展过程,一开始垂类App只是将小程序作为功能简单的引流工具使用,但越往后小程序的功能就越与原生App相近。

OpenAI推出的AgentKit能够支持用户可视化、零代码创建专业AI工具。而Agent搭建门槛的降低会加快App转化成为Agent的过程。未来人们最主要的交互可能就是和Agent的对话。这时的浏览器可能会从操作台演化为一个随时可以被唤起的看板,能够实时展示不同任务的执行情况。

第三,AI助理就是一个账号体系。像ChatGPT这样的AI助理,会成为最懂用户喜好、掌握用户最多隐私信息的账号。奥特曼认为,AI助理未来可以智能判断用户的哪些信息可共享、哪些信息需予以保护,配合不同App和Agent,为用户提供更具连续性和个性化的体验。

并且,奥特曼还认为,C端和B端对AI的应用,会比外界预期的更快走向融合,最终用户将拥有一款能覆盖所有场景的通用AI工具。这个工具事实上就是OpenAI要建设的超级系统。在这个系统中,作为账号的ChatGPT能够及时适配工作场景与生活场景不同权限、能力要求的切换,并调用不同的能力完成任务。

如果参照奥特曼的构想来衡量国内的头部AI企业,会发现字节的豆包更明显地在构建一个完善的AI系统能力,阿里、百度、腾讯则都还处于四处出击的阶段,没有在AI助理和浏览器之间形成合力,也没有积极地围绕AI助理进行Agent生态建设,以及探索App与AI助理的融合。

但腾讯还存在微信这个变量。微信本身就具备了庞大的用户体量、小程序生态和商业能力,并且在手机端和PC端也实现了打通,其搜索框也在向AI搜索框进化。只是,目前微信中缺少了一个AI助理。一旦微信的AI助理上线,将会轻易改变AI助理的现有竞争格局。

本文来自微信公众号“窄播”,作者:李威,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!