AI热点 3小时前 53 阅读 0 评论

从11分钟到1分钟,Perplexity CEO谈AI浏览器的效率革命

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

划重点:

斯里尼瓦斯认为,智能体将接管网络上所有无聊的日常琐事和繁琐任务。

在AI能力日益强大的未来,人类的好奇心变得至关重要。AI不仅能回答问题,还能主动提出更多问题。

Perplexity的差异化战略是避开“全能助手”的竞争,极致专注于提供准确答案。这直接攻击了传统搜索引擎依赖广告和点击的商业模式。

浏览器并非AI的最终形态,AI的终极目标是整合到操作系统层面。

在未来的互联网世界,你或许再也不用为忘记缴费、出差订票、收集资料等琐事分心。只需一句话,AI智能体就能悄无声息地替你搞定一切。Perplexity CEO 斯里尼瓦斯直言:“未来,这些枯燥事务很快都会交给AI智能体去完成,而人类则能把精力释放给更有创造力、更有乐趣的事情。”

近日,Perplexity首席执行官阿拉温德·斯里尼瓦斯接受播客节目《Limitless》专访,深入探讨了AI如何重塑互联网体验。

斯里尼瓦斯分享了Perplexity新浏览器Comet的愿景、背后的思考,强调AI将接管枯燥任务,释放人类时间用于好奇心驱动的探索。斯里尼瓦斯指出AI的终极形态是原生操作系统,而非简单的聊天机器人。这场访谈不仅揭示了Perplexity的技术路径,更描绘了AI时代人机交互的全新图景。

以下为对话斯里尼瓦斯精华内容:

01 AI智能体将取代人类完成繁琐事务

问:你如何看待未来五年互联网的发展趋势?这将如何影响Perplexity的发展方向?

斯里尼瓦斯:说实话,要准确预测五年后的互联网趋势几乎是不可能的。我们正处在一个AI技术日新月异的时代,每过几个月就会出现重大突破。如果我说自己能预知未来,那肯定是在说谎。事实上,现在没人能真正看清五年后的图景。

三个月前,AI的任务执行能力还很不稳定,虽然能看到一些雏形,但远不如现在这么成熟。即便到今天,AI仍然不能像真正的员工那样可靠地协助每个人。不过我可以大胆预测:未来会有大量AI智能体代替人类完成网页浏览、信息处理等重复性工作。那些令人头疼的日常事务——比如支付账单、转账汇款、预订酒店、租车、预约医生等,都将由AI代劳。

如今,大多数网站在设计上并没有很好地解决这些问题。它们往往容易出错,缺乏有效的客服支持,很多信息分散在不同地方,寻找律师、保险或医疗服务的过程也充满了繁琐的流程,令人头痛。

AI目前能做的,主要是整合各类信息,并进行总结,这正是Perplexity的起点。但更远的目标,是让AI承担起这些繁重的工作,让我们真正感受到技术带来的便利。

总之,在未来,我们将能够轻松浏览互联网,享受那些更有趣、更愉快的网站体验。而网站拥有者也能通过AI将他们的网站打造成更具吸引力和互动性的地方,因为AI能高效生成大量的代码来优化网站。我对未来持乐观态度:人们会更幸福,娱乐内容会更加丰富,像播客这样的创作形式也会更加普及。

AI的出现将让人们拥有更多的时间。许多AI公司宣扬他们的工具是“帮你省时间”,但这只说对了一半。实际上人们不是没时间,而是被无聊的工作流程耗尽了精力。比如一件15分钟就能完成的事,因为操作繁琐,人们往往要花上两个小时。这正是人们讨厌工作的原因:枯燥且疲惫,导致他们失去了做其他事情的兴趣。这种低效即将成为过去式。

未来的网络体验将更加个性化。AI会主动推荐内容,同时保留用户的选择权——你可以自由决定在多大程度上依赖AI。这将是一个高度自主、以好奇心驱动的世界。我们选择以“好奇心”作为品牌核心,正是因为好奇心是AI时代最宝贵的人类特质。它不是情感,而是一种能力,尤其在AI能做我们曾经做的很多事的时代,懂得如何使用AI,以及知道如何在这个世界中前行,将变得更加重要。

问:为什么好奇心在我们将如何驾驭互联网方面如此重要?随着我们拥有越来越强大的工具,人的好奇心会变成什么样子?

斯里尼瓦斯:我认为,当前的AI技术已经超出了大多数人现有的技能水平。虽然它们偶尔会犯错,比如出现幻觉或者不能总是可靠地完成任务,但这些技术已经足够强大,能够帮助我们做很多事情,比如写代码、建网站、进行研究、回答问题等。然而,与每天使用这些技术的人数相比,AI的应用还远未普及,很多人仍然在用传统方式工作。

例如,我们已经推出了Comet浏览器,它可以利用AI帮你观看YouTube视频,甚至不用看完整个视频。它还能帮你草拟邮件、撰写LinkedIn帖子、招聘邮件,筛选候选人,整理不想看的旧邮件,甚至取消垃圾邮件的订阅。这些功能已经能大大提升效率,但要充分利用这些工具,我仍然需要保持好奇心,去发现它们的新用法。这些工具的效果依赖于我的创造力和主动性,去挖掘它们的最大潜力。

从短期来看,好奇心非常重要。长期来看,当这些AI工具成为日常生活的一部分,即使你已经习惯了它们的帮助,依然需要保持好奇心。你需要思考下一步要做什么,要如何启发AI,提出适当的问题。

好奇心的价值在历史上的许多重大科学发现中都有体现。举个例子,即使爱因斯坦拥有所有的科学工具,他依然需要提出一些深刻的问题,例如:“如果我们以光速旅行,牛顿力学会崩溃吗?我们是否需要构建一个全新的世界观?”即使我们不知道这些问题的答案,提出这些问题并深入思考本身就是非常有价值的。这正是物理学家和科学家出于好奇心进行的探索。

“AI教父”杰弗里·辛顿曾好奇地思考:“如果我们造出模拟大脑的计算机,会发生什么?”尽管计算机科学最初是关于确定性程序的,但AI是随机的,它无法保证每次输出都相同。正是因为好奇心,才驱使人们去探索这一领域。过去,这些探索问题仅限于学术圈,但现在随着AI工具的普及,任何拥有好奇心的人都可以参与其中。

就像与小孩子相处时,他们会问你各种最基础的问题,这些问题有时会让你感到困惑。虽然回答这些问题让人愉快,但你也会意识到,“我从来没有深入思考过这些问题,我只是接受了别人告诉我的东西。”这种思考的乐趣就是我们未来的世界。如果AI能够不仅回答你的问题,还能帮助你发现更多问题,引导你进入新的探索领域,你就会体验到像早期互联网用户在使用超链接、维基百科和嵌入式网页时所获得的乐趣。

互联网最初吸引了许多历史学家、学者和知识分子,这也正是亚马逊最初选择销售书籍的原因。亚马逊想要迎合那些对书籍感兴趣的早期互联网用户。今天,AI就像当时的互联网一样,主要被早期采用者、程序员和学者使用。但是,随着AI工具变得更易用,具备更强的自主性,它将变得更加普及。那些拥有好奇心的人,能够借助这些强大的工具,以积极的方式改变世界。

02 A时代,最重要的技能之一是批判性思维

问:你认为 AI 在限制个人可以查看、探索和搜索的内容,以及作为一种创造工具之间,是否存在一条界限?你在构建产品时是如何把握这条界限的?

斯里尼瓦斯:我们的产品主要是为了帮助人们更高效地浏览网页,而不是像传统的谷歌搜索那样,只提供“10个蓝色链接”。我认为,过去的搜索方式其实就是对“提问”这项技能的过度拟合(Overfitting,机器学习中常见的问题,指模型在训练数据上表现优异但泛化能力差,无法有效预测新数据)。

以我个人的生活为例,过去如果我想理解某个概念,比如“MCP”,我需要查阅论文或博客文章,按顺序整理资料,再形成结论。这个过程虽有效,却冗长,还常常留下未解的问题。而现在,我只需在Perplexity上直接问:“MCP到底是什么?为什么大家称它为AI或互联网的‘USBC’?”几秒钟内,我就能得到清晰的解释和背景。这种方式颠覆了传统的学习顺序,对我这种时间有限的人来说无疑更高效。

同样的变化也发生在健身和饮食方面。以前我会看健美博主的YouTube视频,如今我可以在Comet浏览器里对这些视频直接提出批判性问题,请AI进一步分析,甚至对照学术论文进行验证。这样获取到的信息不仅更精准,也更有深度。

我相信未来的体验会更加个性化。下一代孩子可能不再像我们一样浏览网页,而是通过语音与AI互动,获得自然、即时的回答。他们的社交媒体习惯也会发生根本变化。今天的孩子们依赖短视频获取知识,但这种方式并不理想。我们希望AI能帮助他们过滤信息,提供更准确、更有价值的内容,而不是让他们被动接受算法的随机推荐。

在这个过程中,自主性和信任才是关键。AI不仅能替你屏蔽噪音,还能帮你挖掘真相,保持好奇心,找到真正有价值的信息。想象一下,假如Mark说:“去x.com,帮我滚动浏览100条推文,并基于我的兴趣筛掉无关内容,只保留20条有用的。”AI完全可以精准、即时地完成任务。

这种体验打破了传统算法的局限。以往你可能在社交媒体上莫名其妙看到政治帖、表情包或动漫推荐,却不知道为什么会出现在你的时间线上。本质原因是,现有算法无法针对个体需求进行真正的精细化定制。

我们希望避免陷入这种被动、过度干预的互联网环境。未来的理想状态是,人们能够在AI的帮助下获得更多自由与自主权,根据自身需求主动探索,而不是被算法“喂养”。

问:你认为,对于今天加入互联网的新一代受众来说,应该专注于哪些重要的技能?

斯里尼瓦斯:我认为,对今天加入互联网的新一代受众来说,最重要的技能之一是批判性思维。比如,我自己在阅读某些书籍或传记时,尤其是由个人或公司主导编写的作品,常常会发现其中不可避免地带有偏向性。这类书籍往往意在塑造一个积极的公众形象,而不是提供全面、客观的事实。因此,我们需要时刻提醒自己:文字背后可能隐藏着选择性的叙述。

如果有一个AI能陪伴我阅读,逐章进行批判性分析,指出作者可能遗漏或误解的部分,那将非常理想。这让我想起彼得·蒂尔(Peter Thiel)提到的“反向思维”方法——它并不是单纯为了唱反调,而是通过换角度思考,帮助我们避免被单一视角左右。这种训练将让新一代用户学会质疑、学会多角度审视,从而不轻易被看似有说服力的观点所左右。

除了批判性思维,信息收集与筛选的能力同样至关重要。未来的互联网将充斥着大量AI生成内容,真假难辨。我们甚至可能无法分辨一段视频究竟是现实拍摄还是AI合成的。在这样的环境下,用户必须学会理性判断,避免陷入信息回音室(echo chamber),而这需要工具的辅助。

我相信,对抗虚假信息最有效的方式,是利用AI本身。AI可以帮助我们追寻真相,在几乎无需额外努力的情况下,引导我们获取真实、可靠的内容。关键在于“提示”——如果用户能够通过正确的提示与AI互动,AI就能真正站在用户的利益一方,而不是成为外部力量操控的渠道。

不过,未来也会出现新的挑战。比如,假设你有一个智能体,它为你处理购物、订票或旅行安排,某些公司可能会通过广告直接影响智能体的选择,而不是直接影响你个人。如果我们不能建立一套机制来保护人与智能体的互动,就可能让广告暗中左右AI的决策。

理想的未来,是人与智能体之间能够建立一份不可篡改的协议。在这份协议中,用户的提示和偏好受到保护,不会被广告商或其他外部势力干扰。这样一来,用户就能放心地让AI根据自身需求作出决定,而不用担心背后被操控。

我们正处于类似互联网早期的阶段,许多规则和机制还在形成。虽然今天的系统还不完美,但我相信未来我们能够为用户提供一个更安全、更透明的环境,让他们免受虚假信息和广告操控的困扰。

03 Perplexity的定位:准确性与知识密度第一

问:在用户体验设计中,有一种观点认为更好的体验意味着减少点击次数。同样,在智能体的设计中也有人认为“我们可以让智能体替代用户完成很多事情”。但这是否会让大脑更频繁进入“关闭”状态,变得被动?在设计Perplexity 时,你们如何平衡这种主动与被动的关系?

斯里尼瓦斯:在设计中,我们确实非常注重保持用户的活跃参与。举个例子,当用户请求 Perplexity 进行深度研究时,智能体会主动反馈问题,帮助澄清需求。这让用户有机会继续参与,而不是完全被动接受结果。不同于 ChatGPT 会强制要求用户回应,Perplexity 更强调“可选”参与——因为有时候用户可能根本不知道该如何回答,尤其是在对话题缺乏背景知识时。我们希望用户在引导智能体的过程中保持参与感,但又不增加负担。

同样,在 Comet 浏览器的设计里,我们也避免让用户完全“隐身”。比如,当用户让智能体代买商品时,它会提醒:“这件商品价格是 100 美元,是否继续?”——确保用户在关键环节仍然亲自确认。这样,用户的思考始终在场,避免在自动化过程中大脑完全“关闭”。

从更深的层面来看,如果智能体比我们更聪明、我们完全信任它,就像雇佣了一位能力远超自己的助手。那么问题是:在这种情况下,我们的大脑和注意力应该投入到哪里?如果我们停止思考,只是依赖智能体,可能导致认知能力退化。AI 能替代繁琐任务没错,但人类依然需要寻找新的创造性和管理性工作,就像工业革命带来机器替代体力劳动,人类转而从事更多复杂与创意工作一样。

比尔·盖茨曾提到,未来AI可能让人们每周只需工作两三天。但这种“自由”不能等于“无所事事”。在 AI 带来解放的同时,我们必须主动思考如何发挥创造力,否则只会陷入停滞。

问:对于习惯使用 ChatGPT 或 Gemini 的用户来说,他们可能不太理解 Perplexity 的优势。能否具体说明 Perplexity 的差异?你们是如何在后台实现这种体验的?

斯里尼瓦斯:Perplexity的核心优势在于 对“准确性”和“知识”的专注。和 ChatGPT、Gemini 这样的通用型助手不同,Perplexity 并不是一个陪伴聊天的多功能机器人。你可以在ChatGPT聊心情、获得情感支持,但这并不是我们的目标。我们专注于事实、研究和知识的呈现,希望为用户提供最清晰、最高密度的信息。

我们不会追求“什么都做一点”,而是把全部能量投入到“答复引擎”的定位上。比如用户想查体育比分,他们不需要一大段文字,而是需要简洁的数据和直观的表格。因此我们设计了大量仪表盘,让用户一眼就能看懂关键信息。在F1、股票对比等场景,我们提供结构化的实时数据;在网球、足球等领域我们还在努力提升。我们的目标,是成为用户获取 准确信息与高密度知识 的第一选择。

问:当我在搜索框中输入查询时,Perplexity 在后台是如何工作的?查询如何被路由到不同的模型?

斯里尼瓦斯:每个查询首先会被系统分类,不同类型的查询(如体育、天气、金融)会被分配到相应的类别,然后生成不同的用户界面,我们称之为 生成式UI。

在某些场景下,比如金融数据、体育赛事、天气预报,我们必须依赖专业数据提供商的实时数据,而不仅仅是网页信息。在旅游、电商等领域,我们会通过合作伙伴获取库存和商户数据。本地餐厅等查询则会依靠Yelp(商户点评平台)等。至于其他常规问题,我们会抓取网页并提炼信息,生成准确答案。

展示方式也会随查询而变化:有时是 Markdown 表格,有时是简洁段落。如果是手机端,我们会进一步精简内容,避免冗长。遇到复杂问题时,模型需要多步推理。比如有人问:“排名前五的亿万富翁和他们妻子的年龄差是多少?”系统必须先确定这五人,再找到妻子的出生日期,然后计算差值,最后以表格呈现。这背后其实是一个 复杂的信息路由系统,根据问题的复杂性自动调整推理步骤。

最终,我们追求的并不仅仅是单一模型,而是一个能够 智能分配计算资源、灵活处理各种查询 的系统。它要能在最短时间内,为用户提供最准确、最清晰的答案,同时保持界面流畅舒适。

04 AI的终极形态:操作系统直通“王座”,浏览器只是跳板

问:为什么你们会选择保留浏览器的形式,而不是直接进入智能体工作流?毕竟后者可以直接提供答案,去掉界面和广告。

斯里尼瓦斯:我们的设计理念是:工作应该从用户所在的地方开始,而不是从一个空白的聊天界面开始。

想象一下你正在写备忘录,突然需要提取Slack(智能协同办公平台)对话内容。传统方式是切换到Slack,复制粘贴,再回到文档继续。但在Comet 中,你只需说:“帮我提取相关上下文”,系统会直接在原地完成。这样避免了繁琐的切换,让功能原生融入工作流。

从架构上看,Comet 比传统聊天机器人高效得多。聊天机器人通常要在服务器端启动完整的会话,涉及频繁往返和重试。而 Comet 将部分解析放在客户端,推理放在服务器端,仅需一次双向通信即可完成任务。这让它不仅更快,也更安全。我们测试过,同一任务,聊天机器人可能需要 11 分钟,而 Comet 只需不到 1 分钟。

更重要的是,浏览器是过去二三十年里用户最熟悉的工具,工作和生活高度依赖它。我们选择将AI嵌入浏览器,不是要取代界面,而是赋予浏览器新的能力:既保留熟悉的体验,又让用户在自动化任务中始终掌握决策权。

问:当智能体能即时响应、彻底摆脱浏览器框架时,你认为未来的人机交互会是什么形态?浏览器是否仍然会是主要界面?

斯里尼瓦斯:我并不坚持浏览器必须永远是信息入口。随着智能体进化,未来的交互形态可能会改变。但无论有无前端,浏览器作为基础设施的地位不会消失。

举个例子:当你在Comet中说“帮我在DoorDash(美国外卖送餐服务平台)上点餐”,实际上并不是开启了 DoorDash 的浏览会话,而是智能体在后台调用接口完成操作,浏览器只提供反馈进度。这说明即便未来出现无头浏览器,底层依旧离不开浏览器环境的支撑。

核心问题在于:人们大部分时间在哪里? 现在的现实是,大多数人依旧花大量时间停留在浏览器里。浏览器有持续更新的上下文,你可以随时打开标签页、查看新闻、切换到 LinkedIn 或 YouTube,这种动态体验是单一聊天界面无法取代的。因此我们更希望 Comet 在背景中“陪伴”,在你浏览内容时随时提供帮助,而不是让用户被迫待在单一对话框里。

05 聊天机器人讲体验,浏览器更看执行与架构

:市场上出现了智能吊坠等 AI 硬件产品,你怎么看它们与浏览器形态的 AI 助手之间的关系?Perplexity 是否考虑开发独立硬件?

斯里尼瓦斯:浏览器所能调取的记忆和上下文是其他硬件无法比拟的。吊坠类设备看似能随时伴随用户,但它们在电池效率、存储和网络依赖上存在严重不足。相比之下,浏览器经过几十年的工程优化,能高效管理电池和内存,代码也足够成熟,能充分利用硬件资源。

吊坠需要持续消耗蓝牙和网络来上传数据,不仅效率低,还涉及隐私风险。事实上,你并不需要记录所有事情,浏览器能在你授权的情况下直接访问网站、邮件、日历、会议记录、旅行和生活安排,并在隐身模式下确保隐私安全。

录音应用已经能本地完成会议记录,不必上传到云端。从效率和隐私角度看,浏览器都更优越。我更看好像智能眼镜和 AirPods 这样的硬件,它们能提供沉浸式的渲染和语音交互,为购物、出行等场景带来真正的突破。但对吊坠类产品,我并不看好,因为这不仅效率低下,还可能涉及到隐私问题。

问:Perplexity是第一家推出 AI 浏览器的大型 AI 公司。现在,大家都知道OpenAI和谷歌也会推出自己的浏览器。如果OpenAI 明天发布浏览器,你认为 Comet 相比其他竞争者的最大优势是什么?

斯里尼瓦斯:OpenAI未来一定会开发浏览器。Perplexity 的优势主要在于产品本身的优越性、快速迭代以及推出新功能的能力。我们不仅仅是在更新已有的功能,还在努力解决一些长期的、复杂的任务,比如编程智能体。现有的同步代理可以实时帮你完成一些任务,但我们缺少的是异步代理,它能在后台运行,处理更复杂的任务,管理更长时间的上下文和持久的内存。我们在这方面还需要继续努力。

尽管 OpenAI 等公司也会做类似的事情,但我认为最终的胜负取决于谁能更好地执行。浏览器不同于聊天机器人,它的前景更为广泛。它需要支持多平台,持续升级,修复大量的Bug,并且要兼容不同版本的操作系统(无论是移动端还是桌面端)。此外,还需要做很多架构决策,比如哪些部分放在客户端,哪些放在服务器端,以及如何保障安全性和隐私,还要处理企业版本的兼容性等问题。

与仅仅专注于大规模计算集群、聊天机器人、图像生成和搜索等多个项目的公司不同,我们专注于浏览器,这让我们在很多方面具备了优势。对于我们来说,浏览器是核心,我们为此全力以赴。如果我们是一家资金紧张的小公司,可能会输给那些大公司,但幸运的是,事实并非如此。我们拥有合理的分发渠道和相当的资金支持,同时也有一支非常优秀的团队。

因此,即使OpenAI等大公司也在做类似的事情,这其实对我们来说是一种正面验证,证明我们的理论和方向是正确的。我们相信开源模型最终会赶上闭源模型的前沿技术,到那时,我们也可以逐步从闭源模型迁移出去,尽管目前在一些前沿任务上我们仍需要依赖闭源模型。

问:如果要在未来增强你们的浏览器,你们会做什么?

斯里尼瓦斯:我之前提到过,浏览器之后的下一步实际上就是操作系统,这是最终的边界。构建一个浏览器来完成各种代理任务,关键是因为你无法完全控制 iOS 或 Android。例如,尽管 Android 是开源的,但你仍然无法控制它。你不能让手机厂商发布你修改过的 Android 版本,除非获得谷歌的批准。换句话说,除非它们默认支持谷歌的核心应用(如 Google Maps、YouTube、Gmail 和 Calendar 等),否则它们无法发布没有这些应用的 Android 版本。即使它们允许你修改系统,很多手机厂商也不愿意销售没有 Play Store 或其他核心应用的设备。所以,最终你需要打造一个超级应用,能够调动所有其他应用,这样你就不再需要通过传统的应用商店来分发软件。

这就是为什么浏览器变得如此重要的原因。浏览器一旦成为一个万能应用,就能够在其中完成各种任务,比如打车、购物,甚至生成快速灵活的用户界面,让你感到即使没有独立的应用,也并不缺失什么。当然,你还是需要像 X(前Twitter)、Instagram 和 WhatsApp这样的社交媒体应用来与他人沟通。因此,打造这样一款浏览器要比仅仅发布一个浏览器更为复杂,你需要说服社交媒体公司以及其他公司,跳过 Play Store,直接跟你一起发布应用。

更为复杂的是,你还要去说服手机制造商,比如三星和摩托罗拉,去销售这样的设备。因此,我们最终的目标是打造一个比浏览器本身更大的愿景。目前来看,我们还未准备好实现这一目标,但第一步是推出一款出色的移动浏览器,借此获得更多的分发渠道,同时不断提升产品的稳定性和响应速度。这样,浏览器就能变得像操作系统一样万能,用户甚至会愿意尝试购买可以运行新版 Android 的新手机。

我认为,若能实现这个目标,意味着谷歌的垄断将被真正终结,因为他们就无法再控制任何东西。现在,谷歌在 Android 上的主导地位体现在默认搜索引擎的控制上,68% 的收入来自移动广告。如果我们去除谷歌搜索作为默认搜索引擎,用户能通过新的方式搜索信息并完成操作,其广告收入将大幅下降。要实现这一目标,关键是通过手机分发渠道来获得市场份额,这需要像三星这样的手机制造商的支持。

同时,我们还要围绕代理模型建立健康的商业模式,例如通过订阅收费的方式,让用户体验这种全新的互联网和服务形式。要让这一切发生,世界必须进行很大的改变。我们并不把 Perplexity 当作短期项目来看,而是一个长期愿景,要实现这一切,可能需要十年的时间。而 Comet 正是朝着这个目标迈出的第一步。

当然,你也可以考虑去构建类似 Windows 或 MacOS 的操作系统,作为竞争对手,但同样,你会面临类似的问题。比如微软不太愿意将他们的应用程序带到你的操作系统上,因为他们不想鼓励竞争。这也是为什么微软的 Office 365 在 Linux 上的体验并不好,Linux 没有得到足够的分发支持的原因之一。

问:如果最终目标是一个AI原生操作系统,那么哪种情况更有可能发生?是苹果最终搞定了它,并将iOS转变为 AI 原生操作系统?微软的Windows 实现了AI原生化?还是OpenAI开始进入这个领域?又或者像 Perplexity 这样年轻的创业公司会成为竞争者?

斯里尼瓦斯:我认为这些都可能是未来的主要玩家,但你永远也不知道。能被列入这些竞争者之一,真的是一种幸运的事情。毕竟,其他公司拥有 10 到 100 倍,甚至更多的资金。

然而,在结构性限制方面,苹果可能面临更大的挑战。的确,如果他们改变搜索和 Safari 的工作方式,他们可能会失去谷歌的广告收入份额。但如果最终法院的裁决让他们不得不放弃这部分收入,他们可能会全力以赴,将 iPhone 转变为更加 AI 原生的产品。

谷歌则不太可能在 Android 上这么快实现这一目标,他们可能会先在Pixel手机上进行尝试,因为那里的分发量较小,不会损失太多广告收入,之后他们可以根据市场反应再与其他设备厂商合作,但他们在这方面的限制也更多。

至于OpenAI,我认为他们并不具备像我们一样去打造硬件设备的能力。说服三星等厂商与他们合作的难度与我们相似。Meta也面临类似的问题,毕竟他们没有自己的搜索引擎、浏览器,也缺乏强大的模型支持。微软的 Windows 则没有手机层面的支持,因此也不太可能像谷歌或苹果那样实现多平台支持。

本文来自“腾讯科技”,编译:金鹿,编辑:海伦,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!