AI热点 2小时前 73 阅读 0 评论

和两位 CEO 聊 Sora: 应用层爆发的里程碑事件,创业者的机会来了

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


AI 应用战争,Sora 打响了第一枪。


99% 的人都搞错了。


「Sora 不是『AI 版抖音』,它更接近『AI 版 ins 或朋友圈』。」这是 Lovart 创始人陈冕,在与极客公园创始人&总裁张鹏、Sand.ai 创始人曹越对话中的核心观点。


就在所有人享受十一假期的第一天,OpenAI 发布了新一代文生视频大模型 Sora 2,以及配套应用 Sora App。一瞬间,全球科技圈被彻底点燃。Sora App 在严格的邀请制下,仍火速冲上美区下载榜第三。


然而,喧嚣之下,争议也随之而来:这会是 AI 时代的 TikTok,一个超级应用的诞生?还是又一个「现象级」的烟火,绚烂一瞬,便迅速冷却?


在与张鹏的对话中,陈冕和曹越给出了清晰的判断。陈冕认为,Sora 是继抖音和 ChatGPT 之后,又一个里程碑式的产品,它真正开启了 AI 的 ToC 应用时代。其核心突破在于,OpenAI 展现了「为产品打造模型,而不是为模型寻找产品」的思路。Sora 通过 Cameo 等功能,巧妙地解决了「AI+社交」的难题,将重点放在熟人关系的「低成本 Remix」共创上,而非单纯追求视频质量。这意味着,定义应用与产品的能力,其重要性正变得与构建模型同样重要。


从技术视角,曹越则表示,Sora 在音画同步、人物 ID 保持和多镜头叙事上的突破,正是为了跨越 C 端消费门槛而做的关键优化。这些优化与产品定义相结合,爆发出了强大的力量。


Sora 的出现,也让两位创始人重新审视 AI 应用的终极方向。他们一致认为,AI 时代最大的机会在于「AI 原生」。


如何定义 AI 原生呢?「你就想,没有 AI,这个业务或内容还存不存在?如果不存在,它就是 AI 原生的。」陈冕解释道。他认为,对于创业者来说,AI 应用的时代才刚刚开始,但不要想着去做 AI 版微信,因为创业公司做通用社交几乎不可能成功。真正的机会在于,将最好的产品创意和最好的模型进行整合。


这场变革也带来了更激烈的竞争。陈冕认为,AI 时代的发展速度远超以往,人才、算力、资本都在向头部集中,导致竞争被前置。这是一个「Go Big or Go Home」的时代:平庸的改良者注定出局。对于创业者来说,这既是最好的时代,也是最卷的时代。


在这场风暴的中心,两位创始人对未来都清晰而坚定。陈冕表示,Lovart 将激进地探索 ToC 的 AI 原生应用。曹越则透露,Sand.ai 将在国庆后推出全新的音画同出模型,直面挑战。


只有那些敢于将顶尖产品创意与模型深度整合、并全身心投入于创造全新体验的玩家,才能最终定义下一个时代。



以下为陈冕、曹越与张鹏对话内容实录,有编辑删减。


解构 Sora:


「AI 原生超级 APP」的雏形


张鹏: 看大家兴奋又略带疲惫的样子,想必是熬夜玩 Sora 了。你们是连夜守着发布,还是第二天一早才发现世界变了?先请两位聊聊体验 Sora 的第一感受吧?


陈冕:我是连夜看的,发布会是凌晨 1 点。看完我马上就去弄美区账号,结果被苹果的安全延迟卡了一个小时,急得不行,大概 3 点左右才拿到邀请码。


坦诚讲,我本来期待没那么高,但用完之后我感到非常震撼。我是一个产品经理出身,最近十年里,能让我感到震撼的时刻只有三次:第一次是 2016、17 年玩抖音,第二次是 2022 年底玩 ChatGPT,第三次就是这次的 Sora。


我觉得 ChatGPT 开启了以模型为中心的时代,而 Sora 则开启了一个应用的时代,尤其是一个 ToC 应用的时代,这是里程碑式的。


我从凌晨 3 点玩到早上 7 点,实在扛不住睡了三小时,10 点起来接着玩,然后就开始拉着团队开会。所以到现在我都是亢奋状态,对未来即将发生的事感到非常兴奋。


曹越:我是早上醒来看到各种群里都炸了。我的感受是,从效果上来说,它非常令人兴奋,而且是一个为产品优化得非常完整的模型。但从模型本身的技术视角看,效果虽好,却没那么令人意外。因为包括我们自己在内,过去几个月也一直在探索视频和声音同步生成的能力。现在大家玩的很多梗,我们内部在早期模型上已经玩过一遍了。所以,这种感受更像是我们内部的兴奋点被释放到了外部。



张鹏:从技术角度看,Sora 2 的核心进步在哪里?


曹越:我觉得有三点:第一,当一个视频模型能同时做到画面和声音同出时,它就越过了 C 端消费的临界点。过去一年的视频模型大多只能生成无声的 GIF 式画面。


第二,它能保持人物 ID,也就是 Cameo 功能。这个 ID 同时包含了样貌和音色。之前有些模型能保留长相,但 Sora 能同时锁定样貌和音色,这让它的可消费性和传播性大大增强。


第三点,也是很多人可能没注意到的,它生成的 10 秒视频带有叙事属性。它不再是单一的片段,而是包含了运镜、多镜头切换(我最多看到切了 8 个镜头)和景别设计。这是一种以前没有展现过的能力。


当这三点结合在一起,就爆发出了强大的力量。


张鹏: Sora 的邀请机制很聪明,形成了病毒式传播。陈冕你作为产品经理,抛开技术,单看这个产品,有什么值得圈点的创新吗?


陈冕:这是我第一次看到一个 AI 原生超级 APP 的雏形。


首先,OpenAI 这次想得非常清楚:它在为产品打造模型,而不是为模型找产品。这表明它不只想做一家模型公司,更想做一家消费互联网产品公司,野心昭然若揭。模型可以被快速追赶,但一个成功的产品,其用户和网络效应是很难在一个月内被颠覆的。


其次,它解决了「AI+社交」这个大命题。最大的 ToC 应用就是社交,而 Sora 的 Cameo 功能就是答案。为什么大家都在和 Sam Altman 或者自己的朋友合拍?因为社交的乐趣建立在熟人关系之上,而不是视频质量本身有多高。你朋友圈的照片质量就一定很高吗?不是,但因为是你熟悉的人,所以感觉不一样。这也解释了为什么邀请码机制能如此成功,它天然就适合基于社交关系进行裂变传播。


最后,它用一种极其简单的方式解决了「共创」的问题。AI 降低了创作门槛,而 Sora 的左右滑动交互,本质上就是一种低成本的 Remix。你在别人的视频上进行再创作,这种交互方式简单到了极致——就是滑动和点击,这是顶级移动互联网产品的共性。


所以你能理解我有多兴奋。作为一个产品经理,这些问题我想了一年多,现在有人把答案做出来了,就放在我面前,这太酷了。后来它迅速登上美区 App Store 总榜第三,也验证了它的成功。


为产品打造模型,


而不是为模型寻找产品


张鹏: 确实,你刚才提到了一个核心观点:Sora 这个产品形态的成功,是因为它的模型是围绕产品来打造的。这与许多先做模型再找应用的团队形成了鲜明对比。从技术角度看,有哪些明显的迹象能证明这一点?


曹越:我非常同意陈冕的观点。OpenAI 展现出了一种强大的垂直整合能力,即组织内部同时拥有顶尖的模型能力和敏锐的产品洞察力,并且能让产品需求反过来指导模型的迭代方向。


这已经不是第一次了。上一次的典型案例就是 ChatGPT。GPT-3 模型的核心能力早已存在,但 OpenAI 真正的厉害之处在于,他们将这种能力对齐了普通用户的需求,把它打磨成了一个极其易用、易于传播的产品。这种组织能力是非常高级且稀缺的。大多数团队都会陷入「先做模型还是先做产品」的内部矛盾中。


具体到 Sora,一个关键的例子就是音画同步。从纯技术角度看,把声音做好,可能不像把视频或语言做好那么难。但从产品和用户视角看,声音是决定性的。正是因为 Sora 能让音画同步输出,才使得普通用户生成的视频具备了直接的可消费性,越过了 C 端产品普及的临界点。


这种洞察力——关注用户真正想要什么,而不仅仅是技术上什么最难——是一个只会埋头训练模型的基础模型公司可能不具备的。OpenAI 再次证明了,他们不仅有能力打造强大的模型,更有能力将模型与产品完美结合,这正是他们最令人敬畏的地方。


张鹏:OpenAI 在技术和产品之间的切换并非没有代价。去年那场宫斗大戏,现在看来,或许正是为了将重心彻底转向产品侧而经历的必要撕扯。Sora 的出现提示我们,在追赶模型的同时,定义产品的能力也必须跟上。你怎么看呢?


陈冕:这完全说出了我的心里话。我这两天想明白一个关键点:Sam Altman 是一位非研究员出身的 CEO,他是一个顶级的「产品+融资+战略」大师。在过去几年由研究员主导的「模型竞赛」中,让一个纯研究员主导的公司率先做出顶级产品,是很难的。


OpenAI 的成功得益于其独特的组织结构:它既拥有顶尖研究员,又由一位非研究员出身的顶尖产品战略大师领导。同时,它兼具创业公司的高融合度与巨头的雄厚资源。正是这种独特的组合,让 OpenAI 率先做出 Sora 变得顺理成章。


我之所以兴奋,是因为这预示着整个行业的组织方式和话语权将发生变化。定义应用和产品的能力,其重要性正变得与构建模型同样重要。就在大家还在讨论 OpenAI 的模型领先优势是否缩小时,他们已经通过产品开启了下一阶段的竞争。底层模型的竞争格局已相对集中,但 Sora 的出现,就像当年的 ChatGPT 一样,正式拉开了 AI 应用层竞争的序幕。



张鹏:除了刚才总结的那些结构性突破,你觉得 Sora App 在产品层面,有哪些做得特别聪明的地方?


陈冕:我认为 Sora App 的背后一定有产品高人。大家不要觉得一个产品看起来简单,越是简单的产品,背后越见功力。产品经理最难的不是做加法,而是做减法,这需要顶级的判断力。你用 Sora App 会发现,它几乎上手就会用。虽然在工程上还很粗糙,比如会弹出代码报错,甚至没有安卓版,但它的第一版在产品设计上,我认为已经做到了极致。


它的交互就是最简单的上下滑、左右滑。创作流程也极其简练:用 @ 来选择人物(Cameo),然后输入 prompt,整个过程行云流水。它所有的设计都在鼓励你进行社交。能把流程做到如此简单,背后一定是有强大的组织能力和优秀的产品经理在支撑。


第二个关键点,也是它最特别的地方,就是所有设计都紧密围绕「社交」。我为什么说它是「AI 的 Instagram」,你看它的核心功能:


ID 保持是基础。你要社交,总得先让别人认出你的脸,你才能 @ 朋友的脸,两个人才能互动。


音画同步是为了让大家「玩起来」。两个人要对话,要一起表演,就需要音画同步。你看所有双人共创的视频都依赖这个功能。只有在最需要即时性、UGC 和社交性的场景里,才需要把音画同步做得如此简单和极致。


再看它的分镜头控制。它限制视频时长为 9 秒,这完全是朋友圈的逻辑。同时,短视频也需要叙事性,所以它提供了多镜头切换的能力,让一个 9 秒的视频也能有故事感。


它做的所有事都在为「社交」服务。包括它的邀请码策略,一个人只能拉四个,就是为了让你邀请最亲密的朋友,快速建立「熟人关系链」。他们甚至没做营销,这证明从产品、模型到市场,内部已经想得非常清楚,并串成了一条高效的链条。这件事,如果没有高度整合的组织和 CEO 的亲自拍板,是绝对无法实现的。


张鹏:现在假定你是 Sam Altman,能帮我们想象一下 Sora 是怎么做出来的?


曹越:在这里我有一些不太一样的观点。首先,我觉得没必要神化 Sam Altman,他可能只是「许可」了这件事,而非亲自发起。


关键在于,Sora 的诞生更可能是一个「看菜下饭」的过程。当你知道现有模型能实现哪些能力后(比如音画同步、参考 ID 生成,这些对算法人员并非不可预测),再将这些能力与产品场景结合。对我个人而言,认知上最大的迭代是,它把「叙事」也整合进了模型,而不是用传统的产品方式来做,这点非常出色。


但是,要说团队一年前就决定要做社交,我觉得绝不可能。更大几率是,一个出色的产品经理,看着手里已有的「土豆丝」(模型能力),决定炒一盘菜。当你能做参考 ID 生成,但在北美 deepfake 是条红线,你不能随意生成人脸,那么「基于许可」的熟人社交就成了一个自然而然的选择。


所以,整个过程更像是组织内部紧密耦合、上下文对齐得很好,而不是产品提需求、模型再排优先级的传统流程。


张鹏: 所以你觉得这更像是一个归纳而非演绎的过程?把所有可用的「菜」搁在一起,然后推导出到底能炒出什么?


曹越:是的,从我的视角看,这个过程可能没那么神奇,但的确不容易。它需要大家做一些 mindset(思维模式)的切换。作为一个做模型的团队,我知道应该跟产品经理做更深度的交流,可以往某个方向去优化。但产品同学也需要去理解模型到底是怎么回事。


所以我觉得它更多是这样迭代出来的,而找到那个 fit 是关键。一旦找到这个 fit,如果他们的团队本身在产品侧就比较成熟,那么执行起来是能做到的。但最难的是最开始的那个认知:我们能做什么?在哪个地方是真正 fit 的?这个是关键。


超越技术:AI 时代的组织护城河


张鹏: 我们来聊聊视频生成的技术。很多人并非技术出身,但很想了解视频生成技术在过去几年经历了哪些关键阶段的变化?


曹越:我来梳理一下视频生成的几个关键里程碑。


第一个关键里程碑是今年 2 月 OpenAI 发布的 Sora,它是一个巨大的认知突破,用「扩散模型+Transformer」的结构证明了 AI 可以生成高质量的单镜头素材。


紧接着,上半年以 Veo 等模型为代表的音画同步技术,让 AI 生成的人物表现力大增,跨越了「恐怖谷」,使其能进入主叙事链路。


差不多在同一时期,还有另一条关键技术路线——自回归模型(如 MAGI-1 和 Genie),它像语言模型一样逐个 Token 生成视频,被证明可以生成更符合物理规律的视频。


然后是最关键的时刻——Sora,它核心叠加了「叙事能力」,能一次性直出一个包含有意义镜头切换的短片,让视频模型从生成「片段」进化到了能直出「可消费的完整故事」。


最后,Sora 还有一个常被忽略但官方极为重视的突破,即「物理准确性」,官方报告通过体操、跳水等案例来强调这一点。


张鹏: OpenAI 的报告里,有什么让你觉得在技术上有启发的东西吗?还是说他们已经把关键问题都藏起来了?


曹越:报告里关于如何实现物理准确性的描述确实相对晦涩,远没有达到学术论文的清晰度。它只是说「我物理上更准确」,但并没有详细解释方法,这和实现它的路径之间差距还是很大的。


但这至少指明了一个方向:OpenAI 非常关注物理准确性,并认为自己已取得阶段性成果。这对我来说是有启发的。



张鹏:我相信国内顶尖的模型公司都在加班加点地追赶,你估计他们需要多久才能做出类似 Sora 的产品?


曹越:我估计大概需要三个月。从产品维度看,OpenAI 的优势在于模型和产品的垂直整合,但如果只看模型能力,追赶者与它的差距并没有想象中那么大。一个关键能力是音画同出,Veo 3 在 5 月份已经做到,我们内部也将在国庆节后发布一个具备这种能力的新模型。所以,这更像是一个如何将模型能力完整地展示为产品的过程,单论模型本身,海内外团队的差距并不大。


陈冕:我觉得会非常快,第一个产品可能一个月之内就会出来。


原因有两方面:一个是模型能力会迅速拉平。不论是谷歌还是国内公司,很快会发布新模型追赶上来,OpenAI 的 API 也可能很快开放;另一个是真正的战场在应用侧。


对此,我有两个核心观点:


第一,国内的互联网大厂现在应该睡不着觉了。大家对 Sora 有个误解,它不是「AI 版的抖音」,而是「AI 版的 Instagram/朋友圈」,它的本质是 AI 社交。


在中国,通用社交有极强的头部效应和网络效应,赢家通吃,比如微信。内容平台可以百花齐放(抖音、小红书、B 站),但社交只有一个。如果 Sora 真的做成了社交超级 App,将会动摇现有所有平台的流量根基。这会引发一场「腥风血雨」,无论是海外的 Meta、Google,还是中国的几家大厂,都会疯狂内卷。所以我说一个月都是保守估计。


第二,对于创业者来说,AI 应用的时代才刚刚开始,但不要想着去做 AI 版微信,因为创业公司做通用社交几乎不可能成功。真正的机会在于,将最好的产品创意和最好的模型进行整合。


张鹏: 陈冕你觉得 AI 社交的帷幕被拉开了。如果把你切换成 Sam Altman 的角色,接下来三步棋会怎么走?


陈冕:首先,我想澄清一点,CEO 之前的背景不重要,重要的是在当前这个时间点,CEO 和整个团队都要有「复合认知」和「复合能力」。本质上是产品能力和产品认知变得越来越重要了。


回到你的问题,基于目前 Sora 的情况,你要做的三件事是什么:


第一,勇敢地做 ToC。Sora 掀开了 AI 面向泛 C 端的帷幕,这件事可以开始认真考虑了。


第二,加强组织能力的垂直整合。未来的组织,产品需要懂技术,技术也需要懂产品。在前一个阶段,研究员(researcher)可能只需要工程能力,但现在他们也需要产品思维。技术是 AI 革命的基石,但现在技术也开始离不开产品了。不同职能的人,包括研究、工程、产品,必须深度整合。


第三,Go big or go home(要么做大,要么出局)。AI 时代的机会比互联网时代大 10 倍甚至 100 倍,但市场也可能更加头部集中。人才、算力、资源、资金都在向头部集中。AI 的发展速度比以往任何技术革命都快,这导致竞争被前置了。大家都能看到未来,共识很强,所以都用充裕的资本提前进入竞争,内卷加剧。你本来可以慢慢做应用,但现在不行了。API 和算力的价格都很高,如果你没有足够的钱,连 API 费用都付不起,还怎么竞争?所以,我的建议是,业务要更激进地增长。这对所有创业者来说,是最好的时代,也是最卷的时代。


张鹏:我想再追问一下关于「组织能力整合」,有什么迹象表明这种整合是对或错呢?


陈冕:坦诚说,我们也在探索。举个实际例子:一个产品经理会从用户出发,想着用现有技术去「打补丁」,比如优化提示词。但我们的技术同学会提出一个更未来的概念:为什么整个画布不能是一个上下文窗口?


这是一个产品经理最初可能想不到的。但反过来,你光有大的技术变革也不行,设计师会问你,「所以呢?这对我有什么用?」


这就需要产品和技术的深度整合。你既要拥抱新技术,又要找到一个「灵光一现」的场景,让技术真的能被用户玩起来。这要求组织非常敏捷,没有部门墙。根据我的经验,他们必须物理上坐在一起,因为「物理距离也影响心理距离」。我脑海里 Sora 的诞生画面就是:在一个复合型团队里,一个既懂模型又有产品感的人突然想到一个新玩法,然后整个团队能迅速形成共识并落地。这种组织能力至关重要。


张鹏: 我也想听听曹越对这个问题的看法。你最近在组织内部有什么相关的思考和观察吗?


曹越:在我看来,组织内部绝大多数的摩擦都来源于「上下文不对齐」。不同专业背景的人(比如算法与业务)之间沟通带宽很窄,因此提升组织效率的本质,就是如何让大家更快速地对齐上下文。


要实现对齐,有两个基础:第一,个人的 EGO 要小,这样才更容易接受别人观点;第二,要善用语言模型这个「补全上下文的神器」,比如,当我听不懂一段话时,我会把它发给 Gemini,让它帮我理解。


另外,我有一个强烈的感觉:AI 时代,产品和模型的边界比我想象的要模糊得多。这对组织的要求是:做产品的人要去理解模型,做算法的人也要和产品的人多交流。大家要多一起吃饭、散步,在非正式的沟通中对齐上下文。我非常同意陈冕的观点,很多伟大的想法不是设计出来的,而是碰撞出来的。组织就像一个容器,把不同背景的人「Remix」在一起,最终产生伟大的创意。


AI 应用的黄金时代和「最卷」的战场


张鹏:我观察到,过去大家追求让普通人能拍出好莱坞大片,或帮专业公司降成本。但 Sora 出来后,路线似乎变了,大家更像在玩,而不是想做大片。这是否意味着,过去那种降低成本、普及好东西的思路,未必是最好的?


陈冕:对,我觉得这是一种惯性思维。AI 时代最大的机会,本质上是 AI 原生的机会。


如果你想的是给好莱坞大片降成本,那你其实还是在做提效,而提效不可能带来革命。革命才诞生伟大的新机会。巨头想提效无可厚非,但创业者绝对不能用这个思维。


我们从第一天起,思考的都是:AI 时代会带来什么样的新体验和新内容?这才是本质。比如你和 Sam Altman 合拍的那个视频,在过去几乎不可能发生,但现在可以随时随意地发生。这就是原来没有的、从 0 到 1 产生的新体验,我们称之为「AI 原生」的体验。


如何定义 AI 原生?你就想,没有 AI,这个业务或内容还存不存在?如果不存在,它就是 AI 原生的。这是一个很重要的思维切换。如果你想在 AI 时代做一家伟大的公司,就必须回答这个问题。如果答案是「体验会打折」,那你可能做错了;如果答案是「业务会直接消失」,那你就做对了。


所以我其实不认为未来会是「好莱坞大片人人都能拍」。当年抖音出来,大家以为短视频是另一种电影,后来发现它是生活记录视频,是摄像头的平权化。我觉得这次也会是不同的东西。


张鹏:如果我们的目标是改变供给,而非降本增效,这会如何改变 AI 模型技术的发展路线,以及模型与产品的融合方式?


曹越:首先,我非常同意这个观点。这一波 AI 本质上是一场生产力革命。无论是语言模型、图像视频模型,还是现在可以音画同步生成的模型,它们在初始阶段都是在改变供给。


但关键问题是:到底要改变的是什么供给?这是一个需要从产品侧深入思考的问题。以视频为例,过去一两年我最大的感受就是,视频这个品类实在太庞杂了。有电影、短视频、中视频,甚至游戏也可以看作是一种交互式视频。


从内容的视角反推,我们就要思考:哪些品类会率先被改变?机会到底在哪里?产品与技术的「fit」又在哪里?随着模型能力的进化,我们看到机会也在演变。一开始可能是人利用各种模型工具去制作一个片子;现在,一个模型已经可以端到端地生成一个 10 秒的短片。再过一两年,模型能独立生成多长的、可消费性的内容呢?


沿着这个时间线推演,会涌现出不同类型的机会。它可能是一种像表情包一样的玩梗视频,也可能是需要更长叙事的 AI 短剧,还可能是有更多交互的形态,比如交互式游戏,用户可以点选分支剧情。甚至,我们能否做出陈冕之前提到的那种,超越简单滑动的、具有极致交互体验的 AI 原生视频产品?



张鹏:Sora 的出现,在未来三个月,对中国的创业团队和投资环境,究竟是好事还是坏事?可能会如何演进?


陈冕:我认为有两个方向的变化,最终是好是坏还不好说,但大概率不会变得特别差。


首先是积极的一面:AI ToC 的想象空间被极大地拓宽了。创业者能探索的方向更多,能做的事情也更多。光有模型能力已经不够,需要更复合的能力加入,这对创业公司是利好。我们能清晰地看到 AI 走向应用的趋势,这几乎是一个比互联网大 10 倍甚至 100 倍的超级机会。能力要求越复合,组织要求越敏捷,创业公司的机会就越多。


但另一方面,也存在「要么做大,要么出局」(go big or go home)的问题,即头部集中会更明显。因为行业发展太快,竞争趋于白热化。虽然巨头如 OpenAI 也并非无所不能——比如他们的 Agent 体验就不一定比创业公司好——但速度、资本和人才的密集,导致大家都在烧钱。尤其 C 端 APP 更烧钱,就像移动互联网早期一样,大家都知道未来能盈利,所以早期竞争异常激烈。这就不可避免地导致资本会更加向头部集中。


所以,总的来说,对于整个创投市场,投资 AI 会更加疯狂和「FOMO」(错失恐惧症),但资金会更向头部集中。而对于创业者来说,这既是最好的时代,也是最「卷」的时代。你必须飞快地做大、变强、找到产品市场契合点(PMF),否则就只能出局。


曹越:我对未来非常非常乐观。无论 Sora 是否出现,这个时代都充满了层出不穷的机会。我非常认同陈冕的观点,这是一个有巨大增量的时代。从底层来看,这波 AI 带来了至少几个数量级以上的效率提升,这种基础生产力的变革最终会催生出极多的机会。


另外一个维度是,中国的创业者完全可以放眼全球市场。坦率地说,中国的创业者非常「卷」,无论是数量还是质量都非常出色。


回顾过去,00 到 10 年,大家主要聚焦中国市场;10 到 20 年,顶尖的企业家已经在中国和海外市场都取得了成功。而在这个新时代,趋势一定会更加全球化。我相信,中国的工程师红利和企业家精神红利,能为世界创造巨大的价值。


张鹏: 最后一个问题,想请两位分享一下:看到了 Sora 之后,你们各自有什么新的目标和计划?


曹越:首先,我们最新的音画同出模型,将在国庆后大家就可以使用了。Sora 让大家看到了音画同出最终的 ToC 机会是什么。国庆后欢迎大家去评测和对比。


未来半年,Sand.ai 会继续专注于 AI 视频方向,为普通和专业用户提供 SOTA 级别的模型和产品。我们对此非常有信心,希望能抓住这个大方向上的机会。


陈冕:对 Lovart 来说,Sora 对生产力侧是巨大的变化。之前 Nano Banana 出现时,我们的流量翻了一倍,希望 Sora 2 开放 API 后能再翻一倍。生产端工具的 PMF 已经得到验证,并且会更强,我们肯定不能错过这个机会。


另外,我们会激进地探索 ToC,但具体做什么我先卖个关子。


第三,我们会激进地扩张团队,欢迎产品、运营、设计、研发的同学加入我们,我们希望做一家顶尖的 AI 原生应用公司。


张鹏: 我逼问一下,12 月份能看到你 ToC 产品的进展吗?


陈冕:(笑)进展肯定会比这更快。但我们对 C 端产品有更长的生长预期。如果一个产品能瞬间爆发,那可能还是大厂的机会。


张鹏:好的。今天两位嘉宾的分享让我们对 Sora 这件事看得更深入、更清楚了。一位准备迎接整个产业在 AI 视频模型上的高度关注,另一位准备接住翻倍的流量并向外扩张。能感觉到两位都非常兴奋。


文章来自于微信公众号 “极客公园”,作者 “周永亮”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!