AI热点 2小时前 154 阅读 0 评论

对话 Agnes AI:“我们想让全球的用户,用到更好的 AI。”

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

“不要害怕做主流,主流才是下一个入口”


在 AI Agent 应用浪潮中,一个来自新加坡的新名字——Agnes AI,正以一种特别的方式进入我们的视野。一方面,是其宣布的惊人增长:不到三个月,DAU 突破十万;另一方面,却是市场声量相对的沉寂。


这种“数据”与“体感”之间的反差,究竟从何而来?带着这份好奇,我们与 Agnes 的联合创始人 Will 进行了一次对话,试图揭开这家高速增长公司背后的秘密。在访谈中,他坦诚地回答了我们提出的疑问,也让我们注意到了 Agnes AI 的特别之处。



所以,Agnes 是谁?


🚥 十字路口:


请介绍一下 Agnes AI 团队成员的背景?


🧑🏻‍💻 Will 瑜宸:


我们的创始人 Bruce:新加坡国立大学在读博士,美国加州大学伯克利分校数学与计算机双学士,硅谷大厂(微软、领英等)背景,兼具学术深度与工程实力,发表多篇论文,主导开源技术成果应用于下一代架构。


核心团队来自:麻省理工大学(MIT)、斯坦福(Stanford)、美国加州大学伯克利分校(Berkeley)、新加坡国立大学(NUS)和南洋理工大(NTU)。


🚥 十字路口:


Will 可以介绍一下你自己吗?你和 Bruce 怎么认识的?如何决定一起创业?


🧑🏻‍💻 Will 瑜宸:


我 2010 年去 UC Berkeley 念本科,回国创业做供应链金融。


我是在大学期间的活动上认识的 Bruce,当时他是学生会主席,且他已经在创业做一个类似于 SnapChat 的大学生社交 App,叫做「Sobrr」。


我们 2019 年开始一起创业,在国内做数字营销公司「KiWi Technology(开为科技)」。



Will 在谷歌的路演分享,图片由 Agnes 团队提供


🚥 十字路口:


你们什么时候决定转型开始做 AI?


🧑🏻‍💻 Will 瑜宸:


2024 下半年。当时我们 toB 业务遇到挑战,这个商业模式在 AI 时代太落后,所以我们立即调整方向,All in AI。


🚥 十字路口:


你会如何用一句话向新用户安利 Agnes AI 这款产品?


🧑🏻‍💻 Will 瑜宸:


Agnes AI: Your daily copilot for collaborative vibe working.


🚥 十字路口:


可以给我们一句中文的安利吗?


🧑🏻‍💻 Will 瑜宸:


如果是中文的话,可能是一个愿景:


我们想让全球的用户,用到更好的 AI。



Agnes 产品登录后的首页截图


“三个月,10 万 DAU”


🚥 十字路口:


方便分享 Agnes 目前的 DAU 及留存率数据吗?


🧑🏻‍💻 Will 瑜宸:


7 月 4 日首发至今(10 月 5 日)三个月时间,注册 100 万+,DAU 日活用户 10 万+。


🚥 十字路口:


你们掌握 Genspark、Manus 等其他 AI Agent 产品的数据吗?与它们相比,该数据处于怎样的水平?


🧑🏻‍💻 Will 瑜宸:


据我们所知,Agnes 和 Genspark 的 DAU 量级已经差不多了。


🚥 十字路口:


Genspark 在全球范围是 AI Agent 产品的大爆款,但我们之前都没太听说过 Agnes。是什么原因呢?是因为你们不 PR、因为你们的用户不在中国和北美地区、还是因为什么原因?


🧑🏻‍💻 Will 瑜宸:


首先我们发布的时间比较晚,7 月 4 日。其次我们一开始只在东南亚做,9 月下旬才去北美。然后我们在中国的 PR 也只是介绍 PC 端的功能。


我们 9 月份的 App 下载量超过 100k,在东南亚和拉美的很多国家的 App Store 的效率榜都排在前面。9 月下旬之前我们 75% 都是这些国家的用户,因为我们 9 月 20 日才开始在美国的推广。



图片:破百万用户庆功蛋糕,由 Agnes 团队提供


🚥 十字路口:


对用户来说,从具体的功能层面来讲,你们和 Manus 与 Genspark 等其他通用 AI Agent 有哪些差异?


🧑🏻‍💻 Will 瑜宸:


我们一个逻辑就是我们很多任务都不用提前选择,直接在对话框里面输入(帮我生图、帮我生 PPT 等等)就可以。


除非是一些特别功能,比如希望做一个 Wide Research,才需要去勾选一下。


🚥 十字路口:


方便透露你们的 ARR 吗?上个月 Manus 公布他们的 ARR 是 9000 万美金,我也看到有报道提到 Genspark ARR 是 3600 万美金。


🧑🏻‍💻 Will 瑜宸:


我们 9 月 15 日才开始收费。如果按周来看,我们最后一个周是 15 万美元,简单乘以 4 是 60 万的 MRR,乘以 12 的话是 800 万美元 ARR 。


我们的 ARR 和 DAU 是正相关的,我们的 DAU 在 10 月会比 9 月翻倍,11 月又会比 10 月翻倍。如果我的付费率变动不大,那么预计到 11 月我们的 ARR 会是现在的 4 倍,达到 3200 万美元。


🚥 十字路口:


好奇你们的北极星指标是什么?


🧑🏻‍💻 Will 瑜宸:


我们的北极星指标就是 DAU。


因为我认为 AI 应用的付费率不会超过 5%,所以付费订阅不最好的商业化路径。ChatGPT 最近也在思考电商、广告、toB,对吧?


所以说白了,都调用大模型的话,每个人都能拼积木拼出来一个东西,那么你最重要的是什么?是要先成为一个主流的应用,有用户流量、有停留时长,这才 make sense。所以我们的北极星指标就是 DAU,其他指标都会跟随 DAU 增长。


🚥 十字路口:


你们在不到三个月内的时间内,实现了令我们难以置信的增长,能否复盘一下期间的关键决策是什么?


🧑🏻‍💻 Will 瑜宸:


核心团队比较懂 AI 和技术,指定的产品开发方向策略比较准且长线。


作为新加坡公司从东南亚起步逐步发展全球市场,整体增长表现较为稳健。


专注的是场景不是功能,用户有什么需求才会上什么功能,不做垂类工具,具备协作能力。


🚥 十字路口:


我觉得听起来还是有一些抽象。方便分享一下如此告诉增长的背后,你认为你们做对了哪一件或者哪几件事情吗?


🧑🏻‍💻 Will 瑜宸:


首先从团队背景来讲,Bruce 做过社交软件「Sobrr」,所以他是既懂 AI(他是新加坡国立大学的 AI 博士)又有做百万用户社交软件的经验,结合在一起,我认为我们会比做出比较正确的决策。


那第一点就是移动优先。这是一个巨大的市场。


第二点就是我们要从东南亚这样的 Emerging Market 去起步,积累用户。


第三点是我们会思考 AI 时代的用户需求。因为到最后,你的生成质量会大差不大,用户体验的最明显差异是在速度上。有了速度,才能满足用户的体验。


“这一波 AI 创业对团队的底层技术背景要求很高”


🚥 十字路口:


我想所有 AI 产品都有这样的追求,但更快往往也意味着质量达不到用户的需求?


🧑🏻‍💻 Will 瑜宸:


核心难点在于如何通过工程去实现。我们的开发团队的能力还是很可以的,有两点优势:一是交付新概念的落地能力比较强,二是他们的执行力非常强,我们十一假期国内 70 多人的团队都在加班。


🚥 十字路口:


听起来你很骄傲于 Agnes 拥有一个背景很好的技术团队。


🧑🏻‍💻 Will 瑜宸:


这一波 AI 创业对团队的底层技术背景要求很高。因为首先你要懂 AI,然后就是你得有技术背景,对产品有 sense。


🚥 十字路口:


我想继续了解更多你们的技术细节,我注意到今年 WAIC 的分享上,Agnes 创始人 Bruce 分享时提到了自研模型 Agnes-R1,以及一篇论文展示了高达 70% 的 token reduction,实现了现在的成本结构。


能否用更通俗的方式解释一下,这是如何实现的?它是否意味着 Agnes 的推理成本远低于行业水平,并构成了核心壁垒?


🧑🏻‍💻 Will 瑜宸:


Bruce 作为第一作者发表了很多论文,而且多篇被顶级会议收录(ICIS 2025 Nashville 和 ICLR 2025 这种顶会),很多论文被引用次数也排名很高。所以从顶层模型设计开发的理念层面是先进的。


Agnes 科研团队在产品架构和应用层面都有发表多篇被顶级会议收录的影响力论文,模型能力、产品架构、算法和极强的工程交付能力和落地执行力决定了产品的用户体验。


因此答案是:是的,底层科研能力会形成核心壁垒。


🚥 十字路口:


能否再往下拆解一步?比如,是论文中的哪一个具体算法或架构设计,帮助 Agnes 做到这点的?


🧑🏻‍💻 Will 瑜宸:


主要两个吧,Bruce 实际上发了四篇论文,两篇关于架构、两篇关于应用。


关于架构的主要是 CodeAgents。


关于我们自己的模型有一篇论文叫「DSPO」。


关于应用的第一篇是那个我们自己的产品架构叫 「AOS:Agentic Office System」,第二篇叫 「Effective AIGC」是关于生图的。


说到降低 Token 消耗量,在论文里面,最明显体现的是用代码来代替自然语言用于 agents 之间的交互。我们对多个数据集进行了 benchmark 测试,包括 HotPot 和 GAIA 等,基本上能做到 40%~70% token 降低。


此外,我们的编排模型在执行任务时会通过更优化的任务编排来实现剪枝。这种剪枝既能提升用户体验,又能迅速识别出哪些内容与用户实际需求不匹配,直接将其过滤掉。


第三点,我们在工程上也有一些优化。比如说我们会采用一些 A Star 算法,就是很多任务都是基于 DFS 或 BFS(即要么深度优先,要么广度优先)的搜索方式,而我们通过 A Star 算法结构的调整优化,可以进一步降低我们的整体 token 消耗量。


🚥 十字路口:


嗯,这些论文大家也可以都去看看学习一下。


🧑🏻‍💻 Will 瑜宸:


有些友商愿意底层全都接贵的 API,他们不太 care 现在自己的 API 成本。这也决定了他们不可能成为一个百万日活的产品,要不然他们的钱会烧得很快。


当其他模型推出新功能时,他们加上去就行,融到自己的产品中,他们的接口和产品不用太调。


🚥 十字路口:


你们怎么做的呢?


🧑🏻‍💻 Will 瑜宸:


我们现在自己有一个 7b 参数的模型,用来做整体的编排调度;然后我们自己在 pipeline 一些 32b 参数的模型来做替换。不同类型的 32b 模型会向上蒸馏出一个 MOE 模型。


🚥 十字路口:


但有观点认为接 SOTA 模型(State of the Art,当前最先进水平的模型)才能给用户最好的体验和效果,因为不管怎么说,OpenAI、Anthropic 等基模厂商都用了最多的钱在训模型。


🧑🏻‍💻 Will 瑜宸:


我认为这要看情况。


这也是为什么我们的 Action Model 只做 32b,因为它只是用于这个类型的任务生成。比如单独的 PPT 是一个 32b 模型,单独的表格是一个 32b 模型,或者是在做 Deep Research 时是一个 32b 模型。


并且不是所有任务都会调用我们自己训出来 32b 模型,会有一个编排调度来决定哪些任务用我们自己的模型、哪些用外部 API。


🚥 十字路口:


或许友商们只接 SOTA 模型厂商的 API 也有他们的考虑。


Agentic AI for everyone


🚥 十字路口:


今年涌现出非常非常多通用的 AI Agent 产品,Agnes 的核心差异化体现在哪里呢?


🧑🏻‍💻 Will 瑜宸:


首先是集成功能后的协作能力,生成任务完成后邀请团队协作提升效率。


各个类型的任务生成速度、质量都是市场一流水平。



Agnes 官网对于「团队协作能力」的介绍


🚥 十字路口:


之前咱们沟通时,你提到过 Agnes 是有产品哲学的公司。给大家介绍一下你们的产品哲学是什么?


🧑🏻‍💻 Will 瑜宸:


Agentic Vibe Lifestyle (Agentic AI for everyone):让全球用户体验到好用的人工智能,让 Agnes 免费用户体验到其它应用的付费功能,带领全球用户真正走入消费级 AI 应用时代。


免费开放别的产品高级账号的功能,每个月免费账号的各类型任务量比有些应用的付费账号任务还多,各类型任务生成的用户体验都很好。


做用户喜欢的产品,做主流产品。


我们的创始人 Bruce 曾经说过一句话:"不要害怕做"主流",主流才是下一个入口。"


🚥 十字路口:


之前你和我们提到 Agnes 迭代速度非常快,能否介绍一下近期你们的重要产品更新?


🧑🏻‍💻 Will 瑜宸:


AI Design 进行了升级,近期会上线 AI Sheet(Excel)功能。


🚥 十字路口:


最近 AI Design 具体升级了什么?


🧑🏻‍💻 Will 瑜宸:


主要是对一些之前的问题进行了修复,比如两张图片合并成一张、对主体的识别等。我们还优化了一些细节功能,例如更换新背景的同时保持某一部分内容不变。另外,我们也进一步提升了生成图片的速度。这是主要的几点。


🚥 十字路口:


Agnes 的功能蛮丰富的。请问你们做什么、不做什么的研发优先级是如何确定的?


🧑🏻‍💻 Will 瑜宸:


根据用户和场景的核心需求定开发优先级,有用户调研的团队。


🚥 十字路口:


在团队与用户接触的过程中,你们有发现什么用户使用 Agnes AI 的特别故事吗?尤其是让你们感到意外、或者带给你们启发的故事。


🧑🏻‍💻 Will 瑜宸:


我们收到了很多来自东南亚和中东的教师反馈邮件,不仅是阿布扎比,还有菲律宾、越南和马来西亚的老师们。他们特别喜欢我们的产品,因为当他们上课前只有很短的时间需要制作新的幻灯片时,我们的生成速度能够完全满足他们的需求。


其次,我们还收到了菲律宾政府人员(GOV.PH)的邮件反馈,他们喜欢使用我们免费开放的全量功能。这也是他们青睐我们产品的一个重要原因。比如说,如果你想让 PPT 内容更精准,你可以先做一个深度调研,特别是当主题是你不熟悉的领域。完成调研后,再基于调研结果制作 PPT,内容质量就会大幅提升。在 Agnes 中,这整个流程完全不需要切换工具。用户不需要先用 ChatGPT 或购买 Perplexity 的付费账号做深度调研,然后再切换到其他工具制作 PPT。这种一站式体验是 Agnes 效率提升的关键。


🚥 十字路口:


现在用户们在如何使用 Agnes?和你们的预期一致吗?


🧑🏻‍💻 Will 瑜宸:


我们的产品功能是逐步上线的,7 月只有搜索和深度搜索 + PPT + Notebook 三个功能,8 月 1 日上线了 AI Design(Image 和 Video)。


开始用的比较多的是 PPT 功能,后面用户使用 Search 和 Research 的比例逐步提升(从整体任务数量上来看)。


AI Design 上线后增长也比较快。


PPT 的功能依旧是目前最火热的非搜索类任务,和预期基本一致。



Agnes 官网首页关于 AI PPT(Slides) 功能的介绍


🚥 十字路口:


在快速增长的同时,你们面临的最大挑战是什么?


🧑🏻‍💻 Will 瑜宸:


还好,目前都在按我们的计划进行,没有遇到特别大的挑战,科研储备和产品开发能力以及推广获客能力都有提前规划,随着用户基数不断快速提升到下一个量级可能会遇到一些各地区用户文化差异的挑战和整体全球用户运营的挑战。


出发的原因和未来的蓝图


🚥 十字路口:


听说 Agnes 即将发布一款硬件,它的核心功能是什么?


🧑🏻‍💻 Will 瑜宸:


Agnes 将推出一款 AI 耳机,预计于 2025 年底至 2026 年初上市。


Agnes AI 即将推出的耳机产品的概念视频。初剪版本,由 Agnes 提供。


🚥 十字路口:


对于一个成立不久的 AI 公司,做硬件是非常重的决策,投入和风险都很高。为什么你们认为现在就是推出耳机的正确时机?


🧑🏻‍💻 Will 瑜宸:


首先,中国 OEM 做硬件有优势,我们的零售价在美国可以定得很低,让它是一个性价比很高的耳机。其次,我们会送 3 个月的 plus 会员。


那么为什么我们要做耳机呢?主要是从品牌层面考虑的。我们无法直接与主流市场的 ChatGPT、Claude 这些公司在应用层面正面竞争——与他们相比,我们的品牌影响力还相对较弱,毕竟我们是后来进入市场的。


我们第一款耳机设计采用了一个夹子(clip)形式,可以挂在耳朵上而不会掉落,即使在运动中也能佩戴。这是一款偏向生活方式(lifestyle)的产品,而且定价很亲民。它是一个轻松、生活化的产品,这也是我们想要传达的核心理念——一个在国内外都能讲得通的生活方式哲学。


这款耳机是我们整个品牌下的一个生活方式分支,未来可以拓展到各种硬件产品。


🚥 十字路口:


你认为用户最需要什么样的 AI 硬件?


🧑🏻‍💻 Will 瑜宸:


至于下一代耳机或硬件会是什么,这取决于用户的需求以及当前 Agent 能力所需的反馈类型。


比如,如果用户需要图形界面反馈,那么就离不开屏幕——这个屏幕可能在手机上,也可能在耳机充电盒上,这还不确定。但如果用户主要需要文字类型的反馈,那么耳机形式就非常合理,而且必须是耳机的形式。


🚥 十字路口:


Agnes 目前团队规模多大?


🧑🏻‍💻 Will 瑜宸:


我们国内本来有主体,今年 3 月迅速转型,有 20 位全职转为 AI 开发团队。


后面我们几乎是每个月增加 30-40 人的节奏,我们现在团队差不多有 130 人左右,而且准备今年年底扩展到 200 人。


我们在新加坡和美国也会进行一些招聘。所以那种"一个人就能做出非常赚钱的AI应用"的故事只能当作吹牛了。要满足这么多用户的需求和产品体验,你不可能做到。


而且从成本角度看,人力成本和获客成本以及 API 成本相比,几乎可以忽略不计的。人才是 AI 行业中最强大的 Data Fly Wheel(数据飞轮)。


在这个领域,人才绝对是最关键的因素。如果我能招到一个非常厉害的模型训练师或算法优化师,他带来的价值就相当于我完成了一次融资。你可以这么理解,因为他可以在成本上帮我节省一两个百分点,这就相当于我可以省下给他支付年薪的十倍金额。


🚥 十字路口:


「人才是 AI 行业中最强大的 Data FlyWheel(数据飞轮)」这句话怎么理解?


🧑🏻‍💻 Will 瑜宸:


这里有两个数据飞轮。


第一个是产品数据飞轮——用户持续使用你的产品,你积累这些用户数据,然后用它来训练自己的行动模型(action model)以降低成本。


第二个是人才飞轮,正如我刚才提到的,人才会直接影响你的估值,包括投资方对你的看法。如果你能招到十个特别优秀的人才,这基本上就等同于确保了市场对你的投资认可。


🚥 十字路口:


我注意到 Bruce 在 WAIC 的主题分享中,提到了“估值套利”和中美“双轮驱动”的战略。这是否意味着Agnes的战略核心,是利用中国的工程优势服务于估值更高的美国资本市场?


🧑🏻‍💻 Will 瑜宸:


第一性原理是产品好用和用户体验优先,好的产品需要高端的科研人才和工程交付团队,中国人在 AI 领域的人才密度全球领先,全球 AI 领域开源论文和被引用次数最多的来源中,中国人做的成果占据绝对的比例优势。好的产品建立在强大的科研团队成果和工程交付能力之上。


我们团队考虑问题不会从估值套利这个角度思考,回归第一性原理,什么样的人才可以做出最好用户体验的产品是出发点。好的产品会自然被赋予更大的用户群体和更高的估值。


🚥 十字路口:


回到 Agnes 创立的原点,当时创始团队看到了什么独特的、其他人可能没看到的机会或问题,从而决定投身于此?


🧑🏻‍💻 Will 瑜宸:


本身我们核心团队的教育背景、对 AI 的认知水平、包括接受最前沿 AI 理念的渠道,和大部分团队相比都是有优势的,斯坦福、麻省理工、伯克利、新加坡国立大学、南洋理工大学组成的核心团队和过往背景放到硅谷都是可以和 Cognition 团队媲美或更强的。


——我们团队基因很强,在 AI 领域储备深厚。


🚥 十字路口:


那你们当时看到的机会是什么呢?


🧑🏻‍💻 Will 瑜宸:


看到的机会是目前全球 60 亿网民中还是只有很小一部分用户体验到了 AI 的能力,这部分用户中又仅有个位数百分比的用户体验到了"高端功能",AI 的普及和渗透已经看到了巨大的前景,让全球所有用户都能用上好用的人工智能产品是我们的愿景。


目前很多应用产品并不好用,还是存在切换不同工具的割裂场景,不是一个 AI 时代应用该有的带给用户的全新体验,单从提升效率上讲,本身 AI 原生的产品就要解决用户的这个需求,同时协作对于效率提升也是很重要的能力。


🚥 十字路口:


最后一个问题,关于赛道的终局判断:你认为 AI Agent 的未来是由通用 Agent 一统江湖,还是一个百花齐放的垂直生态?最终胜出的公司,需要具备哪些关键特质?


🧑🏻‍💻 Will 瑜宸:


用户的注意力是有限的,长期来看注意力会集中在满足用户需求点的最好的几个应用上,核心还是要打造用户喜欢并长期喜欢使用的产品,垂直应用可能短期吸引到用户的注意力,但很难维持,除非产品能力上有极强的差异化,这里包括了产品底层能力和用户层面的体验优化。


能够胜出的公司一定是在 AI 时代可以引领用户的全新体验并逐步满足用户的真实需求解决用户实际问题的全新物种,Agnes 就是这样一个从零出发的 AI 原生产品思路,希望可以带给全球用户 AI 时代的全新体验。



文章来自于微信公众号 “十字路口Crossing”,作者 “十字路口Crossing”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!