AI热点 3小时前 189 阅读 0 评论

资本押注AI“完整产业链”,浙新四维获种子轮融资

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

近日,深圳十方融海科技有限公司完成对浙新四维智能科技(杭州)有限公司的战略投资,投后后者估值约2亿元人民币,双方正式达成深度战略合作。

浙新四维总经理谭雪指出,十方融海与浙新四维的合作,构成了一条从系统层到硬件端的完整产业链路,存在极大的发展空间,这比投资单一技术或产品型公司可能更具价值。十方融海小智AI市场总监杜君也表示,双方的合作并非基于单点能力,而是多年行业积淀所形成的综合实力互补。

本轮融资吸引了多家曾布局算力、大模型、机器人等前沿领域的投资机构关注,反映出资本对语音交互方向的看好。同时,这一投资事件也映射出AI领域的新趋势:资本愈发青睐能与自身业务形成强协同的“场景化”企业。

如何做出“杀手级”AI硬件产品

十方融海成立于2016 年初,公司历经了三次战略升级,从一家从知识分享平台逐步演进为以AI为核心的科技企业,聚焦在AI落地。

在杜君看来,无论是AI硬件还是AI应用,要成为“杀手级”产品需满足三个特征:

  • 结合应用场景能解决用户真实需求,无论是实际问题还是情感需求都具备极强的场景化属性;
  • 体验无感知,做大量优化的本质是降低用户交互难度,比如从传统物理按键交互转向语音交互,就是为了让用户更无感知,未来加入多模态后,AI甚至能通过用户的一个眼神、一个动作理解需求,极致的体验恰恰是“无感”的;
  • 具备人文关怀,其核心是情感智能。人们对内心需求的关注度越来越高,未来产品未必都要功能强大,但优秀产品一定拥有人文关怀能力,这将成为产品基本属性,让用户有更舒适体验。

杜君认为,并非所有设备都要高度拟人化,但所有设备在特定环节都需具备较强的人文关怀与情绪关怀能力。此时,用户对产品的付费意愿会更高,但并非单纯为情绪价值买单。

初探:硬件原生的交互系统

大模型的软件侧应用被更广泛关注,十方融海则更看好 AI 接入终端后对硬件进化的巨大提升。实践中,十方融海发挥自己的软件优势,基于过去教育业务中沉淀的大量实时语音交互、情绪感知以及大模型相关技术经验,在去年8月份启动了小智AI项目。

小智AI与市面上GPT系列、Qwen系列等主流大模型相比,有着本质的区别。

首先,小智AI是硬件原生的交互系统,更关注硬件终端的智能化,从底层架构到功能开发等都是围绕大模型在硬件场景下效果如何更好、与产品的融合性更强等展开。如今,小智AI实现了平均500毫秒的快速响应、基于情绪识别的拟人化交互,并以MCP协议支持功能拓展。整套系统采用云端部署,有效降低了对端侧的配置要求。

其次,小智AI更注重应用性和大模型在人机交互中的效果。小智AI在语音交互过程中采用了三段式架构:ASR(语音转文字)、LLM(大语言模型)、TTS(文字转语音输出)。值得一提的是,小智AI也支持通义、DeepSeek等第三方模型。

团队围绕C端用户的交互体验做了大量优化,尤其在情感与情绪识别方面,该团队对整个链路进行了系统性优化,来提升人机交互的真实感与亲和力:

  • 模型侧,从用户全量对话语料中提取出1024维人格数字特征,通过聚类与归纳压缩为 26维关键特征,并嵌入对话训练集,交互时即可识别用户性格特点。
  • ASR环节,自主部署了优化模型,除了语音识别,还能捕捉语气、语调等情绪信号。系统会识别关键词推测潜在情绪,并将这些信息传递给大模型,使生成的内容兼顾客观语义与主观情感。
  • TTS环节,将传统的“拟声”升级为“拟人”。AI在语音播报时融入情绪语调,让表达更自然、更具温度。

对于提供情绪价值重要的上下文能力,小智 AI 目前支持短期记忆,长期记忆功能在内测中,预计近期上线。杜君表示,很多时候“记忆”这件事情会变得类似哲学问题,越想越深,反而变得很主观或很抽象,其中的难点在于要不断地重新理解什么是记忆、什么时候该调取记忆以及记忆以什么样的形式存在。因此,长期记忆功能会持续迭代。

不过,杜君坦诚,目前行业仍处于早期阶段,十方融海作为在国内较早将情感大模型能力融入终端设备,至今也仅推进了一年。尽管如此,各行业已涌现出不错的应用,只是要实现市场化、商业化还需时间,仍有较大探索空间。

“灵魂大脑”找到了“身体”

对于十方融海来说,小智AI的核心定位是硬件端的整套交互系统,它的价值发挥需要依托硬件产品,即小智AI这个“灵魂大脑”,一定需要硬件这个“身体”。因此,软硬件结合是十方融海接下来做好系统优化、将产品推向消费市场的关键。

与浙新四维的合作核心正在于此,双方发挥各自优势:小智AI负责打磨并做好系统层面的工作,浙新四维则发挥多年沉淀的硬件与产品研发优势及经验;双方共同探索打造当代AI产品。

“我们非常高兴能与浙新四维这样一支兼具技术远见与实干精神的团队携手。他们对多模态情感语音大模型在端侧应用的深耕,与我们对AI技术未来发展趋势的判断高度契合。我们相信,此次战略投资将有力加速‘小智AI’技术的迭代与场景拓展,共同开启智能交互的新篇章。”十方融海董事长、小智AI创始人黄冠表示。

实际上,初版完成后,小智AI 内测中在交互体验、拟人性和响应速度上都取得了理想效果,但当时团队并未确定它的具体应用方向,而是决定先以开源的方式建立社区生态,希望与社区一起探索。

目前,社区已有6万多名开发者。期间,众多开发者在社区进行二次开发或产品创新,大家碰撞出了不少好想法。十方融海与浙新四维的合作探索也是在当时开始的。

浙新四维是由浙江大学和新加坡管理大学联合培养的博士团队创立的AI创新企业,专注于多模态情感大模型的软硬件应用。智能家居是浙新四维的核心优势场景,创始人秦兵拥有20多年的智能家居产业经验,其还在浙江、四川各有一家智能制造工厂,许多智能家居头部企业都是其客户。因此,浙新四维能快速结合头部客户的新需求、新场景,将小智AI更好应用到硬件产品中。

小智AI的发展速度、效率及效果表现,已是浙新四维的核心能力之一。浙新四维的判断是,下一代智能家居产品必然会与AI深度融合,采用语音交互这一基础设施。值得注意的是,过去半年,双方已经打通了部分头部家居品牌的不同设备。

“具身领域代表着未来”,这也是浙新四维重点关注的方向。目前具身领域多聚焦在机器人本体及智脑开发上,浙新四维认为,下一个方向是“智脑+语音交互”的结合,以此服务人形机器人本体,甚至与具身机器人的“小脑”协同。用户不会只满足于产品的工具属性,当下正是布局的好时机。

另外一个重要场景是体育,这其实有一定的情怀色彩。创始团队很多成员是多年的马拉松爱好者,已跑完全球近100场马拉松,体育已融入了日常生活。凭借对体育行业的深刻理解,浙新四维团队快速切入体育赛道,首创了AI解说智能体。

浙新四维的产业布局目前聚焦在这三个场景,但未来不会局限于此。

据了解,浙新四维当下的战略选择是面向B端,目的是借此打造语音交互的基础设施。谭雪表示,语言交互持续蓬勃发展的关键在于:语言使用的密度和语言知识的质量。浙新四维第一步先拉通语言使用的密度——通过大量智能家居设备,提升用户使用数量、交互人数以及交互设备数量,而相关数据和反馈也会反哺“小智AI”迭代。

但浙新四维未来会同时覆盖B端与C端,只是目前还没到大模型直接面向C端并实现快速爆发的时机。浙新四维也有相关人才储备,像谭雪在To C领域深耕了近20年,涉及情绪价值、情感价值相关业务。她透露,养老陪伴可能是其未来探索的方向之一。

一次产业链的集体升级

“是市场发展的选择与契机让我们一步步明确了硬件的发展方向。”杜君表示。

实际上,早在去年8月小智AI刚推出时,双方就已展开深入交流,做出了不少落地产品。比如,不到半年的时间里,浙新四维在体育行业基于小智AI进行了深度二次开发,成功打造出国内首创AI解说智能体,并应用于浙BA赛事解说,获得全网广泛关注。其次,凭借团队在智能家居领域多年的开发与制造经验,浙新四维也将经过二次开发训练的小智AI应用于该领域,并已与若干头部家电厂商达成合作并获得订单。此外,浙新四维还基于小智AI,实现与多款具身机器人的肢体控制及语言交互。此外,双方还在研发其他产品,未来将逐步上线。

协作期间,两方团队配合紧密、节奏高效,沟通几乎无障碍。浙新四维在客户提出需求或出现硬件问题后会第一时间响应,迅速定位原因,并针对大模型能力提出创新性改进思路。同时,小智AI团队也会给硬件性能优化提出具体建议。

除研发环节外,双方还在战略层面保持高频沟通,确保方向一致。双方已建立完善的沟通机制,能够迅速响应临时项目需求。此外,双方合作范围也从技术拓展至市场与品牌层面,形成从技术到市场的全链路合作。

之前专注软件的十方融海逐渐意识到,硬件行业的产业链条非常长,涵盖了上游的云厂商、芯片平台,到硬件开发商、产品需求方,再到渠道方、品牌方等多个角色。在杜君看来,AI硬件并非单纯把AI加入硬件,而是整个产业链条的一次整体升级与进化。

芯片层面,端云协同会成为重要发展方向。端侧芯片负责本地响应与隐私保护,云端则承担复杂计算与推理任务,二者结合已成为明确趋势。然而,由于端侧芯片成本仍偏高,其在消费级市场的大规模普及尚需时间。

系统层面,以小智AI为代表的终端AIOS系统,构建了从语音交互到任务执行的完整闭环,为用户带来流畅自然的体验。这类系统不仅提供AI算力接口,也在逐步重构智能设备的系统架构。

相比之下,应用开发者生态的转型尤为关键。AI应用的交互逻辑已明显区别于传统APP。开发者需重新设计应用架构、交付方式与用户体验,以适配自然语言或语音驱动的操作模式。未来,无论是导航、外卖、提醒工具还是工作流类应用,都将迎来基于Agent逻辑的重构。

“链条中,每个环节的角色需各司其职,不可能凭一己之力包揽所有事,合作必然是实现共赢的最佳方式。”杜君表示,这不是对原有体系的“重塑”,而是一次基于交互逻辑的再演化,整个产业在积极适应这种变化。

“不必等待,尽快行动”

尽管前景广阔,但多模态情感大模型落地仍具挑战。

谭雪指出,问题主要集中在技术路径与硬件适配上。一方面,传统“先研发后推广”路径或不适用,浙新四维选择以用户需求和实际场景为出发点,反向推动技术迭代。这种“场景倒推”模式不仅提升了产品的市场接受度,也增强了对不确定性的应对能力。硬件适配方面,调优虽不构成根本障碍,却直接影响用户体验的顺滑度。为此,系统必须在软硬件协同上达到高度一致,这对整体架构提出了更高要求。

杜君从用户视角补充道,AI硬件市场正处在认知转变期,用户需要一定时间去理解与接受新体验和新交互方式,这是产品优化和技术突破的必经过程。

“产业发展或将不再完全由模型研发主导,而是更多由实际需求、场景与市场力量驱动。”杜君说道,多模态与情感模型被视为未来的重要趋势,其能力将逐步成为智能手表、闹钟等终端设备的“标配”,其广泛渗透将模糊行业边界,催生新的生态体系。这意味着巨大的机遇,企业应结合自身行业、产品与技术积累,积极探索将AI转化为业务的第二增长引擎。

谭雪也预测,多模态情感大模型将在未来三年迎来爆发,并涌现具备全球影响力的头部品牌。这类模型有望成为“全球化的基础交互设施”,不仅在推动AI在中国的落地,也将在全球范围内催生新的应用范式,尤其在智能终端结合、二次开发与垂类模型训练方面潜力显著。

因此,她呼吁从业者不必等待,而应尽快行动:打磨团队、明确场景、加速落地、抢占先机。只有在早期阶段建立优势,才能在未来的行业爆发中掌握主动权。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!