AI热点 4小时前 74 阅读 0 评论

比Qwen3-Max更Max?夸克抢先用上最新闭源模型

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

Qwen 最新闭源模型,让夸克先用上了。


10 月 23 日,一向不爱出风头的夸克上线了对话助手,可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理,实现了 AI 搜索与对话的深度融合。



其中一大亮点就是,该对话助手采用了 Qwen 最新闭源模型。至于是哪个型号、性能有多强,夸克卖了个关子,只透露比 Qwen3-Max 更进一步,在业界有绝对领先性。


要知道,此前在云栖大会上惊艳亮相的 Qwen3-Max,一经发布就凭借超越 GPT-5 和 Claude Opus 4 的优异表现,跻身全球大模型前三甲。因此,我们有理由相信,夸克对话助手所采用的这款 Qwen 闭源模型,其性能将达到一个全新的高度。



得益于 Qwen 最新闭源模型的强推理、长文本理解能力,夸克对话助手能够快速、精准回答用户的提问,在处理复杂问题和多轮对话时表现更出色。


再加上夸克在搜索和工具领域的多年积累,以及自建的专业知识库,让该助手能够通过多链路实时检索,提供高质量、可溯源的信息,显著提高了回答的准确性和可信度,真正做到了「既聪明又可靠」。


目前,夸克对话助手已经全面上线,所有人只需下载最新夸克 APP 即可免费体验。


接下来,我们就来个深度评测,看看它在实际场景中的表现如何。


一手体验


先来看看它的王牌功能「AI 搜索」


平时我「召唤」夸克最多的场景就是找网盘资源,现在有了夸克对话助手,找资源更是省时省力。比如我们让它找英语专八真题的夸克网盘资源,它立马就贴出资源合集链接,点一下即可保存至夸克网盘。



这两天 AI 圈闹得最沸沸扬扬的大事,非 Meta AI 裁员莫属,汪滔大手一挥干掉了 600 个岗位,其中 FAIR、AI 产品以及基础设施团队成了妥妥的裁员重灾区。


我们索性就让夸克对话助手扒下这事的来龙去脉。输入提示词,点开「深度搜索」,夸克对话助手搜索了 197 篇资料,并从中筛选出符合要求的 38 个参考信源,包括网易、搜狐、新浪新闻等,机器之心也赫然在列。



它的回答虽然言简意赅,但基本涵盖了关键的新闻事实,且条分缕析逻辑清楚,从裁员范围、原因、补偿到同期重大动作,再到行业影响,它给扒了个底朝天。


再来测测它的理解能力


今年 6 月,莫言在广东惠州面对百年客家围屋碧滟楼有感而发,写下「从南阳到南洋根深叶茂」十字上联,并发出「向天下文友敬求下联」之邀。最近,该征集活动获奖名单揭晓,一 00 后女生凭「自井壁及井毕角亢星张」下联夺得一等奖。有网友称:没点传统文化知识还理解不了这个下联。


我们让夸克对话助手来解读下这副对联妙在哪。它抽丝剥茧分析得头头是道,不仅能理解上联中地理与历史的双线叙事,还能识别出下联中涉及的天文知识及典故,并由此延伸出这副对联所蕴含的天人合一的宇宙观。




至于写作能力,我们直接上传了一张图片,让它拿出所有本事,为此景写一首古诗。在这个过程中,夸克对话助手不仅要识别图像内容,还要从视觉信息中提炼出与之匹配的情感和意象,通过古诗的形式进行表达,而古诗又对文化和语言知识有着极高的要求,比如音韵和谐、对仗工整等。



我们还让它模仿「Sir 电影」公众号风格,为英剧《流人》第一季写一篇剧评。


夸克写的这篇剧评还是蛮符合「Sir 电影」的一贯风格,使用幽默解构与结构化叙事介绍了《流人》第一季故事情节,对于人物性格的捕捉和场景的描述尤为细致生动。可以这么说,再稍微润色下,加上几张剧照或者动图完全可以进行发布。



逻辑推理能力也是测评必不可少的。我们采用拍照搜题的形式,上传了一道图像推理题,夸克先是观察图形规律,继而进行分析、推理,最终选出了正确答案,整个过程既快又准。



此外,夸克还自建了医疗、教育、法律、财经等多个垂直知识库,通过结构化、标准化的专业数据训练,大幅增强了模型在专业领域的推理与专业理解能力。


比如我们拍一张老师作业批改记录的表格,输入提示词:提取一下表格。不到 10 秒,夸克对话助手就完成扫描、生成表格等一系列操作,即使是手写字体,它也能准确无误地识别,极大地提高了办公效率。



或者使用「打电话」功能,咨询一些医疗知识,比如腰疼怎么办?它能提供比较专业的回答并给出靠谱的解决方案。



总体来说,夸克这次算是最强模型和最强搜索的「双剑合璧」,与其他对话助手相比,夸克的回答更加严谨、有逻辑,内容风格也更接近于 ChatGPT。


技术解读


如今,市面上 AI 助手类产品层出不穷,虽然都宣称拥有智能对话、信息搜索等功能,但从本质上来说,AI 助手的核心竞争力仍然取决于其背后所依托的模型技术。不同的模型驱动了这些产品的智能化水平,而模型的先进性则直接决定了 AI 助手的实用性和用户体验。


作为新一代 AI 助手的代表,夸克对话助手背后的 Qwen 最新闭源模型无疑让它在众多竞争者中脱颖而出。尽管该款闭源模型仍保持神秘,但可以肯定的是,这款模型在多个维度上都展现出惊人的能力,并在全球都有绝对的领先性


因为还没有这款最新闭源模型的更多信息,我们就以 Qwen3-Max 为例做参考。Qwen3-Max 模型预训练数据量达 36T tokens,总参数超过万亿,不仅在数学推理、复杂指令理解、长文本处理和多语言能力方面表现优异,还在编程和 Agent 工具调用等领域有着卓越的表现。


具体来说,在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中,Qwen3-Max-Instruct 版本斩获 69.6 分,位列全球第一梯队;在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Instruct 版本更是实现了突破性表现,以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。不仅如此,Qwen3-Max-Thinking-Heavy 曾在 AIME25 和 HMMT 这两个数学评测榜单中拿下双满分,这可是国产大模型首次,直接证明了夸克 AI 助手领先的逻辑推理能力,让夸克能够在信息检索和任务处理过程中,快速且精准地理解用户意图,提供高质量的解答。



夸克对话助手的另一大优势则在于其技术架构上的创新。


众所周知,大模型有个最大的毛病,就是喜欢一本正经地胡说八道。为了提升答案的准确性和可信度,夸克采用了「模型 + 系统」的双轮驱动策略。基于阿里 Qwen 最新闭源模型,夸克自研了由实时信息检索、信源追溯和交叉验证组成的可信系统,以确保生成内容的来源可追溯、信息可验证,且支持用户进一步追问。


夸克算法团队与通义实验室还成立了专项联合研发小组,聚焦于「搜索推理」和「可信生成」两大核心领域,深度定制了一款更擅长搜索与信息甄别的专属模型,从根本上提升了生成内容的专业性与可靠性。


此外,夸克还自建了包括医疗、教育、法律、财经等在内的多个垂直领域的专业知识库,以此提升在特定领域的应用表现。这些知识库经过结构化、标准化处理,为夸克提供了丰富的行业知识,让它能够在健康咨询、学习辅导、法律解读、财经分析等核心场景中,能够提供更精准、更专业的解答。


结语


一直以来,阿里都秉持着「模型即应用」的战略。这个战略的核心,就是让 AI 从藏在幕后的技术工具,真正走到台前,成为用户可以直接感知、随时交互的应用本身。


夸克对话助手,正是这一战略的最佳注脚。它不是单纯在搜索引擎里加个对话框,而是用大模型重新定义了信息获取的方式,让搜索、问答、任务处理在同一个对话界面里无缝流转。用户不必在多个 App 之间反复切换,也无需纠结「这个问题该搜索还是该问 AI」,所有需求都在一次次对话中解决。


而这才是 AI 应用该有的样子。


文章来自于微信公众号 “机器之心”,作者 “机器之心”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!