AI热点 7月前 • 95 阅读 • 0 评论

马斯克新模型：9折价格实现Gemini 2.5性能，支持2M上下文

作者头像

量子位

AI技术专栏作家 | 发布了 246 篇文章

时令发自凹非寺
量子位 | 公众号 QbitAI

马斯克xAI又出手了！

这次闪亮登场的是Grok 4 Fast——

不仅实现9折价格追平Gemini 2.5，还支持2M上下文窗口。

除此之外，这个全新的多模态推理模型还可与X实现无缝衔接。

例如，给它输入以下提示词：

帮我找一篇今年的X帖子，其中mkbhd分别拿着书本式折叠手机和翻盖式折叠手机。

Grok 4 Fast不仅详细描述了帖子内容，提供了准确链接，甚至还贴心地附上了相关的YouTube视频网址。

下面具体来看。

以最低的成本实现最高的性能

可以说，Grok 4 Fast这一波在性价比这件事上树立了新标杆。

在推理基准测试中，它不仅全面超越Grok 3 Mini，还大幅降低了Token成本。

与Grok 4相比，Grok 4 Fast在保持与前者性能差不多的同时，平均使用的思考Token数量减少了40%。

根据Artificial Analysis的独立评测验证，在“人工分析智能指数”榜单中，Grok 4 Fast与其它公开可用模型相比，呈现出业界领先的“价格-智能”比。

除此之外，Grok 4 Fast还在LMArena上进行了对战测试。

在搜索竞技场中， grok-4-fast-search以1163分的成绩夺强势登顶，较第二名o3-search领先17分，展现出显著优势。

在文本竞技场中，grok-4-fast-search排名第8 ，性能与grok-4-0709相当，在同体量模型中表现尤为出色，其余所有同类大小的模型排名均在第18位及以下。

如何实现的？

Grok 4 Fast采用端到端的工具使用强化学习（RL）进行训练，尤其擅长判断何时调用工具，例如代码执行或网页浏览。

除此之外，Grok 4 Fast还展现了前沿的智能搜索能力，能够无缝浏览网页和X，通过实时数据增强查询效果。

它可在链接间快速跳转，处理多种媒体内容（包括X上的图像和视频），并以光速整合分析结果。

过去，不同的推理模式需要依赖多个独立模型。

但Grok 4 Fast推出了统一架构，通过系统提示词调控，让同一组模型参数既能处理长链思维推理任务，也能完成快速响应类非推理任务。

这种一体化设计显著降低了端到端延迟与Token成本，使Grok 4 Fast成为实时应用的理想选择。

目前，Grok 4 Fast已面向所有用户开放，Auto模式下的复杂查询将自动调用Grok 4 Fast。

除此之外，Grok 4 Fast还将推出两个新模型：

grok-4-fast-reasoning
grok-4-fast-non-reasoning

现已通过xAI API正式开放使用，具体定价如下：

One More Thing

Grok 4 Fast背后，马斯克还刚刚从谷歌挖来了一位关键人才——

帮谷歌Gemini拿到了IMO、ICPC金牌的Dustin Tran。

他本科毕业于美国加州大学伯克利分校，博士毕业于哥伦比亚大学，曾在OpenAI当过研究实习生，后在2017年加入谷歌。

作为已在谷歌DeepMind工作8年的高级研究科学家，Dustin Tran深度参与了Gemini系列模型的研发工作，还助力实现了谷歌模型在LMSYS排行榜上的首次登顶。

此外，他还是2.5代模型的评估专家，推动相关模型在WebDev Arena和HLE评测中荣获第一。

在学术领域，Dustin Tran的论文主要集中在人工智能、机器学习和深度学习等领域，至今共被引用超过两万次，其中h-index有47，i10-index达60。

参考链接：
[1]https://x.com/xai/status/1969183326389858448
[2]https://x.com/kimmonismus/status/1969333210975756697
[3]https://x.com/elonmusk/status/1969265917289709918
[4]https://x.com/amXFreeze/status/1969389832721056054
[5]https://artificialanalysis.ai/models/grok-4-fast-reasoning/providers

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

5月前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

5月前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

5月前 • AI热点

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

5月前 • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

5月前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

5月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

5月前 • AI热点

热门标签

粤语学习斗鱼 GPT-3 中关村论坛最后100码情话 AI赋能办公 3D生成 PaperBench NLP

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝