开源项目 5天前 176 阅读 0 评论

智谱开源GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%

作者头像
量子位

AI技术专栏作家 | 发布了 246 篇文章

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

在对手最擅长的地方打败对手,智谱做到了。

开源模型GLM-4.5在伯克利工具使用榜单上超越Claude Opus 4.1,运行相同任务成本仅为1.4%。

抢在GPT-5之前发布的融合大模型GLM-4.5,以其在前端开发跨文件修改全栈项目构建等场景中的卓越表现受到不少关注。

现在,GLM-4.5的编程能力也已经接近Claude 4。

性能更高、速度更快、价格更低

GLM-4.5采用MoE架构,为评估Agentic Coding能力,团队构建了CC-Bench评测体系。

通过在覆盖六大开发领域、52个实际编程任务中对比GLM-4.5与Claude Sonnet 4、DeepSeek-V3.1、Kimi-K2和 Qwen3-Coder-480B,可以看出GLM-4.5在与顶尖开源模型对比时表现强劲,尤其在任务完成效果和工具调用可靠性方面。

在与Claude Sonnet 4的直接竞争中可以发现,GLM-4.5在编码性能方面接近行业标杆Claude Sonnet 4。

并且,艾伦人工智能研究所研究科学家Tim Dettmers体验后表示:开源的GLM-4.5在推理速度上和闭源模型一样好,甚至比Opus 4.1快3倍、比GPT-5快5倍。

甚至有反馈称,在涵盖多语言、多种函数调用测试的大模型能力权威榜单伯克利工具调用排行榜中,GLM-4.5已经超越Claude 4、Grok-4等。

再细看榜单还可以发现,GLM-4.5花费的成本还是最低的。

说到花费,值得提一嘴的是,智谱还推出了高性价比的Claude Code套餐,价格仅为Claude的1/7,适用于GLM-4.5以及GLM-4.5-Air。

Claude Code是Anthropic推出的开源工具,简单来说就是Claude Code CLI与各类AI模型供应商之间的智能中介,将不同模型接入Claude Code后,就可以根据任务需求选用不同成本的模型。

不止Claude Code,团队称未来还将拓展到更多Coding工具。

目前,GLM-4.5已接入包括Claude Code、Cline、Gemini CLI、Grok CLI、CodeGeeX、Kilo Code、Roo Code、Trae在内的多款主流编程工具,全面支持日常开发流程。

所以,被Claude价格门槛劝退的你,会不会尝试一下GLM-4.5呢?

参考链接:
[1]https://x.com/alxfazio/status/1962399641376354724
[2]https://x.com/Zai_org/status/1962522757536887205
[3]https://x.com/KhaledAlwaleed/status/1962545997373919740

— 完 —

量子位 QbitAI

关注我们,第一时间获知前沿科技动态

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!