开源项目 9月前 • 228 阅读 • 0 评论

智谱开源GLM-4.5工具调用超越Claude Opus 4.1，成本仅1.4%

作者头像

量子位

AI技术专栏作家 | 发布了 246 篇文章

闻乐发自凹非寺
量子位 | 公众号 QbitAI

在对手最擅长的地方打败对手，智谱做到了。

开源模型GLM-4.5在伯克利工具使用榜单上超越Claude Opus 4.1，运行相同任务成本仅为1.4%。

抢在GPT-5之前发布的融合大模型GLM-4.5，以其在前端开发、跨文件修改、全栈项目构建等场景中的卓越表现受到不少关注。

现在，GLM-4.5的编程能力也已经接近Claude 4。

性能更高、速度更快、价格更低

GLM-4.5采用MoE架构，为评估Agentic Coding能力，团队构建了CC-Bench评测体系。

通过在覆盖六大开发领域、52个实际编程任务中对比GLM-4.5与Claude Sonnet 4、DeepSeek-V3.1、Kimi-K2和 Qwen3-Coder-480B，可以看出GLM-4.5在与顶尖开源模型对比时表现强劲，尤其在任务完成效果和工具调用可靠性方面。

在与Claude Sonnet 4的直接竞争中可以发现，GLM-4.5在编码性能方面接近行业标杆Claude Sonnet 4。

并且，艾伦人工智能研究所研究科学家Tim Dettmers体验后表示：开源的GLM-4.5在推理速度上和闭源模型一样好，甚至比Opus 4.1快3倍、比GPT-5快5倍。

甚至有反馈称，在涵盖多语言、多种函数调用测试的大模型能力权威榜单伯克利工具调用排行榜中，GLM-4.5已经超越Claude 4、Grok-4等。

再细看榜单还可以发现，GLM-4.5花费的成本还是最低的。

说到花费，值得提一嘴的是，智谱还推出了高性价比的Claude Code套餐，价格仅为Claude的1/7，适用于GLM-4.5以及GLM-4.5-Air。

Claude Code是Anthropic推出的开源工具，简单来说就是Claude Code CLI与各类AI模型供应商之间的智能中介，将不同模型接入Claude Code后，就可以根据任务需求选用不同成本的模型。

不止Claude Code，团队称未来还将拓展到更多Coding工具。

目前，GLM-4.5已接入包括Claude Code、Cline、Gemini CLI、Grok CLI、CodeGeeX、Kilo Code、Roo Code、Trae在内的多款主流编程工具，全面支持日常开发流程。

所以，被Claude价格门槛劝退的你，会不会尝试一下GLM-4.5呢？

参考链接：
[1]https://x.com/alxfazio/status/1962399641376354724
[2]https://x.com/Zai_org/status/1962522757536887205
[3]https://x.com/KhaledAlwaleed/status/1962545997373919740

— 完 —

量子位 QbitAI

关注我们，第一时间获知前沿科技动态

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

6月前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

6月前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

6月前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

6月前 • 开源项目

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

7月前 • 开源项目

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

7月前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

7月前 • 开源项目

热门标签

中国电子技术标准化研究院科技写作 AI技术开发云端开发欧洲科技初创公司 SecOps声音报告零基础写小说 VI视频公有云大模型 AI市场调研

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝