AI热点 1周前 • 94 阅读 • 0 评论

探索 AI 写代码极致：Claude Opus 4.1 模型登场，软件工程能力再攀新高峰

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

感谢IT之家网友 Nuc_F、Stephen_233 的线索投递！

IT之家 8 月 6 日消息，Anthropic 公司今天（8 月 6 日）发布公告，宣布推出 Claude Opus 4.1 模型，相比较今年 5 月推出的 Claude 4 系列模型，主要改进了编码、推理和执行指令的能力。

Anthropic 表示，Claude Opus 4.1 在 SWE-bench Verified 上（用于评估软件工程准确性）提升到了 74.5%，作为对比，Claude Sonnet 3.7 的准确率为 62.3%，而 Claude Opus 4 的准确率为 72.5%。具体来说，更新后的模型在“深度研究和数据分析技能，尤其是在细节追踪和代理搜索方面”表现得更加出色。

与 Opus 4 相比，Opus 4.1 在大多数功能上都有所提升，特别是在多文件代码重构方面表现尤为突出。IT之家附上相关数据如下：

Rakuten Group 发现，Opus 4.1 不做不必要的调整或引入新的错误，能够精确地在大型代码库中定位并修正错误。

Windsurf 报告称，Opus 4.1 在其初级开发者基准测试中，比 Opus 4 表现提高了标准差的一个单位，这一性能飞跃与从 Sonnet 3.7 到 Sonnet 4 的跳跃相当。

最新的模型今日起面向 Claude 客户开放，可以通过 Claude Code、Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。

同时，Anthropic 在社交媒体上表示，计划在未来几周内发布“对我们模型的重大改进”，因此可以期待 Claude 系列模型的更多升级。OpenAI 也预计将在本周发布新消息。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

Figma 如何使用 AI 来支持而不是取代设计师

Figma 如何使用 AI 来支持而不是取代设计师

23分钟前 • AI热点

新版微信输入法体验：张小龙站台的产品，承载着微信AI的野心？

新版微信输入法体验：张小龙站台的产品，承载着微信AI的野心？

2小时前 • AI热点

CPU飙升、电量狂掉！Firefox新AI功能上线即「翻车」，遭老用户怒喷：“跟风加AI简直丢脸”

CPU飙升、电量狂掉！Firefox新AI功能上线即「翻车」，遭老用户怒喷：“跟风加AI简直丢脸”

2小时前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

GPT-5 在数学竞赛中得了 100 分，但 OpenAI 的图表有待改进

GPT-5 在数学竞赛中得了 100 分，但 OpenAI 的图表有待改进

2小时前 • AI热点

亚马逊和谷歌的决裂，是AI震动广告业的开始

亚马逊和谷歌的决裂，是AI震动广告业的开始

5小时前 • AI热点

AI 智能硬件产品经理核心知识体系

AI 智能硬件产品经理核心知识体系

5小时前 • AI热点

Grok的“免费午餐”：一次教科书式的AI破局阳谋

Grok的“免费午餐”：一次教科书式的AI破局阳谋

5小时前 • AI热点

热门标签

火山方舟 ChatGPTPlus 版权争议沙雕日常切水果蛋仔奇思妙想计划 AMD锐龙平替工具 X filmora

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝