AI热点 3小时前 185 阅读 0 评论

Anthropic 性价比最高 AI 模型:Haiku 4.5 登场,1/3 价格实现 Sonnet 4 同级编程能力

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

感谢IT之家网友 软媒用户1392612 的线索投递!

IT之家 10 月 16 日消息,Anthropic 官网今天(10 月 16 日)发布博文,宣布推出小型 AI 模型 Claude Haiku 4.5。官方表示该模型以极低的成本提供了接近前沿模型的强大性能,目标成为实时、低延迟任务(如聊天助手和客户服务)的理想选择。

简单介绍下 Anthropic Claude 系列模型的三种尺寸规模:Haiku(小型)、Sonnet(中型)和 Opus(大型)。较大的模型基于更大的神经网络,通常包含更深层次的上下文知识,但运行速度较慢且成本更高。

而 Haiku 系列模型通常通过“蒸馏”技术,构建出规模较小的 AI 模型,让其在编码等功能性任务中达到大型、老旧模型的性能。

在应用场景方面,Anthropic 表示,Haiku 4.5 能够完美结合高智能与惊人的处理速度,满足用户对即时反馈的需求,专门针对实时聊天助手、在线客户服务代理以及辅助编程工具等需要高响应速度的应用场景设计。

在性能方面,Claude Haiku 4.5 编码性能与 Sonnet 4 基本持平,但在成本上仅为后者的三分之一,处理速度则提升了超过两倍。

IT之家援引博文介绍,在衡量编程能力的权威基准测试 SWE-bench Verified 中,Haiku 4.5 取得了 73.3% 的高分,略微领先于 Sonnet 4 的 72.7%。

根据 Anthropic 提供的内部基准数据,该模型在某些特定任务(如模拟人类使用计算机进行操作)上的表现也已超越 Sonnet 4。

更令人惊讶的是,在部分基准测试中,Haiku 4.5 的表现已十分接近 OpenAI 的 GPT-5 模型,不过官方也提醒,这些自报数据可能经过筛选,应审慎看待。

定价方面,Haiku 4.5 展现出巨大的市场竞争力。对于 Claude 网页端和 App 的订阅用户,该模型已包含在服务内。而对于开发者,其 API 调用价格设定为每百万输入 token 1 美元,每百万输出 token 5 美元。

作为对比,同系列的 Sonnet 4.5 模型定价为 3/15 美元,而更高阶的 Opus 4.1 则高达 15/75 美元,让 Haiku 4.5 成为旧版 Haiku 3.5 和 Sonnet 4 的高性价比直接替代品。

更重要的是,Anthropic 还为 Haiku 4.5 设计了创新的多模型协同工作流。在该模式下,更强大的 Sonnet 4.5 模型负责将一个复杂的总任务分解为多个步骤清晰的子计划,然后调度多个 Haiku 4.5 实例并行执行这些子任务。这种架构类似于一个项目经理带领多个高效的执行者协同工作,能够以更高效率和更低成本解决复杂问题,为 AI 代理式编码等高级应用场景开辟了新的可能性。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!