AI热点 3月前 180 阅读 0 评论

讯飞星火 X1 全新升级,整体效果对标 OpenAI o1 和 DeepSeek R1

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 4 月 21 日消息,科大讯飞今日官宣,讯飞星火 X1 全新升级,是“当前业界唯一的基于全国产算力训练的深度推理大模型”。

本次升级有这些关键信息:

  • 实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标 OpenAI o1 和 DeepSeek R1

  • 融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。

  • 首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,私有化部署简便;全新升级模型定制优化工具链,支持 SFT、强化学习两种模型定制优化方案,定制门槛低

  • 三大核心技术创新 —— 大规模多阶段强化学习训练方法、基于快慢思考的统一训练方法、工程技术系统创新保障基于国产算力的长稳训练,助力星火 X1 全面升级。

此次星火 X1 升级,在多个任务上效果突破。根据最新测试集评测结果,星火 X1 在通用任务效果评测中全面对标 OpenAI o1 和 DeepSeek R1,在数学、知识问答等方面表现突出。IT之家附对比成绩如下:

星火 X1 除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势

为了让更多企业能够便捷用上 AI,本次升级的星火 X1 为企业 AI 落地提供了双重支持:

  • 首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,4 张卡(华为 910B)即可部署满血版星火 X1,私有化部署简便。

  • 全新升级模型定制优化工具链,支持 SFT、强化学习两种模型定制优化方案,16 张卡(华为 910B)即可完成行业定制优化,定制门槛低。

讯飞星火网页端或讯飞星火 App 已上线全新升级的讯飞星火 X1,用户可体验在通用任务上深度推理和联网搜索的全新效果。

同时,星火 X1 API 也已同步上线讯飞开放平台,面向开发者和企业开放服务。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!