开源项目 8小时前 77 阅读 0 评论

DeepSeek 突然上线并开源V3.1 Base版本!编程能力击败Claude 4!

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

DeepSeek线上版本模型已升级至DeepSeek V3.1,上下文窗口从原有的64k扩展至128k,网页、App、小程序都可体验这一模型。

本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。
综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:

编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。

性能突破:V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。

原生搜索:新增了原生「search token」的支持,这意味着搜索的支持更好。在问答场景,DeepSeek-V3.1与上代模型有了明显区别,其回答内容的信息量进一步增加,提供了更多细节。


架构创新:线上模型去除「R1」标识,分析称DeepSeek未来有望采用「混合架构」。

成本优势:每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。

在MMLU多任务语言理解方面,DeepSeek V3.1毫不逊色于GPT-5。

看到V3.1模型的更新,网友们更期待R2的发布了!

开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

#AI开源项目推荐##github##AI技术##deepseek#

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!