开源项目 3月前 • 97 阅读 • 0 评论

字节跳动开源Seed-OSS模型，512K上下文刷新开源纪录！

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

HuggingFace

HuggingFace

0秒前

字节跳动Seed团队今日宣布开源Seed-OSS系列大语言模型，该系列专为长上下文处理、复杂推理、Agent开发及通用场景设计；

最大亮点是将上下文窗口扩展至512K，相当于一次性处理1600页文本，达到业界常见128K上下文的4倍，更是GPT-5上下文窗口（256K）的2倍。

三大模型版本开源，7项性能SOTA

本次开源包含三个版本：

Seed-OSS-36B-Base：基础模型

Seed-OSS-36B-Base-woSyn：无合成数据基础版（专为研究社区设计）

Seed-OSS-36B-Instruct：指令微调模型

经基准测试验证，Seed-OSS-36B-Instruct在通用知识、Agent任务、编程和长上下文领域斩获7项开源SOTA，整体性能超越Qwen3-32B、Gemma3-27B、gpt-oss-20B等模型，与
Qwen3-30B-A3B-Thinking-2507在多数场景持平。

技术突破

原生512K长上下文：通过预训练阶段原生支持（非后期扩展），结合RoPE旋转位置编码+GQA分组查询注意力技术，实现超长文本的高效处理。

Seed-OSS采用了成熟稳定的设计：360亿参数的稠密模型（不是MoE），使用了RoPE位置编码、GQA注意力机制、RMSNorm归一化和SwiGLU激活函数。整个模型有64层，隐藏层维度5120，词汇表大小155K。

字节Seed团队提供了两个版本的基座模型，一个包含合成指令数据（性能更强），一个不包含（更纯净），为研究社区提供更多选择。

多项基准测试开源SOTA

在知识理解方面，Seed-OSS-36B-Base在MMLU-Pro上达到了65.1分，超过了同等规模的Qwen2.5-32B-Base的58.5分。在TriviaQA上更是拿下了82.1的高分。

推理能力的BBH基准测试得分87.7，直接刷新了开源模型的记录。在数学能力上，GSM8K达到90.8分，MATH的81.7分。

Seed-OSS代码能力同样不俗，HumanEval得分76.8，MBPP达到80.6。

指令微调版本Seed-OSS-36B-Instruct在AIME24数学竞赛题上达到了91.7分的成绩，仅次于OpenAI的OSS-20B。

并且这些成绩是用仅12T token训练出来的，相比之下，很多同规模模型的训练数据量都在15T以上。

社区反响

Hugging Face工程师Tiezhen Wang评价：“极适合做消融研究”

开发者指出：“36B级基础模型开源稀缺”（对比Qwen3未开源14B以上基础模型）

用户强调：“512K上下文对实际应用价值显著”

随着开源大模型竞争的加剧，字节跳动此次发布展示了中国企业在AI开源领域的强大实力！

开源地址：

https://github.com/ByteDance-Seed/seed-oss

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct

#AI开源项目推荐##github##AI技术##字节开源#AI推理模型#

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

1周前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

1周前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

1周前 • 开源项目

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

3周前 • 开源项目

AI的开源战略

AI的开源战略

2周前 • 开源项目

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

2周前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

3周前 • 开源项目

热门标签

苹果WWDC大会 DeepSeekV3.1 云业务增长智能客服 AI 图片到3D转换发现《Jumaira Drive》传媒变革在线协作工具乌兹职场干货

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝