
Seed-OSS是什么?
Seed-OSS 是字节跳动开源的 360 亿参数大语言模型系列,采用 Apache-2.0 许可证,支持自由研究与商用。其最大亮点是原生支持 512K tokens 超长上下文,可处理整本书、法律合同等长文档;同时具备“思维预算”机制,允许开发者控制推理长度,提升效率。在推理、代码生成与 Agent 任务中表现优异,多项基准测试达到开源 SOTA 水平。Seed-OSS 提供基础版、指令调优版以及不含合成指令数据的研究版,满足企业应用与学术研究的不同需求,适用于长文档分析、复杂推理、编程辅助及多语言场景。
该系列包括三个版本:
- Seed-OSS-36B-Base:基础模型,使用 synthetic instruction 数据预训练;
- Seed-OSS-36B-Base-woSyn:不带 synthetic instruction 的基础版本,用于研究中立基线;
- Seed-OSS-36B-Instruct:经过指令调优,适合下游任务执行。
每个模型参数约 36B(即 360 亿),具有以下技术亮点:
- 原生支持超长上下文,最大可达 512K tokens,在处理长文档、长逻辑推理链时表现卓越;
- 思维预算(thinking budget)可控,开发者可灵活控制模型推理长度,以提高推理效率;推荐以 512 的倍数设置(如 512、1024、2048 等),0 表示直接生成;
- 架构采用 causal LM + RoPE + GQA attention + RMSNorm + SwiGLU,层数 64,词汇量约 155K;
- 优化了推理能力和 agent 性能,在 reasoning、coding、agent 任务中表现优异;
- 提供带和不带 synthetic instruction 数据的版本,以满足研究者对训练数据影响的不同需求;
- 面向国际化(i18n)优化,具备良好的多语言支持。
Seed-OSS的主要功能
- 超长上下文处理能力:512K token 上下文支持,让模型处理超长文本(如书籍、法律文档、长推理链等)更流畅,减少截断问题。
- 思维预算可控机制:你可以通过设定推理预算,在推理过程中跟踪 token 使用,直到预算耗尽后生成答案。这种动态控制机制能提升效率并更好限制模型工作量。
- 优秀的推理与 agent 表现:在多项公开基准中,如数学、推理、问答、代码生成、agent 任务,Seed-OSS-36B-Instruct 达到或超过开源 SOTA 表现。例如 AIME24(91.7)、LiveCodeBench v6(67.4)、RULER (128K)(94.6)等。
- 研究友好:提供带/不带 synthetic instruction 版本,研究者可控制训练数据影响,更加透明与可控。
- 开放许可证:Apache-2.0 许可证支持商业使用,不限制使用范围,适合企业集成和产品落地。
Seed-OSS的使用场景
- 长文档处理与分析:如法律合同、学术论文、电子书、技术文档等,利用 512K 长上下文处理全篇内容。
- 复杂多步推理任务:如数学题、逻辑推理、案例分析或 chain-of-thought 解答,通过思维预算机制控制模型推理步骤。
- Agent 系统与工具调用场景:比如构建知识问答机器人、自动工具调用、多任务协同机器人等,Seed-OSS 在 agent 任务中已展现强劲能力。
- 代码生成与编程辅助:在 LiveCodeBench v6 等 benchmark 表现优异,适合用于 IDE 智能补全、代码生成、bug 修复等场景。
- 语言学习与翻译任务:依托国际化优化,适合多语言支持下的 NLU、翻译、跨语言应用等。
如何使用Seed-OSS?
-
模型选择
-
若主要关注性能:选
Seed-OSS-36B-Base(带 synthetic data)或Instruct(指令调优后); -
若关注研究基础模型:选
Base-woSyn。
-
-
获取模型
-
模型已经在 Hugging Face 等平台开源发布(如 Seed-OSS-36B);
-
下载或通过现有 LLM 推理框架加载。
-
-
推理与思维预算控制
使用<seed:think>标签以及<seed:cot_budget_reflect>来指定和监控推理 budget,例如:推荐选择 512 的倍数。
-
配置资源要求
-
FP16 推理需 ~72GB VRAM,INT8 需 ~36GB,INT4 则约 18–20GB;
-
可使用支持 partial offloading 的推理框架(如 vLLM 或 llama.cpp)以降低显存压力。
-
-
采样设置建议
-
推荐使用
temperature = 1.1和top_p = 0.95,以平衡生成多样性与质量。
-
-
部署及商用
-
基于 Apache-2.0 许可证,你可以在商业产品中集成使用;
-
建议参考模型 README 和 LICENSE,明确使用条款。
-
Seed-OSS的项目地址
数据统计
相关导航

阿里巴巴发布的一款拥有320亿参数的高性能推理模型,擅长数学和编程,适用于多种应用场景。

Zen Browser
一款基于 Firefox 内核的开源桌面浏览器,主打垂直标签、工作区与分屏视图,强调隐私保护与高效专注的现代浏览体验。

FaceFusion
AI换脸开源项目,利用深度学习技术实现高质量的人脸替换与图像处理。

kotaemon RAG
开源聊天应用工具,允许用户以聊天方式查询并获取文档中的相关信息。

BLOOM
由超过1000名来自60多个国家和250多个机构的研究人员参与开发的大型开源多语言语言模型,拥有176B参数,并在ROOTS语料库上训练,支持46种自然语言和13种编程语言,旨在推动学术界和小型公司对大型语言模型的研究和使用。

子曰-o1
网易有道推出的国内首款支持分步推理讲解的14B轻量级模型,专为教育场景设计,可助学生高效理解复杂数学问题。

OpenManus
开源的AI Agent框架,支持本地化部署和多智能体协作,能够高效完成复杂任务。

Chitu
清华大学团队与清程极智联合推出的开源大模型推理引擎,旨在通过底层技术创新,实现跨芯片架构的高效模型推理,推动AI技术的广泛应用。
暂无评论...
