
Seed-OSS是什么?
Seed-OSS 是字节跳动开源的 360 亿参数大语言模型系列,采用 Apache-2.0 许可证,支持自由研究与商用。其最大亮点是原生支持 512K tokens 超长上下文,可处理整本书、法律合同等长文档;同时具备“思维预算”机制,允许开发者控制推理长度,提升效率。在推理、代码生成与 Agent 任务中表现优异,多项基准测试达到开源 SOTA 水平。Seed-OSS 提供基础版、指令调优版以及不含合成指令数据的研究版,满足企业应用与学术研究的不同需求,适用于长文档分析、复杂推理、编程辅助及多语言场景。
该系列包括三个版本:
- Seed-OSS-36B-Base:基础模型,使用 synthetic instruction 数据预训练;
- Seed-OSS-36B-Base-woSyn:不带 synthetic instruction 的基础版本,用于研究中立基线;
- Seed-OSS-36B-Instruct:经过指令调优,适合下游任务执行。
每个模型参数约 36B(即 360 亿),具有以下技术亮点:
- 原生支持超长上下文,最大可达 512K tokens,在处理长文档、长逻辑推理链时表现卓越;
- 思维预算(thinking budget)可控,开发者可灵活控制模型推理长度,以提高推理效率;推荐以 512 的倍数设置(如 512、1024、2048 等),0 表示直接生成;
- 架构采用 causal LM + RoPE + GQA attention + RMSNorm + SwiGLU,层数 64,词汇量约 155K;
- 优化了推理能力和 agent 性能,在 reasoning、coding、agent 任务中表现优异;
- 提供带和不带 synthetic instruction 数据的版本,以满足研究者对训练数据影响的不同需求;
- 面向国际化(i18n)优化,具备良好的多语言支持。
Seed-OSS的主要功能
- 超长上下文处理能力:512K token 上下文支持,让模型处理超长文本(如书籍、法律文档、长推理链等)更流畅,减少截断问题。
- 思维预算可控机制:你可以通过设定推理预算,在推理过程中跟踪 token 使用,直到预算耗尽后生成答案。这种动态控制机制能提升效率并更好限制模型工作量。
- 优秀的推理与 agent 表现:在多项公开基准中,如数学、推理、问答、代码生成、agent 任务,Seed-OSS-36B-Instruct 达到或超过开源 SOTA 表现。例如 AIME24(91.7)、LiveCodeBench v6(67.4)、RULER (128K)(94.6)等。
- 研究友好:提供带/不带 synthetic instruction 版本,研究者可控制训练数据影响,更加透明与可控。
- 开放许可证:Apache-2.0 许可证支持商业使用,不限制使用范围,适合企业集成和产品落地。
Seed-OSS的使用场景
- 长文档处理与分析:如法律合同、学术论文、电子书、技术文档等,利用 512K 长上下文处理全篇内容。
- 复杂多步推理任务:如数学题、逻辑推理、案例分析或 chain-of-thought 解答,通过思维预算机制控制模型推理步骤。
- Agent 系统与工具调用场景:比如构建知识问答机器人、自动工具调用、多任务协同机器人等,Seed-OSS 在 agent 任务中已展现强劲能力。
- 代码生成与编程辅助:在 LiveCodeBench v6 等 benchmark 表现优异,适合用于 IDE 智能补全、代码生成、bug 修复等场景。
- 语言学习与翻译任务:依托国际化优化,适合多语言支持下的 NLU、翻译、跨语言应用等。
如何使用Seed-OSS?
-
模型选择
-
若主要关注性能:选
Seed-OSS-36B-Base(带 synthetic data)或Instruct(指令调优后); -
若关注研究基础模型:选
Base-woSyn。
-
-
获取模型
-
模型已经在 Hugging Face 等平台开源发布(如 Seed-OSS-36B);
-
下载或通过现有 LLM 推理框架加载。
-
-
推理与思维预算控制
使用<seed:think>标签以及<seed:cot_budget_reflect>来指定和监控推理 budget,例如:推荐选择 512 的倍数。
-
配置资源要求
-
FP16 推理需 ~72GB VRAM,INT8 需 ~36GB,INT4 则约 18–20GB;
-
可使用支持 partial offloading 的推理框架(如 vLLM 或 llama.cpp)以降低显存压力。
-
-
采样设置建议
-
推荐使用
temperature = 1.1和top_p = 0.95,以平衡生成多样性与质量。
-
-
部署及商用
-
基于 Apache-2.0 许可证,你可以在商业产品中集成使用;
-
建议参考模型 README 和 LICENSE,明确使用条款。
-
Seed-OSS的项目地址
数据统计
相关导航

开源软件开发代理平台,旨在通过智能任务执行和代码优化等功能,提高开发者的效率和生产力。

Laminar
一个开源的AI工程优化平台,专注于从第一原理出发进行AI工程。它帮助用户收集、理解和使用数据,以提高LLM(大型语言模型)应用的质量。

Deep-Live-Cam
基于Python的开源AI实时换脸工具,支持毫秒级的人脸替换效果,可用于娱乐、艺术创作及教育等多个领域。

Meta Llama 3
Meta公司推出的高性能开源大语言模型,具备强大的多语言处理能力和广泛的应用前景,尤其在对话类应用中表现出色。

Eino
Eino是字节跳动开源的、基于组件化设计和图编排引擎的大模型应用开发框架。

ChatAnyone
阿里巴巴达摩院开发的实时人像视频生成工具,通过分层运动扩散模型实现高度逼真、风格可控且实时高效的人像视频生成,适用于视频聊天、虚拟主播及数字娱乐等场景。

Phi-3
微软推出的一款高性能大型语言模型,经过指令调整,支持跨平台运行,具备出色的语言理解和推理能力,特别适用于多模态应用场景。

Nova Sonic
亚马逊推出的新一代生成式AI语音模型,具备统一模型架构、自然流畅的语音交互、实时双向对话能力及多语言支持,可广泛应用于多行业场景。
暂无评论...
