
Seed-OSS是什么?
Seed-OSS 是字节跳动开源的 360 亿参数大语言模型系列,采用 Apache-2.0 许可证,支持自由研究与商用。其最大亮点是原生支持 512K tokens 超长上下文,可处理整本书、法律合同等长文档;同时具备“思维预算”机制,允许开发者控制推理长度,提升效率。在推理、代码生成与 Agent 任务中表现优异,多项基准测试达到开源 SOTA 水平。Seed-OSS 提供基础版、指令调优版以及不含合成指令数据的研究版,满足企业应用与学术研究的不同需求,适用于长文档分析、复杂推理、编程辅助及多语言场景。
该系列包括三个版本:
- Seed-OSS-36B-Base:基础模型,使用 synthetic instruction 数据预训练;
- Seed-OSS-36B-Base-woSyn:不带 synthetic instruction 的基础版本,用于研究中立基线;
- Seed-OSS-36B-Instruct:经过指令调优,适合下游任务执行。
每个模型参数约 36B(即 360 亿),具有以下技术亮点:
- 原生支持超长上下文,最大可达 512K tokens,在处理长文档、长逻辑推理链时表现卓越;
- 思维预算(thinking budget)可控,开发者可灵活控制模型推理长度,以提高推理效率;推荐以 512 的倍数设置(如 512、1024、2048 等),0 表示直接生成;
- 架构采用 causal LM + RoPE + GQA attention + RMSNorm + SwiGLU,层数 64,词汇量约 155K;
- 优化了推理能力和 agent 性能,在 reasoning、coding、agent 任务中表现优异;
- 提供带和不带 synthetic instruction 数据的版本,以满足研究者对训练数据影响的不同需求;
- 面向国际化(i18n)优化,具备良好的多语言支持。
Seed-OSS的主要功能
- 超长上下文处理能力:512K token 上下文支持,让模型处理超长文本(如书籍、法律文档、长推理链等)更流畅,减少截断问题。
- 思维预算可控机制:你可以通过设定推理预算,在推理过程中跟踪 token 使用,直到预算耗尽后生成答案。这种动态控制机制能提升效率并更好限制模型工作量。
- 优秀的推理与 agent 表现:在多项公开基准中,如数学、推理、问答、代码生成、agent 任务,Seed-OSS-36B-Instruct 达到或超过开源 SOTA 表现。例如 AIME24(91.7)、LiveCodeBench v6(67.4)、RULER (128K)(94.6)等。
- 研究友好:提供带/不带 synthetic instruction 版本,研究者可控制训练数据影响,更加透明与可控。
- 开放许可证:Apache-2.0 许可证支持商业使用,不限制使用范围,适合企业集成和产品落地。
Seed-OSS的使用场景
- 长文档处理与分析:如法律合同、学术论文、电子书、技术文档等,利用 512K 长上下文处理全篇内容。
- 复杂多步推理任务:如数学题、逻辑推理、案例分析或 chain-of-thought 解答,通过思维预算机制控制模型推理步骤。
- Agent 系统与工具调用场景:比如构建知识问答机器人、自动工具调用、多任务协同机器人等,Seed-OSS 在 agent 任务中已展现强劲能力。
- 代码生成与编程辅助:在 LiveCodeBench v6 等 benchmark 表现优异,适合用于 IDE 智能补全、代码生成、bug 修复等场景。
- 语言学习与翻译任务:依托国际化优化,适合多语言支持下的 NLU、翻译、跨语言应用等。
如何使用Seed-OSS?
-
模型选择
-
若主要关注性能:选
Seed-OSS-36B-Base(带 synthetic data)或Instruct(指令调优后); -
若关注研究基础模型:选
Base-woSyn。
-
-
获取模型
-
模型已经在 Hugging Face 等平台开源发布(如 Seed-OSS-36B);
-
下载或通过现有 LLM 推理框架加载。
-
-
推理与思维预算控制
使用<seed:think>标签以及<seed:cot_budget_reflect>来指定和监控推理 budget,例如:推荐选择 512 的倍数。
-
配置资源要求
-
FP16 推理需 ~72GB VRAM,INT8 需 ~36GB,INT4 则约 18–20GB;
-
可使用支持 partial offloading 的推理框架(如 vLLM 或 llama.cpp)以降低显存压力。
-
-
采样设置建议
-
推荐使用
temperature = 1.1和top_p = 0.95,以平衡生成多样性与质量。
-
-
部署及商用
-
基于 Apache-2.0 许可证,你可以在商业产品中集成使用;
-
建议参考模型 README 和 LICENSE,明确使用条款。
-
Seed-OSS的项目地址
数据统计
相关导航

xAI发布的基于混合专家系统技术的开源大语言模型,拥有3140亿参数,旨在提供强大的语言理解和生成能力,帮助人类获取知识和信息。

Mureka O1
昆仑万维发布的全球首款引入思维链技术的音乐推理大模型,支持多风格与情感的音乐生成、歌曲参考及音色克隆,具备低延迟和高品质性能,并开放API服务供企业与开发者集成应用。

GPT-5
OpenAI 推出的下一代多模态大模型,具备更强的语言理解、生成和跨模态交互能力,广泛适用于内容创作、智能助手与企业应用等场景。

Qwen3-Coder
阿里开源的代码大模型,支持全流程编程与复杂任务规划,性能超 GPT-4.1,成本更低。

从容大模型
云从科技自主研发的多模态大模型,具备实时学习、同步反馈、跨模态交互等能力,广泛应用于金融、安防、政务等多个行业,推动AI应用的普及与发展。

Claude 3.7 Max
Anthropic 公司推出的专为硬核开发者设计的顶级 AI 模型,以强大代码处理能力和 200k 上下文窗口应对超复杂任务。

Yi-Large
零一万物公司推出的具有千亿参数规模的AI通用大模型,具备强大的自然语言处理能力和广泛的应用前景。

LiveTalking
开源数字人制作平台,旨在帮助用户快速创建自然逼真的数字人角色,大幅降低制作成本并提高工作效率。
暂无评论...
