Seed-OSS翻译站点

5个月前更新 911 0 0

字节跳动开源的 360 亿参数长上下文大语言模型，支持 512K tokens、可控思维预算，在推理、代码与 Agent 任务中表现卓越，并采用 Apache-2.0 许可证可自由商用。

语言：

收录时间：

2025-08-21

打开网站手机查看

大模型开源项目 # 大模型

Seed-OSS

打开网站

Seed-OSS是什么？

Seed-OSS 是字节跳动开源的 360 亿参数大语言模型系列，采用 Apache-2.0 许可证，支持自由研究与商用。其最大亮点是原生支持 512K tokens 超长上下文，可处理整本书、法律合同等长文档；同时具备“思维预算”机制，允许开发者控制推理长度，提升效率。在推理、代码生成与 Agent 任务中表现优异，多项基准测试达到开源 SOTA 水平。Seed-OSS 提供基础版、指令调优版以及不含合成指令数据的研究版，满足企业应用与学术研究的不同需求，适用于长文档分析、复杂推理、编程辅助及多语言场景。

该系列包括三个版本：

Seed-OSS-36B-Base：基础模型，使用 synthetic instruction 数据预训练；
Seed-OSS-36B-Base-woSyn：不带 synthetic instruction 的基础版本，用于研究中立基线；
Seed-OSS-36B-Instruct：经过指令调优，适合下游任务执行。

每个模型参数约 36B（即 360 亿），具有以下技术亮点：

原生支持超长上下文，最大可达 512K tokens，在处理长文档、长逻辑推理链时表现卓越；
思维预算（thinking budget）可控，开发者可灵活控制模型推理长度，以提高推理效率；推荐以 512 的倍数设置（如 512、1024、2048 等），0 表示直接生成；
架构采用 causal LM + RoPE + GQA attention + RMSNorm + SwiGLU，层数 64，词汇量约 155K；
优化了推理能力和 agent 性能，在 reasoning、coding、agent 任务中表现优异；
提供带和不带 synthetic instruction 数据的版本，以满足研究者对训练数据影响的不同需求；
面向国际化（i18n）优化，具备良好的多语言支持。

Seed-OSS的主要功能

超长上下文处理能力：512K token 上下文支持，让模型处理超长文本（如书籍、法律文档、长推理链等）更流畅，减少截断问题。
思维预算可控机制：你可以通过设定推理预算，在推理过程中跟踪 token 使用，直到预算耗尽后生成答案。这种动态控制机制能提升效率并更好限制模型工作量。
优秀的推理与 agent 表现：在多项公开基准中，如数学、推理、问答、代码生成、agent 任务，Seed-OSS-36B-Instruct 达到或超过开源 SOTA 表现。例如 AIME24（91.7）、LiveCodeBench v6（67.4）、RULER (128K)（94.6）等。
研究友好：提供带/不带 synthetic instruction 版本，研究者可控制训练数据影响，更加透明与可控。
开放许可证：Apache-2.0 许可证支持商业使用，不限制使用范围，适合企业集成和产品落地。

Seed-OSS的使用场景

长文档处理与分析：如法律合同、学术论文、电子书、技术文档等，利用 512K 长上下文处理全篇内容。
复杂多步推理任务：如数学题、逻辑推理、案例分析或 chain-of-thought 解答，通过思维预算机制控制模型推理步骤。
Agent 系统与工具调用场景：比如构建知识问答机器人、自动工具调用、多任务协同机器人等，Seed-OSS 在 agent 任务中已展现强劲能力。
代码生成与编程辅助：在 LiveCodeBench v6 等 benchmark 表现优异，适合用于 IDE 智能补全、代码生成、bug 修复等场景。
语言学习与翻译任务：依托国际化优化，适合多语言支持下的 NLU、翻译、跨语言应用等。

如何使用Seed-OSS？

模型选择
- 若主要关注性能：选 Seed-OSS-36B-Base（带 synthetic data）或 Instruct（指令调优后）；
- 若关注研究基础模型：选 Base-woSyn。
获取模型
- 模型已经在 Hugging Face 等平台开源发布（如 Seed-OSS-36B）；
- 下载或通过现有 LLM 推理框架加载。
推理与思维预算控制
使用 <seed:think> 标签以及 <seed:cot_budget_reflect> 来指定和监控推理 budget，例如：

<seed:think>…</seed:think> <seed:cot_budget_reflect>I have used X tokens, Y remaining</seed:cot_budget_reflect>

推荐选择 512 的倍数。
配置资源要求
- FP16 推理需 ~72GB VRAM，INT8 需 ~36GB，INT4 则约 18–20GB；
- 可使用支持 partial offloading 的推理框架（如 vLLM 或 llama.cpp）以降低显存压力。
采样设置建议
- 推荐使用 temperature = 1.1 和 top_p = 0.95，以平衡生成多样性与质量。
部署及商用
- 基于 Apache-2.0 许可证，你可以在商业产品中集成使用；
- 建议参考模型 README 和 LICENSE，明确使用条款。

Seed-OSS的项目地址

GitHub仓库：https://github.com/ByteDance-Seed/seed-oss
HuggingFace模型库：https://huggingface.co/collections/ByteDance-Seed/seed-oss-68a609f4201e788db05b5dcd

数据统计

暂无评论

暂无评论...

Seed-OSS翻译站点

Seed-OSS是什么？

Seed-OSS的主要功能

Seed-OSS的使用场景

如何使用Seed-OSS？

Seed-OSS的项目地址

数据统计

相关导航

QwQ-32B

Zen Browser

FaceFusion

kotaemon RAG

BLOOM

子曰-o1

OpenManus

Chitu

暂无评论

最新文章

热门网址

Seed-OSS翻译站点

Seed-OSS是什么？

Seed-OSS的主要功能

Seed-OSS的使用场景

如何使用Seed-OSS？

Seed-OSS的项目地址

数据统计

相关导航

QwQ-32B

Zen Browser

FaceFusion

kotaemon RAG

BLOOM

子曰-o1

OpenManus

Chitu

暂无评论

最新文章

热门网址

标签云