腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

工具4周前更新 小智
196 0

混元Turbo S是什么

混元Turbo S是腾讯混元自研的新一代快思考模型,于2025年2月27日正式发布。该模型旨在解决慢思考模型在响应速度上的不足,通过技术创新实现“秒回”能力,吐字速度提升一倍,首字时延降低44%。

混元Turbo S采用Hybrid-Mamba-Transformer融合模式,首次将Mamba架构无损地应用于超大型MoE模型,降低了计算复杂度,减少了KV-Cache缓存占用,显著降低了训练和推理成本。这一创新使得混元Turbo S在保持高性能的同时,具备更低的部署门槛。

在业界通用的多个公开 Benchmark 上,混元 Turbo S 在知识、数学、推理等多个领域,展现出对标 DeepSeek V3、GPT 4o、Claude 等一系列业模型的效果表现。

腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

混元Turbo S核心特点

  1. 秒回能力

    • 快速响应:混元Turbo S能够实现“秒回”,吐字速度提升一倍,首字时延降低44%,几乎实现“即问即答”,大幅提升了交互流畅度。
    • 广泛适用:无论是日常对话、代码生成还是智能客服等场景,混元Turbo S都能带来更丝滑的交互体验,减少用户等待时间。
  2. 性能卓越

    • 知识、数理、创作能力强:在知识、数学、推理等多个领域展现出对标DeepSeek V3、GPT-4o、Claude 3.5等业界领先模型的效果表现。
    • 长短思维链融合:通过长短思维链融合,在保持文科类问题快思考体验的同时,显著改进了理科推理能力,实现模型整体效果提升。
  3. 成本优化

    • 架构创新:采用Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度和KV-Cache缓存占用,实现了训练和推理成本的下降。
    • 部署成本降低:这一创新使得混元Turbo S的部署成本大幅下降,有助于推动大模型应用门槛的降低。

混元Turbo S应用场景

混元Turbo S适用于需要快速响应和高效处理能力的场景,如智能客服、对话系统、代码生成等。其高效、低成本的特点,使得它能够满足企业和开发者对高效AI大模型的需求。

混元Turbo S市场定位

混元Turbo S作为腾讯混元系列的新一代旗舰模型,致力于为用户提供更智能、更高效的AI服务。其API调用定价为输入0.8元/百万tokens,输出2元/百万tokens,相比前代模型价格下降数倍,具有更高的性价比。

混元Turbo S如何使用

  • 腾讯云 API 调用:开发者和企业用户可以在腾讯云官网上通过 API 调用混元 Turbo S,即日起一周内免费试用。申请地址:https://cloud.tencent.com/apply/p/i2zophus2x8
  • 腾讯元宝体验:腾讯元宝即将逐步灰度上线混元 Turbo S,用户在元宝内选择“Hunyuan”模型并关闭深度思考即可体验使用。
© 版权声明

相关文章

暂无评论

none
暂无评论...