
Gemma 3n
Google 推出的轻量级开源大语言模型,兼具高性能与易部署,适合本地开发和多场景应用。
Qwen3-Next 是阿里云通义团队于2025年9月12日发布的下一代基础模型架构,旨在通过架构创新实现极致的上下文处理能力与参数效率。其核心模型Qwen3-Next-80B-A3B总参数达800亿,但推理时仅激活30亿参数(激活比例 1:50),在保持高性能的同时显著降低计算成本。该模型支持 百万级Tokens超长上下文,训练成本较上一代密集模型Qwen3-32B降低超90%,长文本推理吞吐量提升10倍以上,性能媲美千问3旗舰版2350亿参数模型。







