商汤日日新(SenseNova)是商汤科技推出的大模型体系,旨在通过先进的人工智能技术推动行业的创新与变革。
一、产品背景与推出
- 商汤日日新是由商汤科技于2023年4月正式推出的大模型体系,由商汤科技董事长兼首席执行官徐立宣布。
- 2023年8月31日凌晨,首批大模型产品获批名单出炉,商汤日日新大模型成功获批上线。
二、产品体系与功能
- 商汤日日新大模型体系包含自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”以及数字人视频生成平台“如影”(SenseAvatar)等多个组成部分。
- 主要功能包括自然语言生成、文生图、感知模型标注以及模型研发等。商汤日日新允许用户通过自然语言输入,结合大模型的意图识别、逻辑理解与代码解释器的能力,通过代码生成、代码自动执行的方式自动将数据转化为有意义的分析和可视化结果。
三、技术实力与成就
- 商汤日日新大模型在技术上取得了显著成就。2024年4月发布的商汤日日新5.0大模型采用MOE混合专家架构,基于超过10TB tokens训练,推理上下文窗口达到200K,全面对标GPT-4 Turbo。
- 在中文大模型测评基准SuperCLUE中,商汤日日新5.0(SenseChat V5)以总分80.03分的优异成绩刷新了国内最好成绩,并且在中文综合成绩上超越了GPT-4 Turbo-0125,成为国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。
- 商汤日日新在文科任务上表现出色,尤其在长文本、生成创作、角色扮演、安全能力、工具使用上处于全球领先位置。在理科任务上同样不俗,尤其在计算、逻辑推理、工具使用等方面也刷新了国内最好成绩。
四、市场应用与前景
- 商汤日日新已经在多个领域得到了应用,如WPS 365已经接入了商汤日日新大模型。商汤表示,他们将继续致力于生成式AI产品的开发,以满足不同行业的需求。
- 商汤科技对生成式AI业务给予了高度重视,将原本的四个主营业务重新划分为三大板块,其中生成式AI业务成为重点发展方向。2023年,商汤生成式AI业务收入已达12亿元人民币,为集团贡献35%的营收。
商汤日日新作为商汤科技推出的大模型体系,在技术上取得了显著成就,并在市场上得到了广泛应用。随着人工智能技术的不断发展,商汤日日新有望在未来继续推动行业的创新与变革。