日日新SenseNova大模型

9个月前更新 241 0 0

商汤科技推出的综合性大模型体系,具备强大的自然语言处理、文生图等多模态能力,旨在为企业提供高效的AI解决方案。

所在地:
中国
语言:
zh
收录时间:
2024-06-02
日日新SenseNova大模型日日新SenseNova大模型
日日新SenseNova大模型

日日新SenseNova大模型是由商汤科技推出的一个综合性大模型体系。

背景与发布:

  • 日日新SenseNova是商汤科技在2023年4月由董事长兼首席执行官徐立宣布推出的大模型体系。
  • 该体系在2023年8月获批上线,标志着其正式面向公众提供服务。
  • 2024年5月29日,商汤科技宣布其“日日新”大模型即将进行重大升级,并正式对外发布了日日新大模型5.0粤语版。

主要功能与特性

  • 自然语言处理:通过自然语言生成、意图识别、逻辑理解与代码解释器等能力,结合代码生成和自动执行,自动将数据转化为有意义的分析和可视化结果。
  • 文生图能力:包括数字人视频生成平台“如影”(SenseAvatar)等功能,可以为用户提供丰富的视觉内容生成服务。
  • 模型研发功能:支持用户根据需求进行模型研发,提供定制化的AI解决方案。

技术特点

  • 混合专家架构(MoE):日日新SenseNova 5.0采用MOE混合专家架构,这种架构允许模型在激活少量参数的情况下完成推理,提高了模型的处理效率和响应速度。
  • 训练数据量:基于超过10TB tokens的训练数据,确保了模型具有强大的知识库和广泛的应用能力。
  • 推理上下文窗口:达到200K左右,使模型能够处理更长的文本序列和更复杂的上下文关系。

性能对标

日日新SenseNova 5.0在综合性能上全面对标GPT-4 Turbo,并在主流客观评测上达到或超越GPT-4 Turbo,尤其在自然语言能力、文生图能力、多模态和数据分析能力等方面表现出色。

应用场景

日日新SenseNova大模型已广泛应用于金融、医疗健康、教育等多个领域,如智能客服、智慧营销、投研分析、研报撰写、医疗健康语言大模型等,为行业提供了强大的AI支持。

语言版本

除了标准版外,商汤科技还发布了日日新大模型5.0粤语版,进一步扩展了模型的语言支持能力。

日日新SenseNova大模型是商汤科技推出的一款综合性大模型体系,具有强大的自然语言处理、文生图能力和模型研发功能,通过先进的混合专家架构和大量的训练数据,实现了与GPT-4 Turbo相媲美的性能,并广泛应用于多个领域,为用户提供了高效、灵活的AI服务。

数据统计

相关导航

暂无评论

none
暂无评论...