日日新SenseNova大模型是由商汤科技推出的一个综合性大模型体系。
背景与发布:
- 日日新SenseNova是商汤科技在2023年4月由董事长兼首席执行官徐立宣布推出的大模型体系。
- 该体系在2023年8月获批上线,标志着其正式面向公众提供服务。
- 2024年5月29日,商汤科技宣布其“日日新”大模型即将进行重大升级,并正式对外发布了日日新大模型5.0粤语版。
主要功能与特性:
- 自然语言处理:通过自然语言生成、意图识别、逻辑理解与代码解释器等能力,结合代码生成和自动执行,自动将数据转化为有意义的分析和可视化结果。
- 文生图能力:包括数字人视频生成平台“如影”(SenseAvatar)等功能,可以为用户提供丰富的视觉内容生成服务。
- 模型研发功能:支持用户根据需求进行模型研发,提供定制化的AI解决方案。
技术特点:
- 混合专家架构(MoE):日日新SenseNova 5.0采用MOE混合专家架构,这种架构允许模型在激活少量参数的情况下完成推理,提高了模型的处理效率和响应速度。
- 训练数据量:基于超过10TB tokens的训练数据,确保了模型具有强大的知识库和广泛的应用能力。
- 推理上下文窗口:达到200K左右,使模型能够处理更长的文本序列和更复杂的上下文关系。
性能对标:
日日新SenseNova 5.0在综合性能上全面对标GPT-4 Turbo,并在主流客观评测上达到或超越GPT-4 Turbo,尤其在自然语言能力、文生图能力、多模态和数据分析能力等方面表现出色。
应用场景:
日日新SenseNova大模型已广泛应用于金融、医疗健康、教育等多个领域,如智能客服、智慧营销、投研分析、研报撰写、医疗健康语言大模型等,为行业提供了强大的AI支持。
语言版本:
除了标准版外,商汤科技还发布了日日新大模型5.0粤语版,进一步扩展了模型的语言支持能力。
日日新SenseNova大模型是商汤科技推出的一款综合性大模型体系,具有强大的自然语言处理、文生图能力和模型研发功能,通过先进的混合专家架构和大量的训练数据,实现了与GPT-4 Turbo相媲美的性能,并广泛应用于多个领域,为用户提供了高效、灵活的AI服务。
数据统计
数据评估
关于日日新SenseNova大模型特别声明
本站智趣AI甄选提供的日日新SenseNova大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由智趣AI甄选实际控制,在2024 年 6 月 2 日 上午9:29收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,智趣AI甄选不承担任何责任。
相关导航
云从科技自主研发的多模态大模型,具备实时学习、同步反馈、跨模态交互等能力,广泛应用于金融、安防、政务等多个行业,推动AI应用的普及与发展。
GPT-4o
OpenAI推出的多模态、全能型AI模型,支持文本、音频和图像的输入输出,具备快速响应和先进功能,对公众免费开放,提供自然流畅的交互体验。
百川大模型
百川智能推出的融合意图理解、信息检索和强化学习技术的大型语言模型,致力于提供自然、高效的智能服务,并已开放API和开源部分模型。
ChatGLM-6B
一款由清华大学开发的开源生成式语言模型,专为中文聊天和对话任务设计,展现了强大的中文自然语言处理能力。
商汤日日新
商汤科技推出的大模型体系,集自然语言处理、文生图等能力于一体,旨在通过先进的人工智能技术赋能各个行业,引领智慧时代的创新与变革。
通义大模型
由阿里云推出的超大规模预训练语言模型,具备强大的自然语言处理和理解能力,能够模拟人类思维进行多轮对话、文案创作等任务,并服务于多个行业和场景,为用户提供智能化解决方案。
Mistral Large
一款由Mistral AI公司发布的,拥有5300亿个参数的大型语言模型,支持多语言,具有强大的推理能力、语言理解和生成能力,可在复杂的多语言推理任务中表现出色,包括文本理解、转换和代码生成等。
360智脑
360公司自主研发的综合性大模型,集成了多模态技术,具备强大的生成创作、逻辑推理等能力,为企业提供全方位的AI服务。
暂无评论...