紫东太初是中国科学院自动化研究所研发的跨模态通用人工智能平台,其核心为全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer)。
研发背景与意义:
- 紫东太初的研发标志着在人工智能领域,尤其是预训练模型方面取得了突破性进展。
- 该平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。
核心技术特点:
- 跨模态理解与生成能力:紫东太初具备跨模态理解与跨模态生成能力,能够在无监督情况下进行多任务联合学习,并快速迁移到不同领域的数据。
- 三模态统一表示:通过引入语音模态,紫东太初实现了共性图文音语义空间表征和利用,并突破性地直接实现三模态的统一表示。
- 独特应用场景:特别地,紫东太初首次使“以图生音”和“以音生图”成为现实,为视频配音、语音播报、标题摘要、海报创作等更多元场景提供模型基础支撑。
发展历程:
- 2021年7月9日,紫东太初在2021世界人工智能大会(WAIC)昇腾人工智能高峰论坛上正式报告。
- 2023年6月16日,中国科学院自动化研究所在上海发布了紫东太初2.0,相比第一代在决策与判断能力上有了显著提升。
- 2024年3月5日消息,武汉人工智能研究院联合中国科学院自动化研究所自主研发的“紫东太初”大模型已迭代到2.0版本,并预计“紫东太初3.0”将于2024年上半年发布。
市场与应用:
- 紫东太初大模型已通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务。
- 该平台在医疗、交通、工业生产等领域具有广泛的应用前景,未来将在这些领域发挥更大作用。
合作伙伴与影响:
- 新大陆作为紫东太初的创始合作伙伴之一,其算法质量在相关领域中排名第一。
- 紫东太初2.0全模态大模型获得了2022年世界人工智能大会最高奖“卓越人工智能引领者奖”,证明了其在人工智能领域的领先地位和影响力。
综上所述,紫东太初作为中国科学院自动化研究所的杰作,不仅在技术上取得了显著突破,而且在市场上也展现出了广泛的应用前景和巨大的潜力。