通义听悟是阿里云推出的一款AI助手,主要用于音视频内容的处理与理解。
产品概述
- 发布背景:通义听悟于2023年6月1日在“智在粤港澳”阿里云峰会上正式发布,是阿里云在大模型布局中的又一重要产品。
- 产品定位:面向工作和学习的AI助手,旨在提升用户在会议、授课、采访、翻译等场景下的效率。
核心功能
- 实时转写:能够将音视频内容快速转录为条理清晰的文字速记。
- 章节速览:提炼多个章节的要旨,并直接对应到时间轴上每个节点。
- 发言总结:在会议上区分多个不同发言人,分别提炼和总结其观点。
- 全文摘要:快速总结视频核心内容,将长文缩短为概要。
- 一键AI改写(升级后新增):将口语内容自动转化为书面语表达。
- 思维导图自动生成(升级后新增):自动提取音视频要点,生成思维导图。
- 音视频问答助手“小悟”(升级后新增):支持单条音视频内的自由问答,也支持跨多个音视频记录进行问题回答,甚至支持中文直接问英文视频,直接用中文给出答案。
技术特点
- 语义理解:在将声音转写为文字的基础上,通义听悟能够对语义加以理解,实现先“听”后“悟”。
- 高效处理:一个长达10-20分钟的音视频,通义听悟能够以10-100倍的加速比转化为文字,再用不到1分钟的时间加以理解。
- 多语言支持:小悟助手支持中文直接问英文视频,直接用中文给出答案,省去翻译步骤。
应用场景
- 会议记录:自动区分发言人并总结观点,提升会议效率。
- 学习笔记:快速生成课程要点和思维导图,帮助学习。
- 采访整理:将采访内容快速转写并总结,便于后续编辑。
- 翻译辅助:支持多语言问答,辅助翻译工作。
使用方式
- 用户可以通过阿里云官网注册账号并开通通义听悟服务。
- 新开通服务的用户可免费试用90天,每天免费使用额度为48小时(转写时长),当日免费额度用完后,在24小时后才可以重新使用。
- 用户可以上传音视频文件或使用麦克风进行实时转写。
未来发展
- 通义听悟的能力将不断提升,并深入到一系列垂直领域进行定制,以更好地满足用户需求。
- 阿里云将致力于发挥通义听悟作为助手的作用,推动新技术快速落地赋能千行百业。
总的来说,通义听悟是一款功能强大、操作简便的AI助手,能够显著提升用户在音视频内容处理方面的效率。随着技术的不断进步和应用的不断拓展,通义听悟有望在未来发挥更大的作用。