
ChatAnyone
阿里巴巴达摩院开发的实时人像视频生成工具,通过分层运动扩散模型实现高度逼真、风格可控且实时高效的人像视频生成,适用于视频聊天、虚拟主播及数字娱乐等场景。
Qwen-Image是阿里通义千问团队于2025年8月5日开源的200亿参数图像生成基础模型,采用MMDiT架构,专为复杂文本渲染与高精度图像生成设计。其核心优势在于中英文多行段落级高保真文本渲染,能精准生成海报、PPT等场景中的复杂排版,中文渲染能力大幅领先现有模型;同时支持照片级写实、动漫、极简设计等多风格通用图像生成,并具备风格迁移、增删改、细节增强等一致性图像编辑能力,可保持多轮修改后的内容连贯性。在GenEval、DPG、LongText-Bench等12项基准测试中均取得SOTA性能,开源后迅速登顶Hugging Face全球热度榜,为设计师、开发者及内容创作者提供零门槛的专业级图像生成与编辑工具。