
ChatTTS
专为对话场景优化的开源文本转语音模型,能够生成高质量、自然流畅的对话语音。
PaddleOCR-VL是百度发布的轻量级多模态文档解析模型,专为复杂文档结构解析设计,核心参数仅 0.9B,却以92.6分登顶全球权威文档解析评测榜单 OmniBenchDoc V1.5,在文本、表格、公式、阅读顺序四大核心能力上全面超越 GPT-4o、Gemini-2.5 Pro等主流模型,刷新全球OCR VL模型性能天花板。作为文心4.5的衍生模型,它融合NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,兼顾精度与效率,支持109种语言,覆盖中文、英语、法语、阿拉伯语等多语种场景。







