
Open-Sora 2.0
潞晨科技推出的高性能、低成本的全新开源视频生成模型,引领开源视频生成技术迈入新阶段。
PaddleOCR-VL是百度发布的轻量级多模态文档解析模型,专为复杂文档结构解析设计,核心参数仅 0.9B,却以92.6分登顶全球权威文档解析评测榜单 OmniBenchDoc V1.5,在文本、表格、公式、阅读顺序四大核心能力上全面超越 GPT-4o、Gemini-2.5 Pro等主流模型,刷新全球OCR VL模型性能天花板。作为文心4.5的衍生模型,它融合NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,兼顾精度与效率,支持109种语言,覆盖中文、英语、法语、阿拉伯语等多语种场景。






