
SkyReels-V1
昆仑万维开源的AI短剧创作视频生成模型,具备影视级人物微表情表演生成与电影级光影美学,支持文生视频与图生视频,为AI短剧创作带来全新体验。
PaddleOCR-VL是百度发布的轻量级多模态文档解析模型,专为复杂文档结构解析设计,核心参数仅 0.9B,却以92.6分登顶全球权威文档解析评测榜单 OmniBenchDoc V1.5,在文本、表格、公式、阅读顺序四大核心能力上全面超越 GPT-4o、Gemini-2.5 Pro等主流模型,刷新全球OCR VL模型性能天花板。作为文心4.5的衍生模型,它融合NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,兼顾精度与效率,支持109种语言,覆盖中文、英语、法语、阿拉伯语等多语种场景。







