MMBench
多模态基准测试框架,旨在全面评估和理解不同场景下多模态模型的性能,通过精心设计的评估流程和标注数据集,提供稳健和可靠的评测结果。
OpenCompass(也称为“司南”)是由上海人工智能实验室发布的开源大模型评测体系,旨在为大模型的评估提供一个公平、开放和可复制的基准。
总之,OpenCompass是一个功能强大、灵活可定制的大模型评测平台,为大模型的研发和优化提供了有力的支持。
本站智趣AI甄选提供的OpenCompass都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由智趣AI甄选实际控制,在2024 年 6 月 30 日 下午6:44收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,智趣AI甄选不承担任何责任。