智趣AI甄选
  • 行业观察
    • 快讯
    • 商业
    • 人物
    • 报告
    • 工具
    • 科普
  • 工具集
  • 公司库
  • AI备案查询
    • AI算法备案
    • 生成式AI备案
  • 大模型测评
    • CompassRank榜单
    • FlagEval榜单
    • HELM榜单
    • SuperCLUE榜单
  • 免费工具
    • AI图像生成
    • 在线翻译
    • 在线配音
    • 证件照制作
    • 一键抠图
    • 在线配色
    • AI搜索
    • 视频下载
  • 排行榜
  • en_USEnglish
    • 行业观察
      • 全部
      • 快讯
      • 商业
      • 人物
      • 工具
      • 报告
      • 科普
    • 最新收录
    • 热门排行
    • 产品精选
      • 热门产品
      • 国内精选
      • 国外精选
    • 分类推荐
      • AI办公
      • AI聊天
      • AI图像
      • AI设计
      • AI视频
      • AI音频
      • AI写作
      • AI翻译
      • AI编程
      • AI数字人
      • AI助手
      • AI法律
    • 产业融合
      • 智能制造
      • 智慧农业
      • 智能汽车
      • 智能医疗
      • 智慧金融
      • 智慧安防
      • 智能终端
      • 智慧金融
      • 智慧能源
      • 智能建筑
      • 智慧教育
      • 智能服务
    • AI公司甄选
      • 行业新锐
      • 福布斯AI50强(2025)
      • 福布斯AI50强(2024)
      • 福布斯中国AI50强(2024)
    • 大模型
    • 能力评测
    • 书籍推荐
    • 热门APP
    • 课程学习
    • 开源项目
    • en_USEnglish

    能力评测

    共 7 篇 网址
    热门产品国内精选国外精选分类推荐产业融合课程学习开源项目大模型能力评测AI公司甄选最新收录
    排序
    发布更新浏览点赞
    C-Eval

    C-Eval

    由上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件,涵盖多领域、多难度级别的客观题评测,旨在衡量大模型在中文理解和推理方面的能力。
    03,3030
    能力评测# 模型评估
    AGI-Eval评测社区

    AGI-Eval评测社区

    专注于评估大模型在人类认知与问题解决任务中通用能力的综合性评测平台,由知名高校与机构联合打造,提供多元化评测方式与权威排名,助力AI技术发展与应用。
    03,0050
    能力评测# 大模型评测
    MMBench

    MMBench

    多模态基准测试框架,旨在全面评估和理解不同场景下多模态模型的性能,通过精心设计的评估流程和标注数据集,提供稳健和可靠的评测结果。
    03,2090
    能力评测# 多模态评估# 测试框架
    HELM

    HELM

    由斯坦福大学发起的,旨在通过多个维度和场景全面评估大语言模型能力,以推动技术进步和模型优化的评测基准。
    03,1220
    能力评测# 大模型评测
    OpenCompass

    OpenCompass

    一个开源的大模型能力评测体系,旨在全面量化评估大模型在知识、语言、理解、推理等方面的能力,并推动模型的迭代优化。
    03,1930
    能力评测# 大模型评测
    SuperCLUE

    SuperCLUE

    一个针对中文大模型的综合性评测工具,通过多维度、多视角的评测体系真实反映大模型的通用能力,助力技术进步和产业化发展。
    03,7200
    能力评测# 大模型评测
    FlagEval

    FlagEval

    一个全面、科学、公正的大模型评测体系及开放平台,旨在通过提供多维度评测工具和方法,帮助研究人员全方位评估基础模型及训练算法的性能。
    03,1630
    能力评测# 大模型评测
    没有了

    最新文章

    热门网址

    标签云

    智趣AI甄选
    探索AI前沿,尽在智趣AI甄选!我们洞察行业发展前景,精选国内外产品与应用,提供丰富学习资源。行业融合案例助您洞悉趋势,与AI同行,共创未来!

    友链申请 申请收录 免责声明 隐私政策

    扫码加微信智趣AI甄选
    扫码加微信
    Copyright © 2025 智趣AI甄选 津ICP备20002714号 
    zh_CN 简体中文
    zh_CN 简体中文
    en_US English
    网址
    网址文章应用书籍