科普:大模型备案

博客3个月前更新 智趣
103 0

近年来,我国陆续发布了有关算法推荐管理与深度合成管理以及生成式人工智能服务管理的相关的规范文件,初步构建起对特定领域人工智能技术与服务的监管机制。具体至生成式人工智能服务领域,在《生成式人工智能服务管理暂行办法》(以下简称“《暂行办法》”)的监管框架下,形成了由算法备案制度和生成式人工智能备案(下称“大模型备案”)构成的“双备案制”的实践机制。

《互联网信息服务深度合成管理规定》第十九条规定“具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行或办理备案、变更、注销等相关手续。而大模型备案自《暂行办法》施行之日起仅有半年多,对于大模型备案的流程、规则以及安全评估相关的具体事项,企业相关的经验也相对较少。

本文将从大模型及大模型应用合规的:算法备案、安全评估、大模型上线备案,解读其中的监管规定、具体流程、所需材料、安全评估事项等,为大模型合规提供攻略指引。

科普:大模型备案

算法备案

算法备案是大模型备案中的重要一环,无论最终产品服务形态是网页、App、小程序,只要涉及深度合成技术服务(文本、图片、音频、视频、虚拟现实等)都需要进行算法备案,获得备案号相当于开车上路前需要取得的驾照,这一过程大概需要2-4个月不等的时间

1. 相关规定:

《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。

《生成式人工智能服务管理暂行办法》第十七条 规定,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

2. 算法备案流程及资料:
  • 主体信息填报: 平台到官方备案网站 https://beian.cac.gov.cn 上完成账号注册以及主体信息填报,填报完成后需等 待后台工作人员审核通过方可继续填报算法信息和产品及功能信息 。
  • 算法信息填报: 包括《算法安全自评估报告》、拟公示内容和算法详细属性报告。公示指的是算法透明度,具体功能和逻辑;属性指的是基础属性和包括数据、模型、策略、风险防范机制在内的详细属性。通常会在30个工作日内得到答复。
  • 产品 及功能信息填报: 关联产品及功能信息或填报技术服务方式,这一步需与算法信息填报一并递交审核。
科普:大模型备案
科普:大模型备案

安全评估

1. 相关规定

国家互联网信息办公室和公安部2018年11月发布的《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》指出,具有舆论属性和社会动员能力的互联网信息服务都需要进行安全评估,该评估针对应用类的技术服务商,技术提供方则不需要,可根据模型具体情况来判断。

2. 评估流程
科普:大模型备案
科普:大模型备案

大模型上线备案

1. 相关规定

《生成式人工智能服务管理暂行办法》第十七条指出,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估。

大模型备案的安全评估是依据《互联网新闻信息服务新技术新应用安全评估管理规定》,《互联网新闻信息服务新技术新应用安全评估管理规定》中所指的互联网新技术新应用是指用于提供互联网新闻信息服务的互联网站、应用程序、论坛、博客、微博客、公众账号、即时通信工具、网络直播以及其他具有新闻舆论属性或社会动员能力的创新性应用(包括功能及应用形式)及相关支撑技术,大模型属于规定所指的新技术新应用范畴。

2月29日,全国网络安全标准化技术委员会正式发布的《生成式人工智能服务安全基本要求》(以下简称“《基本要求》”)。《基本要求》作为大模型备案的配套指引,其第9章“安全评估要求”对备案所需安全评估应涵盖的要点进行逐一细化,第8章“其他要求”及附录A则是对于安全评估材料必备附件的细化要求。

科普:大模型备案
2. 备案流程

1)报请属地网信办,拿到备案表;

2)企业根据表格及评估要点准备填写材料;

3)企业内部展开评估,编写相关材料,准备测试账号;

4)材料附件及测试账号提交属地网信办审核;

5)属地网信办材料审核及技术测试审核通过后,属地上报中央网信办;未通过,修改材料或调整模型能力后再次提审,具体调整哪方面根据属地网信反馈进行;

6)中央网信办进行材料复审及技术评审,通过,企业下发备案号;未通过,需重新进行上线备案。

科普:大模型备案
3. 材料要求

(1)大模型上线备案表,包含以下具体内容:

  • 基本情况:模型名称、主要功能、适用人群、服务范围等。
  • 模型研制:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等。
  • 服务与安全防范:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等。
  • 安全评估:基本情况、评估情况。
  • 自愿承诺:承诺所填信息真实性,并签字确认。
  • 附件及备注:附件包括安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题。

(2)安全评估报告:提交的报告应包含语料安全评估、模型安全评估以及安全措施评估,并应在评估报告中形成整体评估结论。每一类评估的要求可参考《基本要求》中的具体条款。

(3)模型服务协议:一般包含产品及服务的各项规则及隐私条款等,需协同法务共同制定提交。

(4)语料标注规则:包括标注团队介绍、功能性及安全性标注细则,标注流程等。

(5)拦截关键词列表:总规模不宜少于10000个,应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。

科普:大模型备案

(6)评估测试题集:

  • 该测试题集需要包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。
  • 测试题分类满足《生成式人工智能服务安全基本要求》中相关的风险类型,并有最小的数量要求。
  • 测试题建议是“问题”(包含主谓宾),不可只是短词、长文章。
  • 生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。

以上提交材料均可参考《生成式人工智能服务安全要求》,《基本要求》作为引导、指引生成式人工智能服务安全发展的指南类文件,本身虽不具备强制性法律效力,但在现行网络空间治理法律框架下合法合规提供生成式人工智能服务提供实践指引与监管侧重参照,企业在提交相关材料时可具体根据《基本要求》的条款逐一核对是否满足要求。

自大模型备案开展以来,大模型备案的实践要求处于动态调整的过程,这在一定程度上体现出监管部门对大模型备案的重视程度:随着实践经验的积累,适时调整备案要求从而契合当下生成式人工智能服务的发展情况。

附录:大模型备案查询

© 版权声明

相关文章

暂无评论

暂无评论...