基于海量数据、先进算法和雄厚算力构建出的生成式人工智能服务一经出现,便给社会各行各业带来极大的变化。过往法律零散地对生成式人工智能服务产生的风险进行回应式规制,具有滞后性,不能及时的应对各种风险。而最近出台的针对生成式人工智能服务的一系列针对性法律规制,又对生成式人工智能服务的风险分级类别、依据、后果规定得不够细致,无法引导生成式人工智能服务兼顾发展与安全。因此以现有立法为基础,综合国外立法经验和国内学者观点,从生成式人工智能服务的“基础模型-专业模型-服务应用”的现实风险出发,厘清生成式人工智能服务风险分级的种类、依据及后果,为生成式人工智能服务在法治轨道上发展提供法律规制指引。
一、引言
二、生成式人工智能服务的机制、特点及风险
规制生成式人工智能服务,首先需要了解生成式人工智能的运行机制并总结生成式人工智能服务的特点,从而明确生成式人工智能服务可能会产生哪些风险。
(一)
生成式人工智能服务的机制
根据OpenAI官网的描述,生成式人工智能的产生(以ChatGPT为例)分为四个阶段,包括:(1)给生成式人工智能提供训练数据帮助其构建模型。(2)进行人工标注,引导生成式人工智能模型向人类期待的方向作答。(3)通过人工对GPT生成的多个答案进行排序建立奖励模型。(4)将GPT的生成结果再投入模型,实现模型的不断迭代优化。可以将生成式人工智能服务的产生大致总结为三个层面:(1)通过各种途径收集大量数据构建基础模型阶段。(2)通过人工标注和奖励模型构建算法模型阶段。(3)通过服务端生成内容反馈迭代优化阶段。
(二)
生成式人工智能服务的特点
生成式人工智能服务(以ChatGPT为例)的智能由两方面产生,一方面是利用一个叫“转换器”的基于神经网络的深度学习模型对用户的提问文本和海量语料进行概率性匹配分析,从而使得计算机生成结果接近自然人语言;另一方面是通过“人类反馈强化学习机制”和一个叫“生成式对抗网络”的深度学习模型,让人类和人工智能自身对用户提问和人工智能生成结果做出正面和反面的评价,从而推进人工智能不断迭代优化。据此,本文总结出了生成式人工智能服务具有的三个特点:(1)生成式人工智能服务的生成结果具有随机性,生成式人工智能服务需要依靠海量数据进行预训练才能提高生成结果的真实性和准确性。(2)生成式人工智能服务具有反馈性,生成式人工智能服务的迭代优化需要人工标注者和用户不断反馈。(3)生成式人工智能服务具有人机交互性,生成式人工智能服务智能的展现一方面离不开强大的算力整合海量数据进行预训练,另一方面也需要人类参与人工标注和生成内容反馈,从而使服务不断迭代优化。
(三)
生成式人工智能服务的风险
在这些研究基础上,本文认为立法者应从生成式人工智能服务的基础模型层面、算法模型层面和应用服务层面出发,在基础模型层面内嵌治理原则,实现技管结合,引导技术向善,根据算法模型的可解释性、透明性、可控性以及服务层面生成内容的真实性、可靠性、准确性厘定不同生成式人工智能服务的风险,进行分级治理,才能兼顾技术发展与社会安全。
我国生成式人工智能服务法律规制发展沿革
早先,我国主要通过零散的法律法规,对生成式人工智能服务的各个环节分散治理。例如在生成式人工智能基础模型获取训练数据时,要遵守个人信息保护法第13条的规定,在处理网络上的个人信息时,要获得个人同意,其次,要遵守个人信息保护法第6条的规定,在最小范围内收集个人信息;接着,如果生成式人工智能基础模型的训练数据是通过网络爬虫的方式获取的,则需要遵守网络安全法第27条的规定,不得对被爬虫的网络站点造成影响;最后在获取训练数据时要遵守反不正当竞争法第18条的规定,不得侵犯其他网络运营者智力劳动成果投入而形成的数据产品。虽然以分散的法律对生成式人工智能产生的问题大都可以进行回应,但是一方面存在法律模糊地带,例如用户使用生成式人工智能产品生成的内容可否被企业无条件直接利用;另一方面,以分散的法律回应产生的问题针对性较弱,且回应具有滞后性,不能从根源上真正解决问题。
我国生成式人工智能服务法律规制存在的问题
1.缺乏对生成式人工智能服务的翔实定义
2.对生成式人工智能服务的管理存在“一刀切”的情况
《生成式人工智能服务管理办法(征求意见稿)》中完全没有提到对生成式人工智能服务进行分类分级管理,《生成式人工智能服务管理暂行办法》第3条提到对生成式人工智能服务进行分类分级管理,但也只是一笔带过。显然目前我国立法并没有基于生成式人工智能服务可能存在不同等级风险进行详尽的分级治理,这种“一刀切”的做法,一方面会导致高风险的生成式人工智能服务产生的大量法律问题不能及时解决,另一方面又会阻碍低风险的生成式人工智能服务的正常发展,迟滞技术进步的脚步。
《生成式人工智能服务管理暂行办法》对于分级管理的分级依据、分级类别、不同级别的规制方式均语焉不详,使得该规定只是一纸空文,起不到相应的规避风险,促进经济发展,维护市场稳定的作用。
通过划分风险级别分级规制人工智能服务
以欧盟的人工智能法案为代表的硬法规范大多基于风险对人工智能服务分级规制,通常将人工智能服务基于风险分为禁止级、高风险级、有限风险级、最小风险级四个等级,分级的依据包括:人工智能服务基础模型训练数据的数量与质量;人工智能服务涉及算法的透明性、可靠性、可解释性;人工智能服务本身在经济社会中的重要性以及其可能对社会产生的危害。
通过明确基本原则规制人工智能服务
以经合组织的《人工智能原则》为代表的软法规范,大多是从一个宏观层面阐明人工智能服务需要具备的特征,概括成以下三个方面:(1)以人为本的价值、公平、可靠等原则强调人工智能服务基础模型训练数据要保质保量,避免出现歧视、非客观、非公正等伦理问题;(2)透明度、可解释、稳健性等原则强调人工智能服务算法模型需要置于人的控制之下,每一行代码都能够被解释,从而保证算法生成的结果在可控范围之内;(3)包容性、可持续性发展、责任导向等原则强调人工智能服务产出的结果以及使用人工智能服务的过程都要置于法律的监管之下,从而兼顾人工智能的发展与安全。
1.明确生成式人工智能服务范围
只有明确生成式人工智能服务的定义,才能明晰生成式人工智能服务的运行涉及哪些要素、可能面临哪些风险,从而为进一步提出规制生成式人工智能服务的措施提供理论依据。
2.确立生成式人工智能服务的治理原则
法律不能管到社会生产生活的方方面面,尤其是生成式人工智能服务的算法层面。由于算法的复杂性、多变性、黑箱性,法律很难直接规制,此时就需要提取生成式人工智能服务运行的“最大公约数”,确立相应的治理原则,并将其内嵌入算法当中,从而在技术层面避免生成式人工智能服务可能带来的风险。
3.细化不同风险级别生成式人工智能服务的管理措施
“法律是利益调整的工具,是社会不同利益群体之间的平衡器。在利益平衡理念指引下的法律规则,能够充分考虑法律调整对象之间的利益均衡”。只有笼统地规定不可能达到立法目的,发挥法律相应的作用,因此需要细化不同风险级别生成式人工智能的管理措施,明确分级的类别、依据和相应的规制方式。从而平衡不同风险级别生成式人工智能服务的利益,实现整个产业效益的最大化。
五、我国生成式人工智能服务的法律规制路径
对“生成式人工智能服务”进行明确的法律界定
根据欧盟人工智能法案第3条有关定义,人工智能服务是指“基于机器的系统,旨在以不同程度的自主权运行,并且可以针对明确或隐含的目标生成例如预测、建议或决策等输出,影响物理或虚拟的环境”。我国可以将该定义延伸至生成式人工智能服务领域,即将生成式人工智能服务界定为“基于机器的系统,通过分析海量数据和算法优化迭代,以不同程度的自主权运行,针对用户提示明确或隐含的目标生成例如预测、建议或决策等输出,影响物理或虚拟的环境”。充分阐明生成式人工智能服务涉及的要素,从而为后续规制生成式人工智能服务可能产生风险做好铺垫。
明确生成式人工智能服务应当遵守的原则
生成式人工智能服务的分级依据、类别和规制措施
结语
原标题:《吴大奎|基于生成式人工智能服务风险的分级法律规制研究》