2024年1月26日下午,由中国政法大学数据法治研究院主办的“生成式人工智能知识产权与法律治理”专题研讨会在北京国二招宾馆举行,来自全国各地的法律学者、技术专家、学术编审、实务代表等三十余人参加了会议。
会议由中国政法大学数据法治研究院张凌寒教授主持,研讨会分为“人工智能生成物的知识产权保护”“训练数据的利用与保护”两个单元进行。
第一单元
人工智能生成物的知识产权保护
目前生成式大语言模型可归纳为数据、算法、应用三个核心部分。首先,数据是指人类原始积累的文本,这是构建大模型的基石。其次,基于数据可以构建不同的训练大模型的算法。通过不断地将数据以算法训练的方式“喂”给大模型后,大模型就拥有了一定的语言能力。最后,大模型因为能够构建语言背后的语义,其可根据用户需求引申推断出接下来说的话。他还介绍了司法大模型的评价体系,其指出司法大模型能力可划分为记忆、理解、推理、判别、生成以及伦理六个方面,根据不同能力对司法任务进行划分,继而评价大模型在司法任务上的具体表现。
在主旨发言环节,华东政法大学王迁教授提出,人工智能生成内容是否为作品首先要明确什么是著作权法上的创作。《著作权法实施条例》第3条明确规定,著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。“直接产生”是人基于自由意志直接决定构成作品的表达性要素。人可以使用创作工具,但创作工具不会参与对表达性要素的决策过程。把生成式人工智能比喻为照相机是完全不能成立的。
关于思想与表达的区分,他指出,“智力投入”既可对应思想,也可对应表达,脱离“思想表达二分法”谈“智力投入”并无意义。同一个创作思想才能产生截然不同的许多表达。因此在不同人工智能系统中能导致不同内容生成的同一套提示词,相对于这些内容只能是思想。关于委托作品与人工智能生成内容的关系,他提出,根据接受创作要求者是否具有自由意志来判断提出创作要求的行为能否被认定为对作品的创作,是不符合法律逻辑的。
清华大学法学院程啸教授从民事主体的角度对人工智能生成物的知识产权保护问题进行探讨。他指出,我国民法确立了自然人、法人和非法人组织等三类民事主体。虽然立法者承认民事主体法律地位的理由各不相同。但是,共同的地方也是最根本的地方在于:这些民事主体,要么就是自然人,要么是自然人组成或控制的组织体。
人类还是在为自己立法,在调整和规范自己的行为。目前的人工智能技术依然受控于人,因此,还是属于现行民事主体开发或使用的产品或服务而已。因此,所谓承认人工智能创造的作品的知识产权,本质上依然是赋予既有的民事主体以著作权等民事权利,当然,基于不同的利益考虑,权利可能给人工智能产品的开发者,也可能给使用者(即用户),由此产生的侵权责任也相应地要由这些主体来承担。
在自由讨论环节,由清华大学法学院蒋舸副教授进行主持。她指出,关于人工智能生成内容的讨论逐渐聚焦,已经从第一阶段不区分机器贡献与人的贡献的泛泛而谈,进入到了聚焦人类用户贡献的第二阶段。各位专家学者就人工智能生成物的知识产权保护问题展开激烈讨论。
中国人民大学法学院张新宝教授指出,随着人工智能技术的不断发展,人工智能能够完成过去需要由人类亲自完成的事情,人工智能开发者或提供者应当享有权利。人工智能开发者或者提供者不是通过产生某种作品获得利益,而是通过固定的用户使用获得利益。就人工智能的民事主体地位而言,现阶段人工智能尚不具备民事主体地位。最后,著作权法上的独创性要求并不高,赋予人工智能生成内容以著作权不会对社会产生负面影响,至于其能否实现著作权带来的利益在所不论。
北京清律律师事务所首席合伙人熊定中律师提出,第一,应当保护权益和用著作权保护是两个概念,通过反不正当竞争法进行保护也是一个值得考虑的保护方向;第二,大量具有个性化的提示词的设计,确实凝集了人类智慧的创造性,但并不必然导致对于AI的输出拥有著作权;第三,给予用户著作权与先前案例相悖。此前对于更为复杂、更具创造性的动态视频画面,所有判例都不接受用户主张游戏画面著作权,而对于静态图片却给予用户著作权,与此前判例的裁判观点并不统一。
中国社会科学院大学法学院刘晓春副教授指出,著作权要保护的是智力投入,在人工智能生成内容场景下,用户输入指令能够体现智力上的个性化选择。用户输入指令与图片生成之间存在对应关系,只不过这种联系在不同创作过程中存在不同的密度,是否需要区分这种关联的紧密程度进行法律评价,有待进一步探讨。
清华大学计算机系助理教授艾清遥针对技术问题做出进一步回应。他指出,当人类无法判断与其交流的是人还是机器时,即通过了图灵测试。目前,人工智能技术在部分任务上已经通过图灵测试,虽然还没有完全实现通用人工智能,但也意味着人工智能技术的发展已经进入了新的阶段。他还提出,文生图的原理和大语言模型在模型形式和算法构造原理存在一些差异,但是在构建的方式上基本是类似的。
清华大学法学院教授崔国斌提出,人工智能系统的用户如果只是在单一回合输入文本指令,通常不能够对人工智能系统生成的图片本身主张权利,因为用户的贡献在于输入的一段复杂的文本指令,但人工智能可能基于用户输入文本指令呈现出无数种可能的图片。除非通过文本指令把画面构图或表达要素描述得特别清晰,使所有读者脑海里有清晰的画面感,此时文本指令的输入才意味着用户对画面构图或者构思构成创作意义上的贡献,使人工智能生成物产生著作权。
第二单元
训练数据的利用与保护
北京大学法学院张平教授认为,人工智能生成著作权的问题是一体两面,一是生成后的著作权的问题,一是训练过程中著作权的问题。张教授围绕生成式人工智能著作权合法性的解决方案提出观点。如果开发者共同承担责任,本着权利和义务对等原则开发者也应该享有生成物的权利。在解决方案上,人工智能的著作权问题的挑战在于思想与表达的二分。另一挑战是署名权和著作权的分离。署名不意味着给它人格、给它法律主体地位,署名应该是一种标识,是一种出处,是一种客观表达,防止人类去剽窃机器的成果。因此应该整体反思知识产权制度在数字经济时代的一个变革。
在自由讨论环节,由中国政法大学张凌寒教授主持。熊定中律师首先提出,大模型的训练是不是直接指向替代性的输出,是判断是否侵权的关键。在没有侵害性的情况下,生成物不在原权利范围之内。若产生替代性,则可以通过增量学习或模型修正的方法把涉及侵权信息的内容通过新一轮训练解决掉。
抖音集团互联网法律研究中心主任丁道勤对域外国家立法保护思路和司法案例进行了介绍分析,认为从价值论和解释论角度,生成式人工智能训练语料著作权采取合理使用,而不是法定许可和自由谈判,符合我国人工智能产业发展实践的现实需求。
结束语
生成式人工智能技术是一项具有革命性的创新技术,对于人类社会的发展和社会的进步具有巨大的潜力和价值,但同时也带来了许多新的问题和挑战,需要不断探索和完善相应的治理机制。希望本次会议能够为我国在该领域的法律研究和实践提供一个良好的平台和契机,促进各方的交流和合作,共同推动我国生成式人工智能的健康和可持续发展。