OpenAI已经发布新的工具,使用户能够更好地管理自己的信息。
过去6个月里,随着OpenAI的生成式文本聊天机器人日渐风靡,该系统使用从网络上提取的数据进行训练的风险也变得愈发明显。
作为对审查的回应——尤其是来自意大利数据监管机构的审查,在OpenAI对其服务做出改变后,意大利数据监管机构现在允许ChatGPT重新进入该国——OpenAI公司已经引入了新的工具和流程,允许用户对至少部分数据拥有更多的控制权。下面是操作方法。
ChatGPT和GPT-4通过统计方法生成类似人类的答案——在看到数百万个人类作者写的句子示例后,预测哪些单词可能会跟随其他单词。OpenAI一直对其训练大型语言模型所使用的数据保密,因此公司外部没有人确切知道它在这个过程中收集了多少网络数据(包括人们的个人信息)。
OpenAI现在推出了个人数据删除请求表(PersonalDataRemovalRequest),允许人们(主要是欧洲人,也有日本人)要求从OpenAI系统中删除有关他们的信息。
值得注意的是,该表单主要用于请求从ChatGPT提供给用户的答案中删除信息,而不是从其训练数据中删除信息。它要求你提供你的名字;电子邮件;你所在的国家;你是为自己申请还是代表他人申请(例如律师代表客户提出请求);以及你是否是个公众人物,比如名人。
数字权利非营利组织AccessNow的高级政策分析师DanielLeufer表示,“OpenAI最近几周所做的改变是可以接受的,但在数据保护方面,它只是在处理最为表面的问题,并未采取任何措施来解决更复杂、更系统的问题,即如何使用人们的数据来训练这些模型。我希望这个问题不会就此消失,特别是在ChatGPT上创建了EDPB工作组之后。”
OpenAI的帮助中心页面还写道,“个人也可能有权访问、更正、限制、删除或转移可能包含在我们的训练信息中的个人信息。”为此,它建议给其数据保护人员发送电子邮件至dsar@openai.com。已经要求OpenAI提供数据的人对其回应并不满意。意大利数据监管机构表示,OpenAI声称目前“在技术上不可能”纠正不准确的信息。
你应该始终对告知ChatGPT的内容保持谨慎,特别是考虑到OpenAI有限的数据删除选项。默认情况下,你与ChatGPT的对话可以被OpenAI用作在未来的大型语言模型中训练数据。这意味着,至少在理论上,这些信息可以被复制,以回答人们未来的问题。4月25日,该公司推出了一个新的设置,允许任何人(无论他们在世界上的哪个地方)停止这个过程。
因此,你在ChatGPT中输入的任何信息,例如关于你自己、你的生活和你的工作的信息,都不应该在OpenAI的大型语言模型的未来迭代中重新出现。OpenAI表示,当聊天记录被关闭时,它将继续保留所有对话30天“以监控滥用”,之后它们将被永久删除。
当你的数据历史记录被关闭时,ChatGPT通过在侧边栏中放置一个按钮来提示你重新打开它,该按钮为你提供了再次启用聊天历史记录的选项。不得不说,这一操作与隐藏在设置菜单中的“关闭”设置形成鲜明对比。