OpenAI刚刚融资,就迫不及待开始证明自己了。
今日凌晨,OpenAI宣布推出类似Anthropic的Artifacts的应用canvas,并称「这是一种使用ChatGPT写作和编程的新方式」。
在Claude中试过Artifacts的朋友都知道,这能极大提升LLM输出结果的表现力,其支持输出文本文件、代码、网页、SVG等等。此前风靡一时的「汉语新解」便是基于Claude的Artifacts功能。但让ChatGPT用户感到遗憾的是,Artifacts上线三个多月了,OpenAI一直没有跟进,以至于一些开发者自行开发发布了自己的开源版本。
现在,用户的呼声终于获得了响应,于是纷纷点赞。也有人开玩笑地表示OpenAI这是打不过Claude便加入。
在canvas这个界面,你可以与ChatGPT一起完成写作和编码项目,而不再局限于简单的聊天。canvas是一种新的交互方式,也是OpenAI推出ChatGPT以来的首个重大视觉界面更新。
canvas会在单独的窗口中打开,方便用户与ChatGPT一起协作完成项目。canvas的Beta版本为用户提供了一种全新的合作方式:你不仅能够通过对话进行创作,还能与ChatGPT成为并肩作战的伙伴,一起创造和完善。
canvas由GPT-4o支持,在Beta期间可以在模型选择器中手动选择。不过,现在Beta版本只提供给ChatGPTPlus与团队用户。企业和教育用户将在下周获得访问权限。ChatGPT免费用户需要等到canvas正式发布后才能使用。
我们先一睹canvas有哪些惊艳之处。
与ChatGPT更好地协作
和ChatGPT聊天对于我们来说已经是十分简便的信息获取方式,这也包括写作与编码。不过当你想要及时对写作内容或者编码内容进行修改时,对话方式可能就显得力不从心了。
canvas的出现就是为了解决这个难题。
此外,你的调整方式也十分便捷,直接编辑代码或文本都不成问题。你的项目,你做主。canvas还提供了快捷菜单,可以让ChatGPT帮你调整文本长度、调试代码,或者快速执行其他实用操作。如果想要之前的版本,一键返回即可恢复。
当ChatGPT发现某个场景中canvas能帮上忙时,它会自动打开。你也可以在提示中直接加一句「使用canvas」,这样ChatGPT就会切换到canvas界面,帮助你更方便地处理现有项目。
,时长
00:51
canvas的编程能力
代码是一个迭代过程,但是在聊天之中,很难跟踪代码的改进过程。canvas让我们可以更轻松地跟踪和理解ChatGPT的修改过程,OpenAI也承诺「计划继续提升这类编辑过程的透明度」。
canvas目前提供了以下编程快捷操作:
将模型训练为协作伙伴
OpenAI的研究团队对GPT-4o进行了训练,以使其能够作为创意合作伙伴进行协作。该模型知道何时打开canvas,何时进行目标性编辑,以及何时需要完全重写。同时,它还能够理解更广泛的上下文,从而提供精准的反馈和建议。
为了支持这一点,研究团队开发了以下核心行为:
OpenAI通过20多项自动化内部评估来衡量进展,并使用了新颖的合成数据生成技术,例如从OpenAI的o1-preview中提取输出,来对模型进行核心行为的后训练。这种方法能够快速应对写作质量和新的用户交互需求,从而无需依赖人工生成的数据。
在写作任务中,他们优先改进了「正确触发」的情况(以牺牲「正确不触发」为代价),达到了83%,相较于作为基线的零样本提示词式GPT-4o有了显著提升。
值得注意的是,此类基线的质量对特定提示词非常敏感。不同的提示词可能导致基线在表现不佳的同时,呈现不同的错误分布。
例如,在编码和写作任务中会出现「均匀地不准确」情况,导致不同类型的错误分布和表现不佳的形式。在编码方面,OpenAI有意让模型在触发方面偏向保守,以避免干扰高级用户的体验。之后,OpenAI也是承诺将继续根据用户反馈对其进行优化。
针对写作和编码任务,OpenAI改进了准确触发canvas决策边界的能力,分别达到了83%和94%,相较于作为基线的零样本提示词式GPT-4o有明显提升。
第二个挑战在于对模型在触发canvas后的编辑行为进行调优,特别是决定何时进行目标性编辑,何时重写整个内容。
OpenAI训练模型在用户通过界面明确选择文本时进行目标性编辑,否则就更倾向于重写内容。随着模型的不断完善,canvas的编辑行为也在持续演变。
针对写作和编码任务,OpenAI优先优化了canvas的目标编辑功能。带有canvas的GPT-4o在性能上比基线的提示词式GPT-4o高出18%。
这表明合成训练显著提升了相较于带有详细指令说明的零样本提示词下的响应质量和行为表现。
canvas目前仍处于早期测试阶段,OpenAI后续计划快速提升其功能。
至于它和Artifacts究竟谁更能赢得用户亲睐,就让我们拭目以待吧,相信刚拿了一大笔投资的OpenAI也应该不会让用户失望。