目前,大多数人使用的ChatGPT免费预览版运行在OpenAI的GPT-3.5模型上。这种模型见证了聊天机器人变得非常受欢迎,尽管存在一些明显的缺陷。OpenAI在其网站上宣布了GPT-4,并表示GPT-4将首先提供给使用ChatGPTAPI的ChatGPTPlus订阅者和开发者。以下是有关GPT-4以及已发布的所有新功能的所有信息。
GPT代表生成式预训练变压器。该神经网络使用机器学习来解释数据并生成响应,它是流行的聊天机器人ChatGPT背后最显着的语言模型。GPT-4是该模型的最新版本,是为免费版ChatGPT提供支持的GPT-3.5模型的升级版。
GPT-3具有超过1750亿个参数,供人工智能在响应提示时考虑,并且仍然可以在几秒钟内给出答案。人们普遍预计GPT-4将增加这个数字,从而产生更准确、更有针对性的响应。事实上,OpenAI已确认GPT-4可以处理多达25,000个单词的文本输入和输出,是ChatGPT使用GPT-3.5可以处理的3,000个单词的8倍多。
另一个主要区别是GPT-4为GPT模型带来了多模式功能。这使得GPT-4不仅可以处理文本输入,还可以处理图像,尽管目前它仍然只能以文本形式响应。微软在最近的一次AI活动中表示,正是这一功能最终可以让GPT-4处理输入到AI聊天机器人模型中的视频输入。
微软已经明确表达了创建多模式人工智能的雄心。除了在MicrosoftAzure超级计算机上训练的GPT-4之外,微软还一直在开发VisualChatGPT工具,该工具允许用户在ChatGPT中上传、编辑和生成图像。
微软还需要这种多模式功能来跟上市场竞争的步伐。Meta和Google的AI系统都已经具备此功能(尽管尚未向公众开放)。GPT-4利用其多模态功能在统一律师考试中获得了第90个百分点,在生物奥林匹克竞赛中获得了第99个百分点。这两项都是ChatGPT的重大改进,ChatGPT在律师资格考试中排名第10位,在生物奥林匹克竞赛中排名第31位。
在GPT-4开发者直播中,OpenAI总裁兼联合创始人GregBrockman展示了更新后的语言模型的一些新功能,包括多模态功能,为图像甚至网站创建提供上下文。
在演示的这一部分中,Brockman将图像上传到Discord,GPT-4机器人能够提供其准确的描述。不过,他还要求聊天机器人解释为什么松鼠拿着相机的图像很有趣,机器人回答说:“这是一个幽默的情况,因为松鼠通常吃坚果,我们不希望它们使用相机或像人类一样行事“。
如果这已经足够了,那么布罗克曼的下一个演示将更加令人印象深刻。在其中,他在笔记本上拍了一张手写代码的照片,将其上传到GPT-4,然后ChatGPT就能够根据图像的内容创建一个简单的网站。
一旦GPT-4开始在现实世界中接受开发人员的测试,我们可能会看到最新版本的语言模型被推向极限并用于更具创造性的任务。