ChatGPT更像人了澎湃号·湃客澎湃新闻

ChatGPT又双叒叕更新了,这一次,OpenAI没有大谈数字和术语,而是回归到了“聊天机器人”本身。

发布会的核心,是最新多模态大模型GPT-4o。和之前发布新模型必强调训练数据量、各项测试成绩等“硬核指标”不同,GPT-4o的升级主要在使用体验上。

相较上一代GPT-Turbo,GPT-4o可谓是打通了任督二脉,各项技能融会贯通,和人的互动更灵活、更快速——换言之,更像“人”了。

用户可以以文本、音频、图像任意组合输入,得到ChatGPT实时文本、音频、图像的任意组合输出。在交流过程中,ChatGPT不再等待若干秒才响应,而是实时回复,还能被随时打断。OpenAI的CEO山姆·奥特曼(SamAltman)将之称为“人类级别的响应”。

OpenAI现场展示了和ChatGPT的若干互动,包括:实时对话交互、语音多样化(应用户需求使用不同情绪、语调等)、视频指导做题、视频识别环境和人(包括人的情绪)、以桌面应用形式辅助编程、实时翻译。

OpenAI同时还放出了预先录制的展示样例若干,包括:两个GPT-4o交流和对唱、唱摇篮曲、在线会议应用、毒舌讽刺、视频识物并给出西班牙语单词、帮助面试准备、和狗互动等。

OpenAI本次现场演示选择的声音是“Sky”,听起来酷似好莱坞明星(寡姐)斯嘉丽·约翰逊。让人很容易联想到科幻电影《她(Her)》,其中AI助手正是由斯嘉丽配音。电影中男主角从使用AI助手,一步步走向一段无果的人机恋情。

奥特曼自己也在X上发了这部电影的名字:her。还有人干脆把电影海报里的脸换成了奥特曼的。

当GPT-4o驱动的ChatGPT用饱含情绪的声音和人聊天,还能看、能听、能说会唱,你就知道,科幻已经照进现实了。

更关键的是,穆拉蒂现场宣布,GPT-4o免费向所有人开放。也就是说,随着后续更新,免费用户也可以直接使用GPT-4o,只不过每日限制条数比付费用户少,达到限制后会自动切换回GPT-3.5。

以及,ChatGPT的桌面应用将上线苹果电脑系统MacOS,Windows版本将在今年晚些时候推出。

如果用四个字总结GPT-4o的特点,就是:更通人性。

而这体现在两方面,一方面是GPT-4o多模态融会贯通,反应速度也大大提高,交互方式更接近于人;另一方面,是GPT-4o驱动下的机器人明显更活泼,更乐于表现出人类情绪。

先说GPT-4o的多模态能力,准确来说,GPT-4o最亮眼的是跨模态的能力。

一年多以前,2023年3月,OpenAI发布了多模态模型GPT-4。从那时起,人们就可以给GPT-4发图片让它帮忙分析,也可以发文件、语音聊天。但是文本、图像、语音之间是有“壁”的。

比如你想让ChatGPT帮忙解一道数学题,就只能截图或者复制题目,发给ChatGPT。如果想听ChatGPT语音讲解,得先在文本框发完之后,再切到语音。

但在GPT-4o下,你可以直接使用桌面应用,将ChatGPT打开放在一边,和它聊着天的同时,用“拍摄”功能给它看你电脑桌面的内容,它就可以在对话中为你答疑解惑。

在一则演示中,用户将ChatGPT桌面应用和做题界面同时打开。ChatGPT不直接给出答案,而是以问题引导的方式,有问有答地一步步带用户解了一道几何题。

或者,你也可以打开摄像头,ChatGPT也可以“看”着纸面指导解题。

在所有的演示当中,最让人直呼“恐怖”的还是视频对话:用户打开摄像头,让ChatGPT“看”到当下,并进行互动。

用前置镜头自拍,ChatGPT不仅能识别用户的情绪,如“看起来很开心,甚至可以说是兴奋的”,还能从用户背后的画面判断其身处的环境,如“看起来你在一个摄影棚中,背后有一些灯光,你的胸前还别着麦克风,可能在录制视频之类的”。当有另一个人进入镜头并且做鬼脸的时候,ChatGPT也准确指出了这一“不太寻常”的情况,并加以描述。

用后置镜头,ChatGPT就可以和用户共享视角。如在语言学习的过程中,打开摄像头让ChatGPT用某种语言说出物品的名称。或者可以为视障用户提供指引,告诉用户“有一辆计程车来了,就是现在,招手吧”。

再加上用户话音刚落ChatGPT就接话,以及用户可以直接打断ChatGPT,它也都能接着聊,这就使得整体体验更像人与人的对话,快速且灵活。

顺带一提,由于GPT-4o的响应速度快、可打断,其实时翻译效果非常惊艳。两个语言不通的人将GPT-4o驱动的ChatGPT放在中间充当翻译,就可以聊天了。

总而言之,GPT-4o驱动下的ChatGPT,不再仅仅是一个什么都会的应用,而是真正进化成了一个“AI助手”。

再说情绪,这一点不容小觑。

但GPT-4o驱动下的ChatGPT明显不同了。在没有预先指令的情况下,ChatGPT不再刻意避免像人类,而是相反。

比如,当用户求助ChatGPT,说自己马上要参加OpenAI的面试,ChatGPT接过话开玩笑地说:“OpenAI,嗯?怎么听起来这么耳熟嘞?”紧接着窃笑,转而笑着亢奋地接着说:“开玩笑的!太棒了洛基(演示人员的名字)!什么样的面试?”

当洛基寻求外形上的建议时,ChatGPT用幽默的方式表示头发需要整理,说他“看起来有写了一整夜代码的氛围”。洛基戴上了一顶遮阳帽,ChatGPT立刻“哈哈哈”地大笑,说他“肯定会很显眼”,但在面试中不合适,像朋友一样劝他放弃这样做。

也就是说,GPT-4o驱动下的ChatGPT,不再是一个只追求性能的AI工具,而是开始主动提供“情绪价值”。

在ChatGPT走严肃路线的两年里,不少竞品都以更活泼、更“通人性”的姿态出现,并俘获了不少用户的心。

就连上一波AI聊天机器人热潮也深谙此道。2011年苹果将Siri集成到iPhone4S中,AI聊天机器人成赛博玩具,人们热衷于“调戏Siri”,让它唱歌、讲笑话。Siri虽不算神通广大,但提供了足够多的乐趣。中国用户熟悉的天猫精灵、小爱同学等,也无不有一个俏皮的“人设”。

但后来的故事我们都知道了,上一代AI助手因其技术限制,能做的实在有限,“俏皮”来自有限的预先设置,还因为理解能力不佳、不够灵活,渐渐被用户钉上“人工智障”的耻辱柱。

在2024年,人们曾经对Siri们抱有的期待——一个既能当得力助手帮忙做事,又能当赛博玩具聊天嬉笑的AI——终于在GPT-4o身上有了着落。

去年5月,比尔·盖茨(BillGates)曾在AIForward2023活动上谈及AI,对AI的前景很看好:“你永远不会去搜索网站了,也不会再去亚马逊了。”

而能干掉搜索和电商的,在盖茨眼中不是别的,正是未来顶级的AI助理:“无论谁赢得了AI助理的竞赛,这都是一件大事。”

面向C端用户,AI助理的战事已经打响。

微软已经将Copilot带进Windows11,依托以侧边栏工具的形式辅助用户;谷歌在内部整合了谷歌大脑和DeepMind之后发布拳头模型Gemini,未来有望更加深入地嵌入各个产品和应用,如Android安卓、谷歌搜索和Workspace;亚马逊则在去年9月发布新款Alexa,接入大模型。

今年3月之后,接连有几个消息传出。先是彭博社援引知情人士透露,苹果正在就将谷歌Gemini大模型内置于iPhone进行谈判,同期也在与OpenAI进行类似谈判。而后是苹果CEO蒂姆·库克(TimCook)访华之后,《科创板日报》报道苹果将与百度进行技术合作,在今年即将发布的iPhone16、Mac系统和iOS18提供AIGC功能。

用GPT-4o,OpenAI再次给世界亿点点震撼,接下来的AI助手竞争只会更加精彩。

THE END
1.Sider:ChatGPT侧边栏当你已经有 ChatGPT 账号时,为什么还要用 Sider? 把 Sider 想象成你 ChatGPT 账号的好搭档。Sider 并不是与 ChatGPT 竞争,反而以各种酷炫的方式增强了你的 ChatGPT 体验。下面是详细信息: 1并排使用:通过 Sider 的 ChatGPT 侧边栏,你可以在任何标签页上调出 ChatGPT,无https://microsoftedge.microsoft.com/addons/detail/sider-chatgpt%E4%BE%A7%E8%BE%B9%E6%A0%8F-vision/dhoenijjpgpeimemopealfcbiecgceod?eqid=87e53e130001ab1400000006646df06c
2.安卓侧边栏软件哪个好?手机侧通知栏软件手机侧边任务栏app小编今天就为大家整理了一些非常好用的安卓手机侧边栏软件,包括有手机悬浮侧边栏app、Ivy侧边栏、侧边栏专业版、sidebar plus4.0修改版、circlesidebar汉化版、sao launcher4.0专业版、sao utils安卓版、三星曲面侧屏apk、魅族悬浮球3.3.6修改版、omni侧边栏汉化、任务栏taskbar汉化版等,喜爱的朋友赶快到绿色资源网下载http://www.downcc.com/k/cebianlan/
3.copilotoutlookteams侧边栏微软知名企业聊天功能科技媒体 NeoWin 报道称,微软将于2025年2月正式上线部署 Copilot Chat for Outlook 和 Copilot Chat for Teams,为用户提供全新的智能聊天体验。根据微软更新的 Microsoft 365 路线图,相关部署将分阶段进行。 具体来说,2025年1月下旬起,Teams 和 Outlook 应用将安装 Microsoft Copilot,并默认固定在左侧侧边栏,预计https://m.163.com/dy/article/JMLO0U1U0511D2LM.html
4.免费ChatGPT浏览器脚本,支持切换key电脑DIY圈插件介绍 免费ChatGPT浏览器脚本,支持切换key Google、必应、百度、Yandex、360搜索、谷歌镜像、Fsou侧边栏Chat搜索,即刻体验AI,无需翻墙,无需注册,无需等待! 注意 接口来源第三方,本插件完全免费,请勿点击链接购买,被骗后果自负!! 注意事项 !!注意:如果你在3https://www.10zv.com/archives/13113
5.chatgptapi文件chatpic文件夹在哪chatgpt api 文件 chatpic文件夹在哪 1.减少QQ占用内存资源的秘笈 登陆QQ后,占用内存:约8M QQ离线,占用内存:约10M 秘笈:登陆QQ后,随便打开一个好友的对话窗口,把它最小化,QQ占用的内存就变为3M了,这对于内存小的朋友特别有用!! 2.QQ自定义头像上传成功率较高的方法https://blog.51cto.com/u_16213596/11851535
6.类似于CHATGPT的国内免费软件有哪些与CHATGPT差不多就在近日国外爆火了一款名为CHATGPTai智能聊天机器人软件,她因为其强大的功能而深受广大用户的喜爱,那么我们有没有类似类似于CHATGPT的国内免费软件呢?答案当然是有的,下面小编就为你盘点一下与CHATGPT差不多的人工智能软件,比如文心一言ai智能软件、通义千问app、notion ai、秘塔写作猫app、new bing、火山写作、https://www.ddooo.com/zt/chatGPT.htm
7.2023ChatGPT人工智能新纪元.pdf内容提供方:数字能源 大小:1.01 MB 字数:约14.16万字 发布时间:2024-01-14发布于湖南 浏览人气:86 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)2023ChatGPT人工智能新纪元.pdf 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 ChatGPT人工智能新纪元 https://m.book118.com/html/2024/0112/5304213221011041.shtm
8.上网必备!这些网站绝对是互联网宝藏!带你进入全新的在线世界chat.openai.com/是OpenAI提供的在线聊天界面,使用了类似于我这个ChatGPT的语言模型进行交互。该网站提供了一种与AI模型进行实时对话的方式,用户可以输入文本消息与AI模型进行交流,并获取AI生成的回复。 7.2cognosys.ai cognosys.ai(app.cognosys.ai/) 是一个基于Web的人工智能平台,可以帮助您创建和部署各种类型的应https://juejin.cn/post/7252911555524345914
9.除了ChatGPT,还有哪些国内可用的强悍AI工具?chatsnow2023年,GPT带动着整个AI行业大卷特卷,市面上出现了越来越多能将AI功能发挥到极致的强悍工具,今天就给各位推荐5款用了后悔不早用的AI软件或工具。 第一款 ChatsNow -OpenAIChatGPT侧边栏 Edge安装|Chrome安装 由于ChatGPT给出的答属于AI工具中的天花板,所以个人认为调用GPT的api接口,并在此基础上开发出了更多针对https://blog.csdn.net/crushiy09/article/details/131686065
10.ChatsNowAI助手:ChatGPT,Claude侧边栏(GPT4,眼睛)ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、Claude2、GPT - 3.5。使用GPT、Claude为你提供聊天、翻译、Vision、联网等智能化服务。 ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、Claude2、GPT - 3.5。使用GPT、Claude为你提供聊天、翻译、提问、自定义提示等智能https://www.chajianxw.com/product-tool/50063.html
11.《财富》杂志:全球爆红的ChatGPT是如何诞生的?ChatGPT经常会杜撰信息,这种现象被人工智能研究人员称为“幻觉”。它无法可靠地引用其信息来源,或简单地提供链接。现有版本无法访问互联网,因此无法提供最新信息。马库斯等人认为,幻觉和偏见是大语言模型存在的根本问题,需要彻底重新思考它们的设计。他表示:“这些系统可以预测句子中单词的顺序,类似于开发工具Steroids上的https://mba.ncu.edu.cn/zndt/qygc/955fc954255549fa9ac004ee41a03dda.htm
12.电脑端怎么安装chatgpt可以在产品官方网站或者其他可信的软件下载网站找到适用于电脑端的chatGPT安装包。2. 确保你的电脑系统http://chatgpt.cmpy.cn/ask/1081513.html
13.如何将文档上传到ChatGPT微软在 Edge 浏览器上添加了由 ChatGPT 支持的 Bing 侧边栏,使其在很长一段时间后得到了急需的刷新。这解锁了许多 Edge 浏览器功能,包括直接在浏览器中扫描任何文档的能力。 您无需单独将文件上传到任何网站。您只需在 Edge 浏览器中打开该文件,它就会自动处理它。让我们看一下具体是如何做到的。 https://m.10100.com/article/23553
14.对标Edge,Opera浏览器推出集成ChatGPT的AI侧边栏IT之家5 月 24 日消息,Opera 浏览器今日宣布,正在测试名为 Aria 的 AI 侧边栏功能。该功能由 OpenAI 的 ChatGPT 驱动,可以生成文本、写代码、回答问题等等。Opera 称,这是浏览器领域的一项创新,将为用户提供更智能、更便捷的网络体验。 据Opera 官方网站介绍,Aria 位于浏览器左侧的边栏中,用户点击图标后就可以https://www.ithome.com/0/695/004.htm
15.玩转AI2分钟学会使用ChatGPT聊天机器人!CrushiYAI助手 - OpenAI ChatGPT侧边栏三大功能 个人推荐使用AI聊天功能,因为它内置20多种包含了写作、营销、代码等常用的模板,还支持联系上下文为用户提供更进阶的回答。它自动为用户保存最近50条聊天记录,用户可以随时选择其中一个并继续接着上文聊天。 它提供了一种非常便捷的方式来交互式地完成各种任务,即在浏览器侧边栏https://www.cnblogs.com/crushiy09/p/best-ai-assistant-chatgpt-sider.html
16.2023年8个ChatGPT的替代品其实还有许多其他的机器人在本文中,我将整理8 个 ChatGPT 替代方案。 Neuroflash 那么Neuroflash 就主要服务于德语内容生成器。Neuroflash 基于 GPT-3.5 构建的聊天助手是 ChatGPT 的绝佳替代品。与 ChatGPT 和其他类似工具不同,Neuroflash 不需要单独的用户界面——它可以在常规文本编辑器中轻松访问,与 ChatGPT https://www.yuucn.com/a/1550843.html