ChatGPT全年更新大总结!重看「大模型风向标」进化之路

【新智元导读】2024年,OpenAI的ChatGPT在大模型领域不断突破,推出了多项创新功能,如个性化聊天机器人商店、增强记忆功能、多模态处理能力等,在安全性、稳定性和高效性方面也持续优化,一起回顾一下吧!

2024年,大模型已经深入融入了我们的日常生活。

而作为领跑者,ChatGPT也一直是大模型届的指南针,无论是去年发布的大模型o1-pro,SoraTurbo,还是各种小功能,比如视频模式、打断说话等,甚至是每月200美元的高额定价,OpenAI的每一场发布会都能给广大AI爱好者带来一些新震撼、新思路。

下面共同回顾一下OpenAI在2024年发布的关键更新,一起见证大模型的进化之路!

1月

GPT商店:用户可以发布构建的个性化聊天机器人(GPTs),按类别进行搜索,如写作、生活方式和教育等。

内联标记(Inlinetagging):用户可以在聊天框中输入「@」触发GPT提及功能,系统会显示可用的GPT模型列表,用户可以在一次对话中集成和与多个AI模型交互。

回复语音朗读(手机app):增添回复内容的语音朗读功能,提升用户获取信息的便捷性。

GPT自助申诉流程:用户可以自行提交申诉GPT使用中遇到的问题。

团队计划:ChatGPT插件的测试版本停止服务。

2月

记忆功能(sunshine)发布:可增强模型对过往对话的记忆,使交互更具连贯性,从而更好地理解用户的上下文和需求。

发布全新外观(Hedgehog)

作者验证:对GPT创建者的个人资料引入社交验证功能,提升创建者身份可信度和内容权威性。

Sora发布:能够根据简单的文本描述快速生成长达一分钟的高质量视频,更好地遵循用户的指令,生成的视频具有高度逼真的视觉效果,包含复杂的场景、多角色互动以及特定类型的运动。

深色与浅色模式:对界面的视觉效果进行优化,适配不同使用场景和用户偏好。

GPT版本历史:方便用户了解GPT的迭代情况,追溯功能变化。

3月

自定义指令(GPT-4):用户可以在系统层面为ChatGPT定制化一些指令,包括个人背景信息和回复格式要求。

DALL·E3controls(style&aspectratio),editor&inpainting:为用户提供了丰富的预定义风格选择;用户可以对指定区域用自然语言提示词进行微调,如增加画面元素、删除画面元素、修改特征等。

朗读(网页端):自动检测正在读取的文本的语言,然后以相应的语言进行朗读;提供五种不同的声音。

收益计划:根据GPTs的使用量,与开发者进行分成,为开发者提供了一种新的盈利途径,以激励创建更优质的GPT服务。

4月

无账号访问:更便捷体验ChatGPT,但只能使用GPT-3.5免费版,使用Dall-E3等高级功能仍需账号。

数据控制v2:用户可以在不影响查看聊天历史的情况下选择是否将自己的数据用于模型训练;新增了移动端语音数据选项,默认关闭。

域名统一迁移到了chatgpt.com,统一品牌和服务入口。

GPT-4Turbo发布:比GPT-4的生成速度快两倍,具有更大的上下文窗口,达到128k个token,价格只有1/3

5月

免费用户也可以选择默认的对话模型,比如切换GPT-4o-mini和GPT-4o,根据自身需求定制对话模型,提高效率和一致性。

Connectedapps:仅适用于ChatGPTplus、团队和企业用户,可以直接将GoogleDrive和MicrosoftOneDrive中的文件直接上传到ChatGPT,方便用户对云端存储中的文件进行分析和处理。

为macOS系统用户推出了桌面应用程序。

GPT-4o发布,具有多模态能力,能够同时处理文本、音频和视觉等多种模态的信息,在语音对话方面表现出色,自然流畅且能实时表达情感和理解语音背后的情绪,支持50种语言,并且在API上价格更便宜、性能提升2倍、速率限制提高5倍。

对ChatGPT的界面进行了重新设计,代号FruitJuice

用户可以使用不同的模型对同一个prompt重新生成回答。

不再为用户提供「Sky」语音选项,具体原因暂未公开。

用户可以根据对话的进展和需求,在同一次对话中切换模型,提高了对话的灵活性和效果。

免费用户可以使用一些之前仅限付费用户使用的工具和GPTs,如互联网访问、图像上传和分析、创建图表、高级数据分析、启用记忆功能、访问GPT商店等。

6月

苹果在2024年全球开发者大会(WWDC)上,宣布与OpenAI达成合作,将ChatGPT集成到Siri中;用户请求不会被OpenAI存储,用户的IP地址会被模糊处理,且用户可选择是否连接ChatGPT账号。

将此前面向ChatGPTplus用户推出的macOS桌面应用程序Sidekick,转为所有用户可用,可以在应用内进行截图并与GPT-4o讨论,辅助理解代码片段或解读复杂的图表等。

7月

GPT-4omini(Chive)发布,比GPT-4o的参数量更少,API支持128k、16k输入tokens长度,价格上比GPT-3.5Turbo便宜60%以上,也是OpenAI首个使用全新安全策略「指令层次结构」的AI模型,即要求系统优先执行预设命令,可以阻止恶意用户诱导模型执行非法操作。

GPT-4o和GPT-4omini发布后,GPT-3.5在多语言支持、响应速度和处理能力方面就显得很弱了,在7月19日正式退役。

ChatGPT的新界面(FruitJuice)对所有用户切换为默认。

8月

基于GPT-4o的视频和音频能力,Advancedvoice(gpt-4o-s2s)可以感知和回应用户情绪,提供更自然、实时的对话体验,用户可以随时打断。

免费用户每天可以使用DALLE3生成两张图片。

模型记忆的最大tokens长度增加到8k,在处理长文本和复杂对话时可以更好地保留上下文信息,避免因记忆限制而出现的回答不完整或遗忘前文的情况。

StarterPromptsv2:提供了更新和更丰富的起始提示语,更好地引导用户提出高质量的问题和请求。

ChatGPT宣布正在与GoogleDrive和Slack开发新的同步连接器,用户可以无缝访问文档内容,提高团队效率。

9月

OpenAI对ChatGPT的高级语音模式进行了更新,新增了视频和共享屏幕功能,能理解各种口音和语调并准确转化为文本,还支持实时翻译,方便国际用户沟通。

OpenAI发布o1-preview,专为处理高复杂度、需要深度推理的任务而设计,如法律分析、学术研究和复杂决策制定等场景;可以处理图像、音频等多种数据格式;开发者可以根据具体业务需求对模型进行高度定制,可适应电商产品推荐、教育培训课程设计等。

o1-mini更加经济,成本相比o1-preview降低约80%,适用于计算资源有限但需要结构化推理能力的环境,在基本的推理任务上表现出色,如数学和编程。

添加了两个快捷指令:「/picture」可以调用DALL-E模型生成图片;「/search」可以将用户输入转为搜索查询。

10月

为macOS和Windows桌面端推出高级语音功能,用户可以设置自定义指令来定制模型的语音风格、语速等。

基于GPT-4o推出画布功能(gpt-4o-canmore),用户可以绘图、创建思维导图、流程图等;为开发者提供一个可视化的代码结构工具,用户可以在画布上绘制软件架构或函数结构;能够直观地整理思路,拖拽文档结构,添加注释,为用户优化文本;用户可以通过头脑风暴,组织关键点,绘制幻灯片。

用户可以在聊天历史中进行快速搜索(FannyPack),如特定内容、问题、答案等。

11月

ChatGPT网页版的付费用户可以使用高级语音功能,能感知用户语音在语调和语速上的细微差别;可以设置自定义指令来定制模型的说话方式,比如以特定的节奏说话、发音清晰、慢速说话,定期加入用户的名字等。

Windows版的桌面应用程序(Sidetron)支持语音输入、截取屏幕、上传本地文件等。

ChatGPT桌面端在macoS系统上,支持在Xcode、VSCode、TextEdit等IDE和各种编辑器中调用ChatGPT获取代码解释和解决报错,以及与终端等应用程序的联动。

12月

在高级语音模式中增加了视频和屏幕共享功能,ChatGPT可以看到用户的操作和展示的内容,并做出更精准的回应,适用于在线会议、远程协作、在线教学等场景。

用户在画布中可以直接执行Python代码,为数据科学家和分析师等提供了更便捷的数据分析和处理环境。

OpenAI发布o1正式版,速度提升50%,出现重大错误的概率减少了50%;o1-pro需要ChatGPTPro才能使用,月费200美元,能够更深入地思考,提供更高质量的答案。

OpenAI展示o3模型,在ARC-AGI基准测试中取得75.7%的高分,展现出强大的推理、编码和数学解题能力,接近人类专家甚至在某些方面超越人类水平;o3-mini-preview相对更具成本效益,正式版o3-mini计划2025年1月底发布。

为了确保o3和o3-mini模型在发布前的安全性和可靠性,OpenAI采用了多层安全测试方法,将内部评估与外部研究计划相结合,招募安全研究人员参与测试,以便发现潜在的安全风险和漏洞并及时修复。

OpenAI发布SoraTurbo,支持文本、图像和视频输入,能生成分辨率高达1080p、时长最长20秒的视频,格式可选宽屏、竖屏或方形;支持5个创意工具,用户可以精确控制每一帧内容,为视频添加多个分镜头,替换、删除或重构视频中的元素,使用循环剪辑并创建无缝重复的视频等。

THE END
1.ChatGPT侧边栏(国内免费使用)如果你认为此加载项违反了Microsoft Store 内容策略,请使用此表单。 提供电子邮件地址 包括你的电子邮件地址,即表示你同意 Microsoft 可以就你的反馈向你发送电子邮件。Microsoft 隐私声明 输入你看到的字符。你也可以选择音频质询。 新|视觉 提交https://microsoftedge.microsoft.com/addons/report/dedljpdecfecpdeobfmcpkemkdhgjdng?c=86
2.MonicaChatGPT侧边栏助手chatgptsiderbar你的 GPT-4人工智能助手ChatGPTPlugin。作为你的副驾驶,Monica在侧边栏能够回答任何复杂的问题。还可以帮你写文章,AI画图,阅读文章,总结YouTube视频,联网搜索,增强Google与Newbing搜索引擎。在所有网站可用。 快速入门提示 1 只需按下Cmd+M或Ctrl+M即可开始与Monica GPT-3.5 和 GPT-4模型聊天。https://blog.csdn.net/elinkenshujuxian/article/details/131608164
3.ChatGPT侧边栏!浏览器插件「Sider」,让你无需打开网页即可使用2、登录后,Sider会有一个试用界面,Sider 侧边栏功能与Edge浏览器的侧边栏非常像,目前免费用户只能用GPT-3.5,且只有30次提问机会 会员价格与功能介绍 如果不想购买会员,可点击设置通过 OpenAI API key方式使用 3、通过侧边栏顶部,可使用Sider更多功能,如绘画大师、ChatPDF和整页聊天 https://www.gametop10.cn/2480.html
4.Sider:ChatGPT侧边栏,GPT4,联网,绘图1 强大的侧边栏 ? ChatGPT 翻译器 ? ChatGPT 词典 ? 语法检查 ? 自定义任何提示 2 快速查找窗口: ? 查找所选文本的最快方式 ? TTS 支持 ? 易于打开/关闭 3 增强搜索页面 ? 自定义搜索页面提示(市场上唯一的) https://www.fkxz.cn/dhoenijjpgpeimemopealfcbiecgceod/
5.ChatsNowAI助手:ChatGPT,Claude侧边栏(GPT4,眼睛)ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、Claude2、GPT - 3.5。使用GPT、Claude为你提供聊天、翻译、Vision、联网等智能化服务。 ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、Claude2、GPT - 3.5。使用GPT、Claude为你提供聊天、翻译、提问、自定义提示等智能https://www.chajianxw.com/product-tool/50063.html
6.Sider:ChatGPT侧边栏+GPTChatPDF 综合图像工具 群组人工智能聊天 支持o1 & o1-mini、GPT-4o mini、GPT-4o、Claude、Gemini 和 Llama 任何问题都能立即得到解决 一个问题,@所有bots同时回答 支持ChatGPT 4o Scott Gardner 易用性、实用性和灵活性都是A++。我尝试过几款最高评价的LLM AI扩展,Sider绝对是我目前最喜欢的。我喜欢可以通http://www.sider.ai/
7.我也想在vscode中写一个chatGPT插件学完这篇文章后,你也能开发一个chatGPT的vscode插件,做一个chatGPT 聊天框, 可以直接在vscode中安装我的插件CodeToolBox体验~ 实现的功能 在侧边栏添加插件图标,点击图标后打开一个插件视图,视图中有两个按钮 打开chatGPT 对话框:可以与chatGPT进行问答 https://www.pipipi.net/30071.html
8.4个免费插件,装上之后让你的ChatGPT,原地起飞,秒杀付费版GPT比如,你在搜索信息时,它会同步提供来自 ChatGPT数据库的建议。 打开侧边栏,可以跟上面的GPT3.5进行有限次的免费对话,用完次数之后,换个新账号登录即可。 不过里面的Bing和Bard,应该是可以免费无限次使用的。 OK,今天的分享就到这里了。 大家想要了解更多 ChatGPT+AI 玩法技巧、效率工具。 https://www.shangyexinzhi.com/article/11803718.html
9.GitHub增强侧边栏。 勾选了日新月异以后,侧边栏会出现标题、最新消息、日期、星期、对话模型等,帮助用户快速定位历史的优质的聊天项目。 LOGO对话模型 黑色气泡GPT3.5 模型 紫色气泡GPT4 模型 紫色气泡 + mGPT4 Mobile 模型 紫色气泡 + wGPT4 Web Browsing 模型 https://github.com/xcanwin/KeepChatGPT
10.2023ChatGPT人工智能新纪元.pdfChatGPT狂潮引发的产业颠覆与模式创新。同时,本书对未来的强人工 智能与人类社会的关系进行了深度研讨。 4 前言 从2022年末到了2023年初,ChatGPT火遍了全球互联网。 2022年11月30日,OpenAI发布AI对话模型ChatGPT。由于ChatGPT 的能力过于惊艳,上线仅5天就吸引了100万名用户。推出两个月后, ChatGPT的月活跃用户https://max.book118.com/html/2024/0112/5304213221011041.shtm
11.ChatGPTAGIX使用groovy语言或GPTs导入功能自定义Agent为你的AI助手扩展任何能力! 快来打造属于自己的AGI吧! 插件特点 本插件UI部分基于开源项目ChatGPT-Next-Web在此鸣谢所有的贡献者 云端模型:集成70+全球顶级大模型 持续更新中 OpenAI ChatGPT GPT-3.5、GPT-4.0系列模型、讯飞星火3.0(SparkDesk)、Alibaba 通义千问系列、Claudhttps://plugins.jetbrains.com/plugin/21852-chatgpt-agi-x-copilot-ollama-code-completions-ai-assistant
12.ChatGPT国内能用吗?初学者使用教程您无需成为技术天才即可使用有哪些稳定的国内GPT工具可用? 国内有很多种类的GPT工具,比如镜像网站、APP、浏览器插件等等。处于对稳定性的考虑,我建议大家使用APP或者浏览器插件。(在见证了很多镜像网站无法访问之后得出的结论) 介绍一个我用下来较为稳定,并且完全免费的GPT类浏览器插件:ChatsNow - OpenAI ChatGPT侧边栏 https://juejin.cn/post/7259633069460848700
13.ChatGPT页面截长图插件更新:GPTScreenShooterV3.0.0addListener((req, sender, resp) =>{constopt = req.opt;if(opt ===0) {// 隐藏侧边栏consthttps://www.52pojie.cn/thread-1814529-1-1.html
14.ChatGPTChatGPT是人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊https://baike.sogou.com/v214447881.htm
15.OpenAI启动ChatGPTProjects,让你可以组织文件分组聊天Projects将出现在ChatGPT侧边栏中。要创建一个新项目,请点击“加号”图标,然后,你可以为项目命名并自定义其颜色。 Projects的一个功能是通过自定义指令来定制其响应方式。例如,项目经理可以打开一个项目来构建一个网站,他们可以解释项目的内容以及网站的用途,并指示ChatGPT优先打开ChatGPT的Canvas进行编码。 https://www.51cto.com/article/804024.html
16.vscodechatgpt:一款超好用的开源ChatGPTVSCode插件今天给大家推荐一个开源的 VSCode 插件:vscode-chatgpt 。 这个开源插件可以将 OpenAI ChatGPT 集成到 VSCode。 功能特色如下: ?支持 GPT-4、GPT-3.5、GPT3 或 Codex 模型; 在侧边栏对话窗口中进行问答; 停止响应,减少 tokens 消耗; https://www.modb.pro/db/621784
17.GPT4使用经验总结现在访问 GPT-4 的唯一其他方法是升级到 ChatGPT Plus。要跳转到 20 美元的付费订阅,只需单击 ChatGPT 侧边栏中的“升级到 Plus”。输入信用卡信息后,您就可以在 GPT-4 和旧版本的 LLM 之间切换。您甚至可以仔细检查您是否收到 GPT-4 响应,因为它们使用黑色徽标而不是旧型号使用的绿色徽标。 https://www.jianshu.com/p/8caf36cc5a2f
18.扩展中心ChatGPT侧边栏(永久免费) 作者:360U3449257875 版本号:2.0.23 安装 ChatGPT侧边栏(永久免费国内直连),是一款基于的Op ChatGPT for 360 作者:360U3449257875 版本号:2.0.33 安装 ChatGPT侧边栏助手,协助您写文章,写代码,写脚本等。 自动剪切板 https://ext.chrome.360.cn/webstore/search/