GPT开启了大模型的多模态应用,微软说让工具回归工具,Midjourney解决了AI作画的手指问题,学术界与开源势力也不甘落后,中国互联网公司总算有了第一个大模型产品......
我们从没有像今天这样,好奇两个月后的世界会变得如何。
但我们首先要做的,是记住这不寻常的一周。
周一
暴风雨前的平静。
周二
低成本:斯坦福大学发布Alpaca7B
成本降到超低,性能匹敌GPT-3.5
这意味着人们可以以更低的成本获得与GPT-3.5相当的性能。
低门槛:清华发布ChatGLM-6B
消费级显卡就能部署,准确度接近GPT-3175B(davinci)
下面是ChatGLM的自我介绍:
由清华技术成果转化的公司智谱AI开源了GLM系列模型的新成员——中英双语对话模型ChatGLM-6B,支持在单张消费级显卡上进行推理使用。虽然依然会有和ChatGPT一样的事实错误、胡说八道的问题,但作为开源模型,ChatGLM-6B可以在消费级显卡上部署使用。
周三
OpenAI:GPT-4来了!
人类历史上最慌的一天
一个可能不太恰当的类比,在拥有了多模态能力后,GPT-4的发布可能就是大模型产业的iPhone4时刻。
能够与人类正常对话,又能够看懂图片,输出和推理能力更强大,你应该担心的不是会不会被取代,而是如何更快学会使用它。
高素质:Anthropic发布Claude
在适当的时候,学会沉默
由前OpenAI研究副总裁DarioAmodei创立,谷歌投资的人工智能公司Anthropic宣布聊天机器人Claude开放公测。它具有ChatGPT的对话推理能力,同时又可以像NewBing一样调整AI的语气、个性和行为。
Anthropic声称Claude不太容易产生有害的输出,因为它使用的是“以人为本”的语言建模方法,并根据语言的“深层结构”来构建模型。当被问及超出其知识领域的话题时,Claude会推迟回答,降低产生虚假信息的风险。
Google:PaLMAPI开放以及更多
AI届汪峰:明明周三是我先来的
谷歌在3月14日晚间开放了其大语言模型API——PaLMAPI。开发人员可以通过API访问谷歌的基础模型,并可以使用开箱即用的模板,在几分钟或几小时内启动生成式应用程序的创建。谷歌还推出了MakerSuite工具和GenerativeAIAppBuilder平台等人工智能企业工具。
PaLMAPI的另一应用场景是Gmail和GoogleDocs。用户只需键入您想要写的主题,即可立即生成草稿。MakerSuite工具是简化开发人员在模型流程制作、迭代等领域的工具。MakerSuite可以简化此工作流程,让用户将能够根据prompt进行迭代,使用合成数据扩充数据集,并轻松调整自定义模型。当你准备好编程时,MakerSuite允许将prompt导出为你最喜欢的语言和框架(如Python和Node.js)的代码。
周四
训练速度:Pytorch2.0正式版发布
一行代码,训练模型2倍速!
图像生成:MidjourneyV5发布
AI画不好手指?那是上上周的事。
这是最新发布的MidjourneyV5生成的作品。大概用到的提示词是:一位在越南街头市场卖河粉的妇女的街头风格照片,日落,使用fujifilm--ar16:9--v5拍摄。
注意看,一直被诟病的“AI不会画手指”的问题,被解决了。
不是每个人都能成为摄影家,但未来每个人都能利用AI生成这样一张高质量的图片。
大规模应用:Microsoft365Copilot
48岁的巨头靠AI再次走上巅峰!
微软王炸发布Microsoft365Copilot,一夜之间在中外互联网上刷屏。
Copilot应用了最新的GPT-4技术,能够帮助用户在Word、Excel、PowerPoint、Outlook和Teams等软件中进行写作、编辑、总结、创作、演示文稿等工作。
Copilot在Microsoft365界面中和其他应用程序并排出现在侧边栏,用户可以通过聊天对话,让Copilot帮助进行工作生产。微软计划将这些产品接入GPT-4,以提高人工智能软件的开发速度和质量。微软正在与20位客户一起测试Microsoft365Copilot,并将在未来几个月内扩展预览版。此外,微软正在开发在客户数据上训练这些模型,而不会泄露给其他客户或落入不良行为者手中。
“Word,你是个成熟的软件了,该学会自己码字了。”
微软:“在做...不对,做好了。”
中文大模型:百度发布文心一言
没见过这么紧张的Robin
在文心一言发布会上,百度董事长李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。
在股价和梗图之外,有个事实是:
文心一言是目前AI商业化产品浪潮中唯一的中国互联网大厂代表。
也许最着急的是Robin。
周五
提示词:StableDiffusionReimagine
人人都是prompt工程师的时代,还没开始就结束了
在Stability.AI宣布收购图片工具Clipdrop开发商的短短一周后,它发布了新工具StableDiffusionReimagine。SDR允许用户无限制地生成单个图像的多种变体。用户只需将图像上传到算法中,就可以创建他们想要的尽可能多的变体,而不需要复杂的prompt。这个工具基于Stability.AI创建的一种新算法。