GPT-4最新版的强大功能,尤其是结合了DALL-E3的自然语言生图功能,不再需要复杂的咒语prompt,GPT-4V的识图功能也是到了啥都可以识别的惊人效果。可无奈要想体验最新的GPT-4,要科学上网不说,还得付费,实在劝退很多人。
我们就来一睹GPT-4V的强大功能吧:
2.比如我想画一架飞机从机场起飞,相同的提示词,在几个文生图平台的效果如下,首先是GPT-4的:
要是对图片不满意,可以再让它续画,这在其他平台是做不到的,比如我可以说:
是不是很棒,我们再来对比用同一句提示词:一架民航飞机在机场上起飞的图片,从飞机头方向拍摄,特写,能够看到机翼,后面是机场,杰作,写实摄影效果,高质量,细节丰富,完美光线,16:9。在秒画平台上的效果:
在Midjourney上的效果:
在通义万相上的效果:
在文心一格上的效果:
综上,还是DALL-E3和Midjourney是在同一水准,不过因为GPT-4的DALL-E3可以用自然语言多轮对话,就显得更加智能了。在国内文生图平台上,秒画效果是最接近前面两家的,通义万相有时候也可以出好图,文心一格出好图概率更低些。
3.最近孩子上的幼儿园迎来了周年庆,要家长和孩子一起通过画画或手工的方式来表达祝福,我想,主体画还是得家长来,孩子辅助画些简单的图形或上色。所以要怎么画呢,以前都是搜一些网上的图,未必和实际校园场景契合,现在拿GPT-4来试试看,我同时上传几张参考图片,看下能不能引用到logo和背景:
第一次没有完全领悟到,logo没有画出来,不过图片画得还是不错的。但幼儿园不是这种圆形跑道,而是直直的,于是我又让AI再改下,这下就能体现DALL-E3的优势了,可以多轮对话修改,而不是像其他文生图功能一样每个prompt之间是相互独立的。如下图:
跑道颜色变了,但是确实直了,而且国旗的位置也一致了。不过还是没有生成幼儿园的标志钥匙的logo,有一次生成了一个差不多的,但是还是有差别,看来按原样贴到图上这件事,靠图生图目前还有些难度,最好还是借助AI。如下是教学楼顶上有钥匙logo的效果图:
再让AI画一张,又没有出现logo了,不过小女孩画得不错:
好了,有了AI作画的帮助,再手绘就有了模板,就可以比较好的完成任务了,如下是花了两个小时画完的作品,虽然和原图有不少差距,不过还是让孩子也参与其中,主要目的达到了:
4.DALL-E3号称可以连续作画,而且直接可以把故事转成漫画形式,比如我试了试这么一段,确实效果不错,衣着颜色,背景实物该有的物品建筑都有了,理解能力超过一众文生图工具。
又试了试另外一个提示语,这要放在其他文生图工具里,就是不合格的提示语,因为描述得太自然语言了,反而不行。但是在这里却可以很好理解:
5.接下来我们来看看GPT-4V的图片理解能力。首先看看它能否读图作诗。我上传了一张照片,得到如下回答:湖光秋水间,孤亭影相连。山色隐晚翠,舟行静处添。与照片确实比较吻合,而且文笔不错,尤其是前面两句。
接下来我们再来个复杂的,比如百度地图搜路线的一张截图:
我问它,这张图说明了什么,回答得很对,居然还猜出是百度地图的界面,而且根据我的追问进一步分析了哪条路线最佳,可见其强大的图分析能力。
二
Sider
Sider是一款浏览器插件,装上去使用,可以很方便地在任何网页上调取AI助手,现在这款工具可以每天免费使用ChatGPT3.5、Claude-Instant或GeminiPro,关键用起来还很方便。同时它的手机APP版本用起来也很丝滑,强烈推荐给大家使用。
现在教大家怎么使用:
2.创建好用户后,就可以下载浏览器插件了,现在支持Chrome浏览器和MicrosoftEdge浏览器插件,还有苹果手机和安卓手机的APP,点击链接即可安装。
3.安装好之后,再次打开浏览器,就有个小图标吸附在右侧,点击即可打开侧边栏,这点体验和monica一样。
4.它的功能也同样和monica类似,可以选择聊天方式,免费版本是基于GPT3.5的,我试了试,效果不错,响应回答很快:
5.第二个是提问功能,就是把一些常用的提示词做成了固定的指令,不用我们每次自己输入了比如总结文字内容,查找相似页面,语法纠错,名词解释,代码解释,文字改写,翻译(支持好多种语言),问答等,大家不妨一试。
比如我设定一个主题:关于中医理论的入门介绍课程大纲,效果如下,内容还是很全面的:
7.接下来在浏览任何网页时,sider同样提供了划中任何文字之后,快捷的指令操作,这点的使用体验上和monica又是一模一样:
功能跟提问中的指令一样,比如我们可以让它进行翻译:
有了这个功能,我们在浏览网页的时候,就多了一个无所不能的助手在身边。8.另外还有个好用的功能,就是你在常用的搜索引擎(如百度、bing等)中输入搜索关键字后,sider就在右边自动回答,基于它的海量知识库。不过,目前免费版是没有联网的,所以数据还是只更新到GPT3.5的语料训练数据集到21年,如果想联网的话,可惜需要付费。
当然,这个跟随搜索引擎自动回答的功能也可以手动关闭。9.如果需要付费的话,自行考虑,有几个档次,付费的好处就是可以用上联网、GPT-4、AI绘画和PDF上传,GPT3.5每天平均差不多可以用100次。不差钱的话,你可以考虑买他们的会员,不过目前对我来说,免费版已经够用了。Sider的下载邀请
好了,前面说的Sider的网站下载邀请链接请见:
手机端使用教程
其实就是把一些设定角色、要求的提示词预置成了一个个角色,当然你也可以预置自己创造的提示词,添加新的机器人角色,比如设定孔子、苏格拉底等名人角色。3.比如我们可以选产品经理这个角色,你也可以看到一个优秀的提示词应当具备的内容?有角色、每部分内容要求等。