主打一个张张封神,看AIGC特种兵Midjourney如何做到以假乱真

随后,在以ChatGPT为代表的聊天机器人搅得科技圈满城风雨之时,Midjourney作为AIGC的重要分支,也完全没闲着,它最新迭代的V5版本,就是一次堪称“碾压人类画师”的更新。

今年3月,由Midjourney生成的一对中国情侣的照片再次火爆全球。照片里的情侣穿着夹克和牛仔裤,身后是上个世纪的中国建筑,整张照片弥漫着属于90年代的复古氛围,其以假乱真的程度让人大吃一惊,生成式AI图像工具竟然已经进化到这种程度了吗?

还有更多神图在网上引起轩然大波:特朗普被捕、国足夺冠、马斯克进工厂……只要你敢想,AI就敢画。对比几年前的AI绘图效果,Midjourney的生成效果依然达到商业化水平,当Midjourney日趋代替人工制作的时候,它的商业价值就愈发不容小觑。

过去几年里,机器学习系统从文本提示生成图像的能力,在质量、准确性和表达能力方面都得到了显著提高。这些画作在互联网上流传,给人们带来了一种新奇感,越来越多具有前卫品味的艺术家和设计师也正在把这些软件集成到工作流程中。

可以说文生图赛道是AIGC概念下商业模式较成熟的领域,这些AI生成工具可以在几分钟内使用用户提供的文本描述创建图像,并且人工智能可以生成不同艺术形式的图像,从超写实到立体主义,AI都熟稔于心。

而Midjourney是其中最具竞争力的选手,是将AIGC技术成功产品化的代表。创始人DavidHolz在描述Midjourney时说:“我们只是希望它易于使用,我们希望图片足够好看。”与Dall-E2或其他竞争对手不同,Midjourney使用简单的命令,不需要编码经验就可以生成更具梦幻艺术风格的图像。

Midjourney没有任何巨头的重金支持,是一个自筹资金的独立研究实验室,它的发起人为曾两次拒绝苹果收购的LeapMotion公司的创始人DavidHolz,目前全职员工仅有11人。就是这么一个超小型团队,却是当前AI绘图领域最炙手可热的明星,甚至将OpenAI的DALL-E、StableDiffusion等同类工具都甩在了身后。

Midjourney在AI公司ValueChain上占据了多个位置,拥有数据层、模型层、应用层整个技术栈。它参考CLIP及Diffusion构建了自己的闭源模型,抓取公开数据进行训练,并构建了Discord中的Midjourneybot应用,用户通过与Midjourneybot进行对话式交互,提交文本提示词来快速获得想要的图片。

虽然文生图领域应用层出不穷,但Midjourney保持住了在人们心目中的地位,目前仍是使用最广泛、最受用户喜爱的文生图应用。Midjourney用户数量飞速增长,并具有很强的盈利能力。截止2023年3月,MidjourneyDiscord频道拥有了超1300万社区成员,是目前用户最多的服务器,年营收约为1亿美元。

Midjourney创始人坚持AI不是现实世界的复刻,而是人类想象力的延伸,塑造了充满科幻色彩的产品定位。然而并不是所有人都能轻易认可AI生成艺术,自Midjourney面世以来,这款AI绘画工具几度因为艺术深度伪造问题被推上舆论的风口浪尖,更有甚者认为其生成的图片纰漏百出。

Midjourney并没有否认以上观点,它一直相信AI工具是想象力的发动机,“人类和计算机之间存在的某些障碍阻止了我们进行最基本的交换。”Midjourney想要加强人类与计算机的连接,将“探索思想的新载体,扩展人类想象力”作为目标,为未来艺术创作开拓史无前例的康庄大道。

为了实现这个目标,该公司一直致力于改进算法,每隔几个月就会发布新版本的模型。Midjourney的迭代速度相较于OpenAI可以说是有过之而无不及。去年3月份第一版本首次上线,4月份便火速更新第二版本,接着7月份上线OpenBetaV3版本首次向公众开放,MidjourneyV4版本去年年底几乎跟ChatGPT同期上线,而就在GPT-4推出的时候,Midjourney也在3月18日飞速推出了V5版本,而这一次的更新堪称“炸裂”。

V5版本的诞生昭示着由Midjourney创造的平行世界正在慢慢拉开序幕,一些由人类构思、AI主导的作品也逐渐对数字营销市场描绘着全新的商业轮廓。那最新升级的V5和之前的版本相比,到底强在哪里呢?以下几个方面的对比或许可以让我们窥得Midjourney的升级为何会如此让人惊艳。

更多的风格,更高的质量

MidjourneyV5可以选择不同的风格化参数,用户可以在Prompt里添加风格化参数(--Stylize),数值范围为0-1000,0更偏向艺术化,1000更真实,从而得到完全不同风格的图像。

图源Discord官网、华泰研究

同时,V5生成的图像具有更高的分辨率,且图像更真实细腻。默认情况下,MidjourneyV5初始图像的分辨率为1024x1024,V4版本为512x512,V5生成的图片无论时从光影效果还是人物动作表情,都更加自然,拥有更多丰富的细节,更加接近真实的照片。

密铺功能实现无缝纹理制作

MidjourneyV5重新引入了曾在V4中停止使用的无缝平铺功能。在Promt中添加参数(--tile),对元素进行重复、旋转等处理后,可以轻松实现织物、壁纸等无缝纹理图案的制作。

长宽比限制取消

V5版本解除了V4版本中的不高于1:2或不宽于2:1的自定义纵横比,可以实现任意「宽度:长度」比,这意味着你可以利用其生成电影2.39:1的纵横比,Midjourney的应用空间进一步打开。

图像与文字指令权重可自定义

V5可以实现自定义Prompt中的图像参照权重(--iw),参数范围为0.5-2.0,数值越高,意味着上传的图片越多地影响最终生成的图像,满足用户垫图更加个性化、多元化的需求,而在前一版本中则是默认图像权重。

除以上四点,V5版本可以让人们通过更精准、细致的Prompt输出更符合要求的图像。在此前版本,Midjourney根据文本提示即可输出具有创造性的图片,且多为卡通或超现实风格,但V5版本可以容纳真实、抽象等更广泛风格的选择,图像解像度比上个版本提高2倍。

而让人意想不到的是它终于解决了此前AI绘画行业内无法很好完成的“画手”问题,告别了手部畸形,MidjourneyV5终于可以画出正常的五个手指了。除此之外,V5版本创作的玻璃及其反射的光影也都更加真实。

技术的升级让Midjourney真正实现了从图像到照片的跨越,从抢画师的饭碗进阶为抢摄影师的饭碗。只要能掌握Prompt的精髓,便可手握科技黑武器,惊喜的是V5的升级里就推出了describe功能。

只需上传一张图片,使用describe功能,Midjourney便会自动分析图片并生成4条对应的Prompt,点击下方对应的按钮便可直接生成类似的图片,当然也可以对这些Prompt进行调整。这样一来,获取更符合自己要求的Prompt就更容易。

从图像反推Prompt,Midjourney通过自行闭环推动人类不断去拥抱这项伟大的技术,大量用户的涌入也让Midjourney官方不得不暂停免费使用功能。

可以看到,Midjourney的发展用飞速来形容也毫不为过,英伟达AI科学家JimFan曾猜测,Midjourney是根据人类反馈RLHF进行大规模的强化学习,并且这可能是有史以来规模最大的文本到图像强化学习,用户反馈越多,它的学习效果就越好。

历史上每一次具有革命意义的技术更新,都将会迎来最终大范围落地应用的曙光。在AI科技飞飚的高速公路上,我们将会一直观望这家图片AI龙头如何秀出精彩车技,又将驶向何方。

动一动手指头,打几个关键字,Midjourney的绘图到了张张“封神”的程度,这无处安放的硬实力和软魅力,追根究底,无疑归功于其底层模型技术的更新迭代和发展进步。

2015年,谷歌开源创建了首个通过算法生成艺术图像的机器学习应用DeepDream,使AI文生图应用开始走进大众的视野。而后的2021年至今,文生图应用出现了突破性的进展,生成的图像质量得到了迅速提高。从初级的氛围感草图到可以刻画细节、生成精致五官的精致艺术图,从以生成性对抗网络GAN转变至以Diffusion模型为核心,这其中经历了无数次的技术变革。

Midjourney在参考CLIP及Diffusion的基础上构建了自己的闭源模型,抓取公开数据进行训练,并构建了Discord中的Midjourneybot应用。不仅如此,它还在收集用户反馈数据的基础上,不断迭代模型,以提供更好的体验。2023年3月,在经历多次更新后的MidjourneyV5版本闪亮登场,解决了一些技术难题和完成了跨越性的突破。

Midjourney作为功能单一的应用,未来是否会被集成变成多功能产品的一个环节,或是被技术的快速进步颠覆,目前我们还无法看清行业的终局,但Midjourney作为当前AI图片生成的龙头,观其用户口碑和产品技术的迭代速度,都让人无比期待它的未来发展。

伴随着数据、算法等核心技术的不断更新与突破,AIGC正在推动虚实共生趋势下的内容创作的范式转变,有望成为数字内容创新发展的新引擎。

按照AIGC的发展逻辑,其应用场景主要分为三个阶段:一是AIGC内容生产技术不断完善,能够实现文本、视频、图片等生成以及跨模态转换;二是具有多模态生成技术的聚合应用——虚拟人;三是AIGC内容生态聚合体——元宇宙。

在提高内容生产效率的同时,华泰证券也指出:“AIGC也有助于生成开放内容,满足用户个性化、开放性的需求,持续提升元宇宙的内容丰富度。”以Midjourney等为代表的的AI生成工具或可以成为元宇宙的梦幻编辑器。

元宇宙方兴未艾,AIGC接踵而至,我们有理由相信,这两大科技赛道的交汇,将会为元宇宙注入更多的生机与色彩。

THE END
1.Midjourney每一次凝视都是一次自我探索!#一张照片高级感 #对望与凝视 #midjourney作品分享 #midjourney #肖像 #高级审美 #用照片诠释高级感 #AI绘画有点东西 #我的灵感拍摄 #搞的就是艺术 #氛围感 #电影感 #ai艺术 #AI摄影 #AIGC ai #用艺术表达情绪 #光影艺术 #坚持一定很酷 #电影美学 https://m.dewu.com/note/trend/details?id=249396418
2.上海研本文化传播有限公司在当今的数字时代,人们对于娱乐的需求愈发多样化,高品质的视觉体验成为了许多人的追求,PANDORA PARADOXXX正是在这样的背景下应运而生,以其独特的魅力和刺激的内容,吸引了无数爱好者的关注,本文将探讨PANDORA PARADOXXX的特色,特别是其最高难度的热门口交尺度秀,以及其为何能成为热门的高品质体验。 http://yanbenbrand.com/post/5118.html
3.NIKE,Inc.新聞中心:新聞稿產品公告與媒體資源—NIKE,Inc.閱讀最新 NIKE, Inc. 消息與產品公告。 下載高解析度圖像和新聞稿副本。https://about.nike.com/zh-Hant/newsroom/releases?page=1
4.Midjourney官网震撼登场,AI绘画工具领域登峰造极云典AI智库中国已经成为全球创新科技的重要巨头,而在绘画领域,AI技术正逐渐引领着一场革命。近年来,人工智能绘画工具在帮助艺术家们创作出更令人叹为观止的作品方面展现出了巨大潜力。在这个迅速发展的领域内,Midjourney官网旗舰亮相,以其智能AI绘画工具引领着绘画领域的新时代。这个创新工具潜藏着无限可能,并为艺术家们提供了前所http://cosoh.com/midjourneyguanwangzh/
5.Midjourney当前中国区定价为海外的3-5折,请安心购买Midjourney为您提供的AI绘画服务 月卡会员 ¥28.8/月 相当于国外的4折 可下载高清原图 300张常规出图(慢图) 可画75张快图 生成图片仅自己可见 购买月卡 季卡会员 ¥128.8/季 加量又打折 可下载高清原图 常规出图不限次数 https://www.midjourney9.com/pay/
6.一周Martech新闻:我国数字经济规模稳居世界第二;Marteker该啤酒是为了庆祝集团旗下贝克啤酒创立 150 周年而推出。百威英博表示:在产品设计以及品牌营销方面,这款新的产品使用了 ChatGPT 和 Midjourney 技术。AI 技术主导了所有基于其智能的设计和开发,直到最终版本问世。这也使 Beck 's Autonomous 成为「世界上第一批完全由机器制造的啤酒」之一。(爱范儿)https://www.shangyexinzhi.com/article/7437834.html
7.都在传的那个Midjourney中国版是真的吗来自蚁工厂都在传的那个Midjourney中国版是真的吗……发新闻的那个公众号Midjourney AI背后的公司看着和海外没啥关系,只是两个自然人控股 ?收藏 12 15 ?24 转发到微博 转发到私信 全部 热门 关注的人 陌生人 互联网科技博主 3 公司 湖南蚁坊软件股份有限公司 T 友情链接 蚁坊软件官方网站https://weibo.com/2194035935/N0OqyxpC5?type=repost
8.MidjourneyMidjourney中国区官网,通过Midjourney AI让绘画如此简单,您只需要在Midjourney AI中描述你的画面即可,这里为您为准备了Midjourney AI基本的使用教程、Midjourney……等,是在中国使用Midjourney一站式平台!http://51huihua.com/
9.Midjourney成功的关键:不只靠技术,还有社区过去一年,人工智能生成的以假乱真图片占据着互联网的各个角落。能完成工作的人工智能产品或系统全球有上百个,比如开源的Stable Diffusion、OpenAI开发的DALL·E2,中国也有Tiamat、文心一格等产品。 但人们往往更痴迷Midjourney的作品。现在全球有1700多万人使用Midjourney,至少是Stable Diffusion网页版的7倍,DALL·E2的6https://tech.china.com/article/20230626/062023_1351828.html
10.酷熊智绘支持midjourney酷熊智绘基于最新一代ChatGPT-4大模型和最强Ai绘画Midjourney引擎深度开发而成,可实现文生图,图生文,图生图,AI照片换脸等能力,目前已支持到最新的v6模型。根据中国人使用习惯,进行了深度优化,更好的支持中文和国内网络环境,实现了一个账号,共用算力,让更多人轻松https://www.dmw61.com/
11.打个假,所谓的midjourney中文官方是假的。一个非常小的成立不久的打个假,所谓的midjourney中文官方是假的。一个非常小的成立不久的小公司自己搞的,股东只有两位自然人,而且可能涉及侵权。公司名:南京鹏羽辉科技有限公司 @用户8940371568 :原帖已删除 讨论 1 写讨论… 20 南山下林 mid中文官方是真的,官方的每周日志里已经记录了QQ版是官方的 2023-05-17 13:35 福建 1打开https://xueqiu.com/4299879533/250597796
12.从大模型的「前世今生」看生成式人工智能的「价值涌现」Midjourney还推出了describe功能,通过自行闭环做到“图像反推prompt”,只需上传一张图片,系统便会自动分析图片并生成四条上传图片的主要特征“提示”,选择其中一个特征就可以据此创建新的图片。 3)发展趋势 从直接调用到“再训练”,关注数据标注与数据获取和生成:在垂直领域特性化数据不足的情况下,可以尝试直接调用大http://www.pinevc.com.cn/article/1361.html
13.卷王都在用!100款宝藏级AIGC工具分享,强烈建议收藏!!Midjourney是由Disco Diffusion的作者之一推出的一款AI绘画聊天机器人,搭载在Discord上。在GPT-4推出之后,它也快速更迭到了V5版本。新版本在图像的逼真度、细节处理上更加精细,商业化水准更高,近乎达到了可以“以假乱真”的地步。之前的版本中,生成图片的风格多以卡通或是超现实为主,少有写实风格的图片,更新到V5https://www.changbiyuan.cn/news/2023/news_0711/69335.html
14.MidjourneyMidjourney 20 分钟前 https://oss.iiii.com/userImg/1732561602671.jpg Vintage Sculpture Table Pillars in Pre-Owned Wood Art, 4K HD --ar 4:5 --q 0.5 --seed 68044351 0 Midjourney 21 分钟前 https://oss.iiii.com/userImg/1732561602671.jpg Sculpture table pillars in the middle of the centuryhttps://chat.yczktek.com/art/paintings/
15.Midjourney中文版到底是官方还是李鬼?mj中文站是真的吗今天我想和大家聊聊一个最近很火的话题,那就是AI绘画神器Midjourney(简称MJ)来中国了,QQ频道内测火爆开启。这对于喜欢AI绘画的创作者来说,无疑是一个福音,但也有一些争议和疑问。我将根据网上的相关信息,为大家分析一下这个事件的背景、真相和影响。 https://blog.csdn.net/weixin_61980423/article/details/130774799
16.Midjourney通过本站绘画生成的作品(不限使用 midjourney 还是 DALLE2),分享到公共区(https://chat.youyi.asia/art/paintings/),经网友点赞投票,每月选出点赞最多的前 10 名选手。 三、活动时间 每月1日至次月1日,每月1日公布上月活动结果。 四、活动奖励 每月1日统计上月获奖人员,1 日晚 8 点公布获奖名单。 公https://superx.chat/art/activity