这一部分阐述方案是如何组合云产品服务来实现AI绘画创作的。下面是方案的拓扑:
此方案拓扑中,云服务器(ECS)被用于运行Web程序,来接收用户的图像处理请求;而对象存储(OSS)则用于存储某些场景中用户上传的图片,并通过签名的方式使得生成模型(通义万相/FaceChain)可以下载该图片,灵积模型服务(DashScope)通过提供基于HTTP接口的API,来实现应用程序的调用。
实现AI绘画创作的方式有很多种,为啥要选择使用阿里云服务,它能带给用户的能力和优势都有那些。方案从三个方面阐述了这一点。
通义万相系列模型服务提供稳定生成高清图片的响应,以适应高并发和大流量,可用性不低于99%,确保了用户在任何时候都能顺畅地进行创作。
提供了易于调用的API接口,简化了集成过程,并具有优秀的兼容性。背后的AI技术虽然非常复杂,但借助于灵积模型服务API,应用系统可以通过基于HTTP接口方便快速地接入,无需技术背景也可轻松上手。
上面的优势说到了应用场景广泛,但具体都能用到那些场景呢,这部分内容着重阐述了这一点。方案总结了五大应用场景,分别是:
教育工作者和培训师利用文生图模型来创建生动、直观的教学素材。这有助于提升教学内容的吸引力和理解度,并且定制化的图像资源还能用于制作互动课件、电子教科书,从而丰富教学资源库。
游戏开发者可以借助文生图大模型快速生成游戏内的角色、道具和环境元素等美术资源,用于动态生成游戏NPC(非玩家角色)的外观或定制化玩家角色,从而增加游戏世界的多样性和沉浸感。
时尚设计师和电商平台利用文生图技术进行服装设计和虚拟试穿体验。电商平台可以结合用户身材数据,让用户输入文字描述想要的服装款式或风格,从而生成个性化虚拟试穿图片。
实施方案需要具备那些条件或者是需要提前准备那些必要服务呢,而如何以最经济的方式来获取这部分服务呢,这一部分就介绍了。实现方案的落地需要用到云服务器ECS、对象存储OSS以及接口API调用的灵积模型服务、生成模型通义万相。实现方案花费较大的就是云服务器ECS,方案也是很贴心地准备了优惠计划。如下:
如果你经常使用云服务器来部署或测试各类应用,还是建议购买这个99一年的套餐,它的好处是永久实现99一年。如果你是新用户,那恭喜你,你可以领取免费的ECS试用,而且规格还不错。如下:
在正式开始部署前,需要提前准备基础实施和云服务。如下:
你只需点击页面上的"未开通",前往开通页面进行开通即可。如下:
开通之后再次返回控制台首页,就不会再显示未开通了。如果你之前使用过模型服务,还会在此进行显示。如下:
接下来需要创建API-KEY。在左侧导航栏单击管理中心>API-KEY管理。单击创建新的API-KEY。如下:
在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。如下:
很多小机灵看到这里就会发问了,我不复制保存,我点击"查看"不就行了吗?是的,你确实可以点击"查看"进行查阅,但你会面临安全认证,看到这是不是觉得还不如保存到本地呢。如下:
那还有的宝子们会说了,我可以再申请一个啊,免得认证这么麻烦。这里要注意的是主账号,有且只能同时拥有三个有效的API-KEY,而不是越多越好哟,还是复制保存本地为妥。
点击下一步,确认信息,点击创建。如下:
可以通过编排详情清楚地看到整个部署过程。如下:
大概4分钟后,整个部署完成。如下:
点击输出,就可以访问到本次部署的服务了。如下:
如果此处你忘记了设置的是啥,可以通过编排的参数进行查看。如下:
但有粗心的小伙伴要问了,我密码也不晓得咋整。你可单击命令执行,选择查看,跳转到ECS控制台,在ECS云助手的执行信息中可查看到密码。如下:
到这整个部署就结束了,你可以尽情把玩了。比如我输入一个“乌云密布、雷鸣闪电”,其他默认,看能生成啥。如下:
效果是这样的,还是不错的。从图片URL来看,是存放在OSS对象存储的,非常高效便捷。
涂鸦作画再来一张。风格选择3D卡通,输入"比卡丘",而后在画板上随意一画,如下:
生成效果如下,不得不说,这效果连我都没想到,还真不错。
人物风格重绘。挑选一张本地的图片,选择复古漫画。如下
原图是这样的。如下:
复古漫画的生成效果如下:这漫画中的小天使加的妙啊。
3D童话生成效果如下:还是简单风格比较容易实现。
二次元的生成效果如下:最大程度地还原了。
小清新的生成效果如下:画风很奇怪,这个一点也不清新。
未来科技的生成效果如下:这个风格整体还可以。
国画古风的生成效果如下:我很好奇图上的小姐姐是怎么加进来的。
将军圣战的生成效果如下:这个效果就特立独行了。
炫彩卡通的生成效果如下:画本身没问题,但当你看到原图时还是有点诧异的。
清雅国风的生成效果如下:虽然画风很符合,但这转变也太大了。
喜迎新年的生成效果如下:这效果有点让人意外啊,好好的小精灵变成了小姑娘,还有这鼻子也是很独特。
1、部署应用涉及的有关资源和服务
2、安装应用程序
完成上述体验后,一定要记得释放资源,避免产生额外费用。释放资源非常简单,只需要在ROS控制台,找到对应的资源栈,点击操作列的删除即可。如下:
在弹出的窗口中,选择释放资源,点击确定。如下:
1)整个部署过程非常丝滑顺畅。非常推荐通过一键部署来完成应用的构建。通过ROS编排可以非常高效地完成基础环境的搭建及应用的部署。此外,API调用体验也相当顺畅,通过灵积模型服务,你只需创建一个API-KEY即可实现调用,真正做到了快速集成。
整个部署过程都有非常好用的文档参照,即使是小白用户也可以轻松完成部署。每一个填空都有文字和链接指引,极大地方便了用户。比如:
虽然应用提供的风格较多,但这里不得不提一嘴的是,如果支持用户自定义就更好了,可以让用户自定义,将常用的放置在前台,其他的折叠或隐藏到更多中。
此外这里的图片规格竟然没有标准1080P的,如果按照尺寸,那就提供更多尺寸让用户来选择。非常建议按照照片比例来,比如1:1、16:9。比如通义万相官网的这种:
还有就是风格重绘中,小清新、国画古风这两个风格是很难生成用户预期图片的,不晓得是底层模型应用的问题还是其他适配问题,用人物图和玩偶图都达不到预期效果。
3)改进和提升方面:
我所期待的通义万相不是一个简单的AI工具,而是一个实实在在可以帮助用户创造价值的AI助手。
4)我使用过百度的文心一格、腾讯的元宝、美图的WHEE,以及现在的通义万相。他们的首页界面如下:
从成本上来讲,各家都有免费的额度供用户日常使用,除元宝外,美图每日提供80个美豆、文心一格提供40格电量、通义万相提供50个灵感值。腾讯元宝的AI作画没发现有VIP模式,美图的WHEE和百度的文心一格都是创作一幅画耗费两个额度,阿里的通义万相是一个额度生成一副作品。单从数量上来看,通义万相是最划算的,相比其他家按数量消耗额度,它可以用一个额度同时生成四张图片。
从易用性上来看,腾讯元宝的界面是最简洁的,但可玩性也是最弱的。其他家均提供高级或更多模式,这里文心一格的把玩性是最强的,但也意味着它功能性是分散的,美图作为老派的图片编辑工具,在WHEE上主打一个WEB版的图片编辑风格,通义万相算是中规中矩,基本能满足用户创作需求。
从应用场景上来看,百度的问心一格算是最丰富的,它不仅可以选择的图片风格更多,功能性上也是最多的。腾讯元宝和美图WHEE的应用场景和功能是最少的,也就满足个基本创作。通义万相虽然选择性不是很多,模板提供的也有限,但好在创作质量很高,很大程度上可以满足用户的创作需求。通义万相在应用场景上的广泛性可能是一个重要的竞争优势,因为它能够覆盖更多的市场和用户群体。