CVPR2022北大腾讯提出文字logo生成模型,脑洞大开堪比设计师澎湃号·湃客澎湃新闻

下图的每对logo中,一个是设计师设计的logo,另一个是AI模型生成的,顺序不确定,你能分辨出哪些是AI模型生成的吗?(答案在文末揭晓)

文字标志(textlogo)的设计非常依赖于设计师的创意和经验,其中,如何安排每个文字元素的布局是一个核心问题。布局设计需要考虑到很多因素,如字形、文字语义、主题等。例如,不同的文字之间通常不能有形状重叠;对于要强调语义的文字,通常使用较大的尺寸;斜切和旋转等几何变换可以分别体现力量感和欢乐感等主题。业内现有的方案大多是设计一套易于执行的规则,按照一些预先设定好的模板来设计布局,但是生成的结果往往会比较单调且缺乏创意和美感。

最近,北京大学王选计算机所和腾讯针对这个问题,提出了一种内容感知的文字标志图像生成模型,从大量现有的文字logo中隐式地学习布局设计规则,从而能够对任意输入的字形生成新的logo。

一、数据集

图1TextLogo3K中Logo图像的标注

同时,它们在原海报图片中的位置和分割信息也一并提供:

图2TextLogo3K中海报图像的标注

该数据集免费提供给用户做学术研究使用(禁止任何商业用途)。除了文字logo生成,该数据集同样可以应用于文本检测和识别、艺术字体生成、纹理特效迁移、场景文字编辑等任务。

二、模型设计

2.1流程框图

本模型的流程框图如下图所示:

图3本文模型流程框图

本模型基于ConditionalGAN来生成文字logo,创新性地使用双判别器结构(序列判别器和图像判别器),对字形的轨迹序列和整体logo图像分别做判别;同时借助可微分拼接(DifferentiableComposition),构建位置坐标到logo图像的可微分渲染过程。其主要的流程包括:

首先利用输入元素的双模态的特征(即字形视觉特征和文本语义特征),将其编码成条件特征。

坐标生成器采用条件特征和一个随机噪声作为输入,为每个字符预测位置坐标,即字形外接框的中心点坐标,宽和高。

每个字符的位置坐标形成一条轨迹序列,故采用一个序列判别器去根据条件对序列和做真假判别。注意到本任务中坐标值是连续的,保证了序列判别器可以传播梯度。

通过可微分拼接,合并每个字形得到的logo图像。

引入图像判别器,作为序列判别器的补充,目的是进一步捕捉到标志图像的细节信息,保证不同的字形之间不会有较大的重叠,字形间距合理等。

网络的整体优化目标函数如下:

其中,

是序列判别器损失,

是图像判别器损失,

是显式的字形重叠损失(详情见论文)。E代表条件编码器,G代表坐标生成器,

分别代码表序列判别器和图像判别器。其中,可微分拼接和双判别器的具体技术细节在后续小节进一步介绍。

2.2可微分拼接

在获得预测的几何参数之后,需要进一步将每个字形图像按照这些几何参数拼接成一个文字logo。更重要的是,这个拼接过程必须是可微分的,以让整个模型可以端到端地被优化。为了达成这个目的,本文设计了一个基于STN(SpatialTransformNetworks)变种的可微分拼接方法。在原始的STN中,仿射变换参数是使用神经网络直接直接预测。本文方法先预测得到了目标字形位置坐标,于是先建立原坐标到目标坐标的映射关系(下图左),手动解出仿射变换的参数(下图右)。通过这种方式,既可以保证目标字形的位置坐标在画布的范围之内,又可以利用STN的可微分采样算法。

图4显式求解仿射变换参数

通常来说,在文字logo中不同字形之间不会有重叠(有一些故意的设计除外),因此不需要考虑每个字形之间的图层关系。将每个字形变换的图像直接进行加法操作,即可得到logo图像,结合上述步骤,可微分拼接的整体过程都是可微分的。

图5根据求解参数合成logo图像

2.3双判别器结构

字符的放置轨迹应该既符合人们的阅读习惯,又呈现出多样的风格。然而,这两个特性不容易被图像生成模型中常用的卷积神经网络(CNNs)所捕获到。为了解决这个问题,本文设计了一个双判别器的模块,包括一个序列判别器和一个图像判别器。序列判别器以条件特征作为初始状态,将几何参数的序列作为输入,去分析这个放置轨迹的合理性。

序列判别器并不能够捕捉到细粒度的信息(如笔画等),因为它仅仅接收几何参数作为输入。于是,本模型引入图像判别器去进一步探究logo图像(人工设计的或者本模型生成的)的合理性,并预测它们的真假。根据业内的常见做法,将条件特征进行堆叠再放置到的第一个卷积层之后,用作判别条件。

三、实验

3.1布局生成结果展示

如图6和图7所示,本模型可以生成英文logo图,也可以生成中文logo。

图6本模型在英文数据集上结果

图7本模型在中文数据集上结果

其中,“ours”所在列表示本模型生成结果,“GT”表示设计师设计的结果。本模型生成的布局具有丰富的多样性:如(1)根据具体字形安排布局,如“B+侦探”中,将“+”号巧妙地安排到“B”右下角和“侦”左下角之间;(2)根据语义进行换行,如“神探包青天”和“春风十里不如你”。

3.2与其他方法对比

本文与2D图形布局生成工作LayoutGAN(Lietal,ICLR2018)和layoutNet(Zhengetal,TOG2019)进行了对比,这两种方法没有考虑到空间布局上的序列信息,以及输入元素的自身本文语义信息,所以不能处理该任务。如图8所示,本模型生成了更好的结果。

图8与现有方法对比

3.3布局风格分析

通过主成分分析方法(PCA),对隐空间噪声z进行了可视化实验,结果展示在图9中。结果发现,(1)垂直的布局(B2,C2,H2,E3)倾向于落在平面的左边;(2)水平的布局(A1-E1,H1,G2)倾向于落在平面的中间和上方;(3)多行的布局(A2,D2,E2,F2)倾向于落在平面的右下方;(4)不规则的布局(F1,G1)倾向落在平面的边缘。隐空间噪声z和输入文本的长度变量是正交的。该可视化方法可以引导设计师探索布局风格的隐空间,帮助他们挑选喜欢的风格。

图9隐空间噪声z的可视化结果

3.4主观评价

本文开展了一项用户调查,用于收集用户对于本模型生成结果的主观评价,用户群体包括27个专业设计师和52个其他职业者。使用了20对测试图片(模型生成和人工设计的),让用户(1)选择哪个是AI生成的:下表中的“准确率”表示用户挑出本模型结果的概率,越低越好;(2)选择自己更倾向于哪个:下表中的“选择率”表示用户选择本模型结果的概率,越高越好;(3)给AI生成的质量打分(1-5):体现为下表中的“生成质量”,越高越好。从结果可以看出本模型取得了不错的效果,平均准确率接近50%,平均选择率40%。我们也观察到设计师群体更容易鉴别出AI结果,对质量要求也更苛刻,说明本工作还有进一步提升的空间。

表1主观调查结果

3.5logo图生成系统

受字体生成模型和纹理迁移模型的启发,本文也建立了一个全自动的文字logo图生成系统。该系统首先根据用户输入的文本和主题生成对应的字体,接着,将合成的字形图像和文本送到本文提出的布局生成网络中,得到字形摆放的布局,最后使用纹理迁移模型得到修饰后的logo图像。图10展示了一些合成的样例,证明了本系统的有效性。

图10logo图像生成系统

四、结论

本文提出了一种用于合成文字logo图的布局生成模型。该模型创新性地提出了一个双判别器的模块,用于同时评估字符的放置轨迹和渲染后文字logo图的细节信息。同时,本文提出一种可微分拼接的方法,构建了布局参数到文字logo的可微分渲染过程。本文构建了一个大规模的数据集TextLogo3K,并实施大量实验来验证模型的有效性,该数据同样可以应用于其他任务。引言部分中每对logo图像,左边是AI生成的,右边是人工设计的,你猜对了吗?THEEND

投稿或寻求报道:content@jiqizhixin.com

原标题:《CVPR2022|北大、腾讯提出文字logo生成模型,脑洞大开堪比设计师》

THE END
1.纯文字标志图片大全高清熊猫办公精心为用户挑选23张高清精美文字标志图片、支持专业级文字标志设计素材下载,更多风格的文字标志,免抠元素,卡通手绘素材图片、图标图案、免抠矢量图,尽在熊猫办公。https://www.tukuppt.com/speciall/wenzibiaozhi.html
2.文字logo图片文字logo设计素材红动中国素材网提供130个文字logo图片、文字logo素材、文字logo背景、文字logo模板、文字logo海报等PS素材下载,包含PSD、AI、PNG、JPG、CDR等格式源文件素材,更多精品文字logo设计素材下载,就来红动中国,最后更新于2024-06-10 09:00:23。https://so.redocn.com/logo/cec4d7d66c6f676f.htm
3.关于设计logo时图形和文字的技巧虽然近年来文字型Logo和图文结合型的Logo越来越多,但图形加文字型的logo设计方向也仍然很主流,个人觉得该类Logo比前两类难度更高,因为图形加文字型Logo既要设计图形和字体,还要使logo图形与标准字非常和谐的搭在一起,事实上很多此类Logo在这方面都做得不够好。假设已经设计好了一个不错的Logo图形,那如何根据它合理https://zhuanlan.zhihu.com/p/76568858?ivk_sa=1024320u&utm_id=0
4.苏州LOGO设计图片与文字在标志设计中的运用极地视觉设计文图结合标志是现代品牌识别设计发展出来的重要类型,文字作为视觉主体有利于品牌名称的呼叫与记忆,图形元素则可以加强品牌的差异化识别与业务联想,规避了独立图形难以被记忆并与呼叫建立联系的缺点。 极地视觉专注品牌logo/苏州vi设计,苏州包装设计,苏州招贴设计,苏州画册设计,苏州UI交互设计,苏州IP形象设计,苏州品牌形象设http://www.jidee.cn/mnewsView.asp?cid=2&kid=3797
5.LOGO标志图片专题,LOGO标志下载标志LOGO设计文字设计 图文 共享分: 40 英文字体设计英文LOGO设计 共享分: 40 交响乐LOGO标志图文标志 共享分: 40 绿色标志图文标志环保标志 共享分: 40 宠物标志LOGO图文宠物标志 共享分: 40 宠物标志LOGO图文宠物标志 共享分: 40 图文标志LOGO 图形加文字 共享分: 40 创意卡通动漫图片头像卡通标志 共https://www.nipic.com/zhuanti/1901611.html
6.照片如何添加水印文字logo照片如何添加水印文字logo 简介 我们在网上看到的图片大多都带有水印文字标志,图片创作作者可以添加自己的logo,保护自己的版权不受侵犯,下面小编就介绍一下如何利用美图秀秀给照片添加水印文字logo。工具/原料 美图秀秀 方法/步骤 1 点击美图秀秀图标,打开应用程序主界面。如图所示:2 点击主界面最上面的选项卡,https://jingyan.baidu.com/article/54b6b9c0910e262d593b4741.html
7.是注册文字商标好还是图形商标好呢?商标注册与图形商标相比,文字标志最重要的特点是易于调用和描述。因为文字信息的传递明显比图片信息容易,所以单词标记的传递成本更低,甚至一些好的单词标记被翻译成我们日常的词汇。然而,单词标记受语言和地域的影响很大,一些可理解的含义很难用单词标记来表达。 图形商标是指仅由图形组成的用于商品或服务的标志。图形商标的主要https://www.wen51.com/news/show/109461/
8.文字图标图片文字图标图片素材大全智能精选为您提供丰富的文字图标图片素材,文字图标设计,文字图标制作,文字图标图片素材下载。助力您对于文字图标设计制作的创意设计灵感,充实饱满作品,查找更多设计制作作品选择摄图网下载https://699pic.com/image/wenzitubiao.html
9.微信文字标志图片微信文字标志图片素材免费下载千库网为设计者提供微信文字标志素材大全,为您省却微信文字标志图片素材搜索时间,这里有海量微信文字标志素材图片供您下载使用,本次搜索千库网为您找到10000张素材https://m.588ku.com/image/123511852.html
10.R字logo图片R字logo素材R字logo模板免费下载r字的设计图片 彩色R LOGO设计 r文字logo图片 字母r形logo图片 字母r形logo图片 字母r形logo图片 R字商标 logo 设计 字母logo R logo 设计 字母logo R 字母logo R G logo 设计 字母logo R O G 字母R矢量logo 字母r形logo图片 R2 logo设计欣赏 R2民航业LOGO下载标志设计欣赏 https://www.16pic.com/sucai/3366159.html
11.你知道什么是文字商标和图形商标吗?二、什么是文字商标? 文字商标是指由数字、汉字、字母或其他字符组成的用于区分商品或服务的标志。与图形商标相比,文字商标最重要的特点是便于调用和描述。由于文字信息的含义非常明确,其传递效率明显优于图片信息,文字标记的传递成本也更低。甚至一些好的词标也转化成了我们的日常词汇。 http://www.hkkaixin.com/content-57-238193-1.html
12.文字图片白底黑字建筑文字标识标牌中文字尺寸怎样确定?在建筑中的不同部位一般都设置了很多包含有文字、图案的标识和标牌,用以标记建筑名称、编号,起着指示、引导等重要作用。标识标牌的设计也是建筑设计的不容忽视的一面,其中就涉及到文字的尺寸大小该怎么确定的问题,下面尝试对这个问题进行分析。 01 人的视力 https://blog.csdn.net/weixin_39611049/article/details/112418798
13.图形商标和文字商标有何区别1、图形商标是以图形来表达的,而文字商标是以文字的形式来表达的。2、图形商标是强调图片的形状的。 法律依据: 《中华人民共和国商标法》第八条任何能够将自然人、法人或者其他组织的商品与他人的商品区别开的标志,包括文字、图形、字母、数字、三维标志、颜色组合和声音等,以及上述要素的组合,均可以作为商标申请https://www.64365.com/tuwen/rwkve/
14.火星文字标志设计火星星球图片商业图片VEER图片库提供火星文字标志设计火星星球图片购买下载服务,2亿+高清商业图片,正版图片购买下载一站服务,另提供科学家图片,天文学家图片,俄罗斯宇航员图片,行星图片,宇航员图片,星系图片,科学图片,太空图片,单词图片,品牌名称图片,标签图片,字母图片,标语图片,信函图片,科https://www.veer.com/photo/412598975
15.文字logo设计logo文字图片形状2、输入品牌关键字:请填入所属行业关键字,比如:logo、文字、图片、形状,可以告诉我们这个品牌在做什么,有利于我们分析你适合哪种logo类型。 3、自动生成LOGO:根据您的品牌信息自动生成多种文字logo,不仅有不同的图标设计,也包含图文结合logo、徽章、文字标志设计等。 https://www.niurensheji.com.cn/works/2290.html
16.6字LOGO,高清6字LOGO图片/素材/模板,免费6字LOGO图库下载图品汇免费素材网为您优选提供可免费下载的6字LOGO素材,可原创可商用的6字LOGO素材,本页为您展示的是设计师都喜爱下载的高清6字LOGO图片素材/设计模板/素材模板/素材下载/设计素材等图品汇图库素材,有多种格式 (EPS/PSD/PNG/AI/CDR/JPG/等)可选下载。赚钱https://m.88tph.com/tupian/709825/
17.文字logo设计图片文字logo设计模板下载文字logo设计专题提供文字logo设计背景图片,文字logo设计素材下载,文字logo设计模板下载,所提供的文字logo设计都是高质量的,供大家下载学习及参考。https://www.zhengpic.com/tags-58164-0.html
18.文字logo设计文字logo设计图片文字logo设计模板觅知网为您找到156924个原创文字logo设计图片,包括文字logo设计图片,文字logo设计素材,文字logo设计海报,文字logo设计背景,文字logo设计模板源文件下载服务,包含PSD、PNG、JPG、AI、CDR等格式素材,更多关于文字logo设计素材、图片、海报、背景、插画、配图、矢量、UIhttps://m.51miz.com/so-sucai/4485833.html
19.文字lOGO设计图片免费下载文字lOGO设计素材文字lOGO设计模板千图网为您找到1049张文字lOGO设计相关素材,千图网还提供文字lOGO设计图片,文字lOGO设计素材, 文字lOGO设计模板等免费下载服务,千图网是国内专业创意营销服务交易平台,一站式解决企业营销数字化、协同化,实现营销转化效果增长!https://www.58pic.com/tupian/wenzilOGOsheji.html
20.AppStore上的“Logo设计软件一键生成Logo图标和字体标志 OrangeBay Information Technology Co., Ltd. 专为iPad 设计 “摄影与录像”类第 125 名 4.8 ? 3.3万 个评分 免费 提供App 内购买项目 截屏 iPad iPhone 简介 Logo Maker 可以帮助您轻松制作专业的英文logo. 1. 告诉Logo Maker您想要制作的logo的名字。 https://itunes.apple.com/cn/app/id1317684294
21.在线免费图片去水印网页版版轻松摆脱logo文字标志水印云去水印网页版支持消除任意图片上的文字、日期 贴纸、标志、纹身、隐私信息、多 余物体等等。无论多复杂的背景, 都可以使用水印云AI去水印工 具帮助您一键删除所有水印。图片 上的任何不完美都可以尝试去除! 水印云去水印网页版是一款在线免费的图片去水印工具,它可以帮助你轻松地去除图片上的logo、文字或标志http://www.shuiyinyun.com/index.php/tutorial/2212.html
22.各类在线制作图标站点汇总jadmin支持各种类型图片的生成,可以选择设置的条件非常灵活。 站点十二http://www.myelogo.com/ 支持客户信息显示、自定义文字及图片,详情请参考本站的《介绍一个免费生成动态签名图标的站点》。 站点十三http://www.kalsey.com/tools/buttonmaker/ 支持按钮类型的图标生成。 https://www.cnblogs.com/jadmin/archive/2007/06/10/2206340.html