人工智能基于深度学习的细粒度分类研究及应用个人文章

自AlexNet[1]横空出世,在ImageNet[2]竞赛中取得62.5%的top-1准确率,超越SIFT+FVs[3]类传统算法8.2%之后,深度神经网络就成为了图像分类领域的主要算法,先后出现了VGG[4]、ResNet[5]、Inception[6~8]、DenseNet[9]等。2019年,谷歌提出的EfficientNet[10]更是将网络结构设计由人工推向了自动搜索时代。2020年,谷歌提出的VisionTransformer(ViT)[13],将自然语言处理领域的Transformer结构引入图像分类,将图像分类带入了Transformer时代。

VGG[4]由谷歌Deepmind和英国牛津大学的研究人员联合开发,使用多个级联的3x3小卷积核代替了7x7的大卷积核,在保证感受野的基础上大大降低了网络的参数量。VGG[4]的另外一个贡献是通过加深网络结构提升了分类精度,在ImageNet[2]数据集上使用19层网络,top-1分类准确率达到了74.5%。

2015年,当时还在微软从事研究的何凯明、孙剑等人提出了ResNet[5],通过引入图1的残差结构,有效解决了深层神经网络训练过程中的梯度消失和梯度爆炸问题,同时解决了随着网络加深,分类精度越来越差的“退化”问题。首次在ImageNet[2]数据集上使用152层的超深网络获得了较好的分类精度,top-1准确率达到了78.57%,获得了2015年ImageNet[2]竞赛分类赛道的第一名。

图1残差模块

在以何凯明为代表的一些研究人员通过加深网络深度提升分类效果的同时,谷歌的一些研究人员在网络宽度上也取得了较大进展,先后在2014~2016年提出了InceptionV1~V4网络结构。InceptionV1[5]网络的设计思路主要是使用稠密组件(densecomponents)近似网络中的稀疏结构,为此,谷歌的研究人员剔除了图2所示的Inception基本结构。这种结构使用了多个并行的卷积和最大池化,在近似稀疏结构的同时,还引入了多尺度特性。InceptionV2[6]在借鉴VGG[4]等论文,使用多个级联3x3卷积代替5x5卷积的基础上,还加入了BatchNormalization(BN)对数据进行归一化,top-1准确率达到了74.8%。InceptionV3[6]提出了一种可有效降低网络参数量的方法,即非对称分解(AsymmetricFactorization),非对称分解就是将nxn卷积分解为1xn和nx1的级联形式,top-1准确率达到了78.8%。InceptionV4则将ResNet[5]中使用的残差结构融入Inception模块,极大加快了训练速度,,top-1准确率达到了80.10%。

图2Inception模块

在网络深度和宽度的研究取得长足进步之后,一些研究人员开始考虑通过网络特征的重用,提升网络的分类效果,比较典型的就是2017年CVPR的最佳论文DenseNet[9]。ResNet[5]证明了残差短连接能有效解决梯度消失和网络退化问题,如图3所示DenseNet借鉴了这一思想,将短连接使用在了所有层之间,对于一个L层的网络的第N层,前N-1层的特征在第N层实现了特征融合,同时,第N层的特征也提供给后边L-N层进行特征融合。特征重用避免了无效特征的重复提取,在提升网络的分类精度的同时,也有效降低了网络的参数量。DenseNet[9]在ImageNet[2]数据集上的top-1准确率达到了79.2%

NASNet[10]开启了神经网络搜索时代,实现了网络结构的设计的自动化,但其缺陷也比较明显。NASNet[10]的搜索空间仍然是人为设定的,是一种基于给定搜索空间的网络结构搜索算法。针对这一问题,FAIR何凯明团队2020年提出了用于设计搜索空间的方法,RegNet[12]论文中将网络结构搜索空间也作为网络结构设计的一部分。如图6所示,通过不断优化网络搜索空间,同时获得了最佳的搜索空间和该搜索空间中的最佳网络结构。

2020年,谷歌提出ViT(VisionTransformer)[13],将NLP(NaturalLanguageProcessing)领域使用的Transformer引入视觉领域,将图像分为分辨率相同的若干子块,每一个子块作为NLP领域的一个字符(token)进行处理。Transformer自注意力机制的引入,极大提高了网络的分类效果,在ImageNet[2]数据集上的top-1准确率达到了88.55%。

图3DenseNet

图4RNN控制器

图5NASNet基础卷积结构单元

图6

近年来,注意力机制被广泛引入细粒度分类领域,出现了如SE[14]、GE[15]、CBAM[16]、SK[17]等注意力模块,这些模块被融入各种网络结构中,有效地提升了分类效果。

使用SE[14]模块实现通道注意力机制之后,Momenta又在2018年提出了空间注意力模块GE[15]。如图8所示,GE[15]使用自定义的Gather和Excite模块实现了空间感受野区域的注意力机制。

2018年,还出现了另一个同时融合通道、空间注意力的注意力模块,即CBAM[16]。如图9所示,对于任意一个FeatureMap,CBAM模块先后提取通道和空间注意力信息,并分别跟相应的FeatureMap进行加权,同时实现了通道和空间注意力。

通道、空间注意力被相继引入之后,SK[17]模块又将多尺度特征这一计算机视觉领域常用的方法引入了注意力机制。如图10所示,SK模块首先使用两个不同大小的卷积核处理FeatureMap,再将结果相加,再经过一系列操作,得到了每一路的权值a和b,使用a和b对每一路FeatureMap加权后,得到最终的FeatureMap。

图7SE(Squeeze&Excitation)模块

图8GE(Gather&Excite)模块

图9CBAM模块

图10SK模块

6月19日,CVPR2022在美国举行,CVPR作为全球计算机视觉三大顶级会议之一,被誉为计算机视觉领域的“奥斯卡”。汽车之家团队在作为大会研讨会内容之一的,在Kaggle上举办的CVPR2022Sorghum-100CultivarIdentification-FGVC9(高粱品种鉴定细粒度图像分类)挑战赛中取得了第二名的成绩,实现了公司历史上的突破。

细粒度图像分类一直是计算机视觉领域的研究热点,主要难点在于细粒度标注图像的类间距离小,类内距离大导致部分图像的类别靠人眼都很难分辨,比如,此次FGVC9的比赛中,高粱品种鉴定和植物标本识别竞赛的数据需要很强的专业知识才能判定图像所属类别。如图11所示,两个圈内的同样颜色的样本之间的距离称为类内距,不同颜色的样本之间的距离称为类间距。

图11类内距和类间距

本次比赛中,主要使用了RegNetY-16.0GF作为主干网,大分辨率图像对精度的提升起到了很大作用,当将图像分辨率由512增大到960之后,精度在私榜上由84.1提升到了91.9。因此,我们相信,大分辨率图像对于细粒度分类效果提升有较大帮助。

图12SCDA

图13注意力区域随机裁剪

图14注意力区域随机裁剪

图15随机裁剪流程图

数据增强方面,除了常见的左右翻转、随机裁剪之外,还使用了谷歌在CVPR2019论文中提出的AutoAugment[19],该方法通过参数搜索,获得了在常见数据集,如CIFAR、ImageNet等,上的最佳增强策略。

PseudoLabel作为一种常用的自监督学习方法,也被广泛用于图像分类领域。每次训练结束之后,都使用训练出的最佳模型,对测试集进行预测,将预测结果作为标注信息,加入训练集,不断循环,直到测试集准确率没有明显提升。本次比赛中,加入PseudoLabel之后,私榜上精度由91.9提升到了95.1。

TestTimeAugmentation(TTA)作为一种常见的测试技巧,也被应用到了本次比赛中。数据增强除了在训练阶段可以用来避免过拟合,提升模型泛化性之外,在测试阶段也可以有效提升模型精度。

Dropout作为一种有效防止过拟合的方法,在比赛的最后阶段,dropout的加入使模型精度在私榜上由95.1提升到95.3。

Ensemble也是一种竞赛常见技巧,将不同模型预测的embedding进行加权,再使用加权后的embedding进行预测,也可以有效提升模型精度。本次比赛的最后阶段,Ensemble的加入使模型精度在私榜上由95.3提升到95.9。

汽车之家作为汽车互联网垂直领域的领军企业,一直深耕如车系识别等汽车领域的人工智能算法。车系识别目前支持识别4000多个车系,涵盖奔驰、宝马、奥迪等绝大部分常见车系,应用于主APP的拍照识车、二手车/论坛信息校验等多个内部应用。

本次比赛结束之后,车系识别模型也使用了比赛中使用的RegNetY-16.0GF,准确率提升了3.25%。如图17所示,模型的注意力区域主要集中在车头位置,因此对于同一车系内部,车头外观相差较大的车系,识别准确率较差;同样,对于不同车系,车头外观较相似的车系,也容易混淆。即图11中提到的,细粒度分类问题中常见的,类间距离小,类内距离大问题。

THE END
1.汽车论坛汽车社区车友会车生活汽车之家论坛,全球最大汽车论坛,助力全球车友交流提车经历,用车感受,车友会活动,维修保养经验,自驾游等,更有媳妇当车模,美人生活秀,论坛红人馆等专题,精彩汽车内容尽在汽车之家https://club.autohome.com.cn/
2.汽车之家2018年全年营收72.3亿元,同比增长35.4%2018年度,汽车之家净营收为72.332亿元,较2017年剔除直营业务的净营收,同比增长了35.4%。归属于汽车之家的净利润为28.710亿元(4.176亿美元),较2017年同期增长了43.4%。https://www.iyiou.com/p/93453.html
3.汽车之家发力新零售,「芒果汽车」模式2018年推向全国在当天的发布会上,汽车之家车商城还推出了擎天柱系统,这是汽车之家搭建的一个数据智能决策平台,从找准用户——对接车源——下沉渠道——丰富产品——智能物流——标准交付,一系列产品集使得上述流程和体验得以标准化实现,从而构建起线上线下互融互通的交易闭环,并帮助经销商降低运营成本,扩展销售渠道。http://www.cheyun.com/content/18804
4.2018年汽车之家热门车评人点评,谁是充值王?早期汽车之家最热门的车评人之一,一个资深的杜卡迪车迷。喜爱大众系列车型。因为艾瑞泽5事件,闫闯从迫从汽车之家离开,开办了自己的汽车栏目《闫闯说车》,风格中规中矩,风趣幽默,加上他微胖的体型,让人看了有亲近感,只是去年在某试驾会,驾驶汽车发生事故致使一位工作人员被撞身亡,过了一年后签约某车之家复出,不https://m.yoojia.com/article/8424996946877778123.html
5.php汽车之家数据api,2018汽车之家汽车品牌车型数据新鲜出炉项目需要,用python刚爬的汽车之家的汽车品牌、车型数据内含品牌logo以及车型图片。 【实例截图】 【核心代码】 9085a56e-b1de-45ac-b3aa-3f126e646879 └── carspider └── carspider ├──images │ ├── brand │ │ ├── 129302239751932500.jpg https://blog.csdn.net/weixin_39944638/article/details/115760133
6.(汽车之家)万水千山不负卿蔚揽旅行车长测完结[汽车之家长期测试]在上一期中,有不少朋友提到卤素大灯是蔚揽 380TSI 两驱舒行版的一个让人比较“耿耿于怀”的配置,毕竟在LED大行其道的今天,20多万的新车还顶个“黄灯”上路,多少让人有些难以接受,实话讲,我对这对儿卤素碗灯也有些担心,所以今天,咱们就来测它一测! http://www.360doc.com/content/18/1117/21/3496995_795563117.shtml
7.购车网汽车报价汽车之家购车网是网友的汽车之家,提供汽车报价,汽车导购,汽车团购,二手车,试驾评测,汽车维护等,是专业的网上车市,汽车网和汽车之家.http://www.ecar168.cn/
8.汽车之家汽车之家196个汽车品牌、3199个系列、38273条型号配置参数数据; 含品牌和系列图片; 2018年08月份采集更新。 字段说明: (1)品牌表 首字母 品牌ID 品牌名 Logo图片本地地址 (2)车系表 车系ID 品牌ID 车系名 Logo图片本地地址 (3)车型参数表 车型ID https://blog.itpub.net/30303165/viewspace-2220524/
9.二手车之家下载二手车之家安卓版下载二手车App是由汽车之家二手车团队精心打造,充分体现二手车之家专业优势、资讯最真实、车源最可靠,并建立了公正、严格、周密的车辆发布审核体系,为买家提供了真实可靠有保障的车源。 二手车覆盖全国300多个城市,拥有近千万用户,囊括全国数20余万辆真实二手车源,每天有近百万用户访问,近万条车源实时发布,合作商家达15http://www.appchina.com/app/com.autohome.usedcar
10.电动汽车之家,为新能源汽车而生为新能源时代而生的汽车产业服务平台,致力于为新能源汽车企业发展提供一站式服务 旗下微信公众号:NE时代新能源、智车引擎 上汽集团发布全球首款量产半固态工艺镁合金电驱壳体 汽车之心 微信公号Auto-Bit。汽车之心是一家专注智能汽车与自动驾驶的媒体和知识服务平台,定位于推动汽车与科技的融合。我们的团队由一群热https://www.d1ev.com/
11.818全球汽车夜即将高能来袭“那小子”于小彤带你一起畅玩这个2019汽车之家818全球汽车夜 播出:湖南卫视 / 芒果TV 主持人:汪涵/ 谢娜 / 李维嘉 / 钱枫 / 杜海涛 / 大张伟 地区:内地 类型:晚会 简介:“818全球汽车夜”是湖南卫视举办的首台汽车晚会,整台晚会将综艺的娱乐精神与汽车的硬核内涵有机融合,届时将“130年汽车发展史”搬上舞台,厚重的年代感赋予了“车晚”真https://www.mgtv.com/b/331025/6212594.html
12.从李想的个人角度重新理解理想汽车8000字长文从李想个人洞察理想汽车的各种打法,以及未来的可能。 一、李想为什么要造车? 在蔚来汽车成立1年之后(2015年),李想离开了他一手创建的汽车之家,成立了车和家,开始造车,他为什么会选择这个方向,没有任何官方消息,李想本人也没有公开过,但我们可以从李想这个人的角度上来分析。 https://www.dongchedi.com/article/7198064943894446650
13.理想汽车有望赴美IPO有家A股公司重仓押宝多年在拜腾、赛麟、博郡等中国造车新势力纷纷遇挫之际,理想汽车却在近日被传出有望赴美IPO。与此同时,伴随美团领投理想5亿美元消息的不胫而走,美团高层日前亦纷纷力挺理想汽车。 如果理想汽车IPO,A股谁会最开心?答案应是利欧股份,这家A股上市公司已“重仓”潜伏理想汽车好多年。 https://finance.eastmoney.com/a/202007061544535395.html