对抗样本为什么重要:未解决的研究问题与真实的威胁模型腾讯云开发者社区

编译:李雷、林安安、宋欣仪、周素云

这篇博文是CatherineOlsson在的两次短篇演讲的基础上撰写的,一次是2018年11月在人工智能合作伙伴会议上,另一次是2019年1月在波多黎各的通用人工智能(AGI)会议上。

首先让我解释一下对抗样本是什么意思,用一个被很多记者和这类主题的论文会引用的例子,就是假设“人们在停车标志上贴上贴纸会导致撞车”,通过做一个现实世界的威胁模型可以说明为什么对抗性样本引起。然后我会先通过典型小扰动对抗样本构建一个未解决的研究问题,与现实世界问题建立真实(但不那么直接)的联系,从而得出一些概念性证明。

对抗性样本是旨在导致机器学习模型出错的输入。

常见的对抗样本(但不是必要的)是通过对正确的输入样本进行修改来构建的,这些输入有时被称为“ε-球对抗性样本”或“小扰动对抗样本”。

例如,如果你有一个图像分类模型,并且它能以相当高的置信度(57.7%)正确地对这张图片作出熊猫的分类,但事实上可以这张图片中每个像素变化一点点得到一张新的图片,这样它虽然看起来仍是熊猫,但却会被图像分类模型以极高的置信度(99.3%)错误地识别为长臂猿。

在稍微改变像素之后,新图像被以极高的置信度错误地分类。

值得注意的是,小扰动对抗样本不是深度学习所特有的,也不是特定模型才有的问题。在某些已知的情况下,几乎所有已知的机器学习模型都容易受到高维输入对抗样本的影响,现在还没有很好的解决方案。

我们已经知道机器学习(ML)模型容易受到对抗样本的影响,因此人们可能很自然地担心在对抗样本会对现实世界产生什么样的影响。

举个例子,假设你正在设计一款自动驾驶汽车,你希望它能够识别停车标志。当你知道抗样本后,你就会很好奇这是否会影响你的车。

如果你正在设计一款可以识别停车标志的自动驾驶汽车,你可能想知道对抗样本是否会导致车辆不能正确识别停车标志。

我是一名负责研究工作的工程师,不做系统设计或部署,因此在分析模型在现实世界中如何发生错误方面我不是专家。但我从事计算机安全工作的朋友和同事教给我的一个方法,是问“你的威胁模型是什么?”

让我们尝试着把这个框架应用到实际问题中。

在前面的自动驾驶汽车例子中,让我们想象一下,我们的目标是让汽车能在“路口”停车标志前自动停下来。即使有人在停车标志上贴了一个奇怪的故障贴纸,导致它会被错误识别,我们仍然希望车子可以识别。我们列出所有可能会威胁到我们系统的不利因素。例如,雾天、雪天、停车标志被恶意涂抹或者交叉路口施工等情况。

我们的问题清单应该包括停车标志已经倒下的情况。

如果停车标志倒在地上,那么你的车就可能会撞车。这种情况比与原标志很相似的小扰动对抗样本更容易出现交通事故。

总之,我想说的是,如果有人在停车标志上贴上一张故障贴纸,并且任何标准视觉系统都因此检测不到停止标志,那么一辆完全依赖于该视觉系统的汽车很可能会因检测不到停车标志而开入迎面而来的车流,发生碰撞。如果汽车是这样设计的,错误分类的停车标志会导致汽车碰撞,那么在现实世界中很可能会发生类似情况。

但我还找不到一个真实的例子,真有这样的破坏分子去制作和贴贴纸。不仅仅是因为它只是种假设,而是破坏分子实现其目标的最可能的方式是未知的。虽然只是想象,但如果想要人为的造成车祸,这便是一个既简单又经济的方式。

我并不是想说明,“不要再担心了!机器学习模型非常严密和精准!“,我的观点恰恰相反,现实问题往往比一张贴纸的对抗样本更糟糕。

如果我们的目的是让汽车始终停下,不仅仅是在对抗性标志存在的情况下,甚至是不存在或看不见停车标志的情况下。这意味着我们不能只根据道路标志检测决定何时停在十字路口。威胁模型告诉我们,仅使用一种检测模型不能准确进行安全关键性分析。

所以现在我们要提出一个非常有趣的问题!如何在不使用道路标志检测的情况下识别需要停车的路口?我们要利用GPS和地图数据吗?在经过没有“停车(stop)”或“让道(yield)”标志的交叉路口时要格外小心吗?

考虑到威胁模型,我们意识到这个问题比我们想象的更严重。我们很难强化视觉模型使它能抵抗小扰动对抗标志。为了实现我们的目的,必须彻底放弃“完全依赖标志检测系统”。

两个最不可抗拒的原因:

一:这是一种概念性证明(ProofofConcept),即某种问题存在的无可辩驳的证明。由于很容易找到小扰动对抗样本,我们可以肯定地说,如果你的系统安全性的前提是分类器永远不会出现明显错误,那么这个前提就是错误的,你的系统是不安全的。

现在的图像分类器甚至不能正确区分鸟类和自行车的图像。

我想强调的是,制造小扰动并不是找到错误分类的样本的唯一方法。还可以用其他方法来制造错误,例如尝试随机转化和旋转图片,或者使用不同的角度或不同的光照效果。

但是,由于小扰动对抗样本的存在,我们就可以找到更明显的错误。

除了一个人有意地通过错误的输入来寻找错误的情况外,任何具有干扰因素的选择都会在无意中发生错误搜寻(例如测试数千个输入的样本以查找哪些点击数最多或最赚钱)。

尝试随机转化和旋转,或者使用其它角度或光照效果,图片识别都会发生错误

虽然这并不是一个令人信服的观点,即“小扰动”设置是研究稳健性的最佳或唯一设置,但我仍深深为之着迷。

这基本上表明对抗样本作为一个尚未解决的研究问题,它不仅可以作为一系列可证明问题的概念性工具,还可以被用于处理有意义的现实问题。

我倾向于将对抗样本视为一种范式(在库恩意义上),可用于演示和研究机器学习系统中稳健性的失败,并且进一步探索解决方案。虽然它有其作为范式的局限性,但我很高兴的看到机器学习研究人员通过开发和传播新的和改进的范式来迭代和完善模型稳健性方法。

未解决的研究问题不等于现实世界的威胁模型(但两者都很重要)

具体来说:

在已生成的系统中,你还会碰到很多比未解决的研究问题更加基本更基本的问题。

“但这些问题早就存在了!”或“我们还有比这更基本的问题!”之类的说法并不是假装一切都会好的理由。对抗样本更应该作为一种提醒,提醒我们仔细规划,检查假设,并充分考虑一切因素。

如果你正在开发模型,无论它是否包含机器学习,你都需要一个实际的、具体的计划来预测和减少负面结果。

如果你是一名研究员,我会督促你不要通过声称它确实代表一种现实威胁来证明你对玩具问题的研究是合理的,除非你同时提供了威胁模型。我更愿意看到理由解释为什么你的玩具问题是一个有效的概念理解试验台,以及为什么我们可以期望这些概念能够进一步阐明现实问题。

如果你正在与人聊对抗样本,我强烈建议你和对方解释清楚这其中的区别!

这些想法并不是我新提出和独有的,很多人以前都说过这一点。我主要受到以下研究的启发:

Gilmeretal.2018“MotivatingtheRulesoftheGameforAdversarialExampleResearch”UnrestrictedAdversarialExamplesChallenge&Brownetal.2018Demski2018“EmbeddedCuriosities”(Specificallytheline“it’stemptingtodrawadirectlinefromagivenresearchproblemtoagivensafetyconcern”)

THE END
1.个性车标1. 特斯拉(Tesla):简洁而现代的Logo设计凸显了这家电动汽车制造商的未来感。其独特的“T”字形车标在全球范围内广为人知。 2. 沃尔沃(Volvo):标志性的铁锤形状Logo代表着公司的精湛工艺和耐久性。其简约的设计强调了品牌的北欧精神。 3. 阿尔法罗密欧(Alfa Romeo):浪漫而独特的logo结合了华丽的流线造型与浪漫精致https://www.029car.cn/zhqc/202411/588486.html
2.这些新出的车标LOGO,在路上你能认出几个?东风奕派品牌成立于2023年11月,是东风汽车打造的新能源汽车品牌,车标LOGO像两个箭头,据悉这个车标的设计灵感是“双T”的组合,取自英文单词Technology(科技)和Transformation(变革)的首字母,寓意着品牌进军新能源领域的创新和发展,当前在售车型有eπ007(售价13.16-19.96万)、eπ008(售价20.66-21.66万)两款车,车型在https://www.dongchedi.com/article/7442626660274373183
3.车模十大品牌火车模型汽车模型哪个品牌好美太芭比(上海)贸易有限公司,风火轮创建于1966年美国,隶属于美泰集团旗下,全球知名车模品牌,车身上炫丽的图案以及夸张的造型是其标志性的设计,此外以大盒组合广东彩珀科教文化股份有限公司,彩珀科教是一家国际化玩具品牌运营商,主要从事各类合金车模、塑料玩具的研发、生产,是多个国际知名汽车品牌指定研发、生产授权企https://m.maigoo.com/best/28531.html
4.玩具图标(Game,pikachu,pokemon,tamagochi,toyicon)爱给网提供海量的图标库资源素材免费下载, 本次作品为png,ai,icns,ico,svg 格式的游戏, 皮卡丘, 口袋妖怪, 塔马戈奇, 玩具图标(Game, pikachu, pokemon, tamagochi, toy icon), 本站编号47455500, 该图标库素材大小为20k, 该素材已被下载:1次,许可范围为可商用,署名,协议名称为CC署名3.0, 作者为Alpár-Ehttps://www.aigei.com/item/game_pikachu.html
5.湘少版小学英语36年级单词6.玩具toy [t] 7.卡片card[ka:d] 8.蛋糕cake[keik] 9.图画;图片pic-ture [?p?k-t] 10.笔记本note-book [?nt-b?k] 三年级下册英语单词音形义详解unit1 1)glad 高兴的[gl?d] 2)see看见[si:] 3)again再次[?'gen] 4)fine好的[fain] 5)too也[tu:] 6)now现在[nau] 7)eveninghttps://m.360docs.net/doc/e6866107.html
6.8点1氪丨李佳琦21年净收入超过逾90%A股公司;俞敏洪就“切片带货宝马集团宣布,将在英国工厂投资6亿英镑,在2030年前实现其标志性品牌Mini的纯电动化。宝马集团称,牛津工厂正准备从2026年起生产两款全新的纯电动MINI车型,即MINI Cooper三门版和紧凑型跨界车MINI Aceman。(界面新闻) 日本东京电力公司11日结束第一次核污染水排海 https://36kr.com/p/2428206264247048
7.27个汽车品牌背后的故事斯巴鲁在日语中的意思是“昴”,其企业标志是昴宿星团的六连星(在希腊神话中,阿特拉斯与普勒俄涅其实有七个女儿,而不是六个),并且也是斯巴鲁汽车的标志。 ? 丰田 创始人丰田喜一郎的名称。最初称为Toyeda后更名为Toyota。 三个椭圆的丰田标识中的大椭圆代表地球,中间由两个椭圆垂直组成一个T字,代表丰田公司。象https://www.logonews.cn/1040.html
8.八年级政治下学期期末试卷及答案(通用7篇)、手工业和资本主义工商业社会主义改造的基本完成,标志着在我国初步建立。(4分) (3)图③中,人民群众高举“人民公社好”的牌子。据当时报道,短短两三个月7. You have more toy animals than I. But ___ are much better. A. IB. myC. mineD. me 8. The police station is five kilometers __https://www.360wenmi.com/f/filea55t55gx.html
9.小型停车场图片小型停车场素材小型停车场图片下载物流公司汽车储运场 停车场 物流公司汽车储运场 电车停车场和人物微缩场景 隐私 物流公司汽车储运场 车在停车场驶出 屋子建筑矢量概念运营插画 EPS Toy-ronto微型的交通 仓库停车场,鸟瞰图 的私人车道上。在建筑物的外部,停车是非法侵入的标志 创意微距模型静物摄影 探索车祸后的基本步骤-从检查事故损害到了解汽https://www.vcg.com/creative-image/xiaoxingtingchechang/
10.重要亚马逊新增2个禁售品类8个售前审核品类!涉及12个站点图片来源:图虫创意 近期,不少美国站、加拿大站、英国站、法国站、意大利站、德国站以及西班牙站卖家陆续收到了亚马逊合规政策要求邮件,包括美国站对于“发光二极管 (LED) 头灯转换套件”品类,加拿大站对于“木炭”品类,英国、法国、意大利、德国以及西班牙对于“电动交通设备”、“电动交通设备配件”和“儿童玩具”品类,https://www.cifnews.com/article/151179
11.超市l素材超市l图片超市l素材图片下载设计网站 > 设计素材 >超市l图片共84 个 超市l素材 超市l的相关推荐: logologo设计logo标志设计超市宣传单超市海报logo样机公司logo公司logo标志设计超市门头抖音logo汽车logo店铺logo天猫logo图标logo商标logo立即下载 超市购物车 立即下载 绿色黄色创意LOGO生鲜蔬果菜市超市LOGO超市logo 立即下载 超市标志超市LOGOhttps://www.51miz.com/so-sucai/2821998.html
12.PixarAnimationStudiosI N T H E A T R E S 2 0 2 5 At Pixar, we are proud of our tradition of creative and technical excellence and are always looking for talented people to enrich our work and our community.Learn more I N T H E A T R E S 2 0 2 6 https://www.pixar.com/
13.把九号标志放在图书馆前面的翻译是:FrontNinethsignsinyour赖安喜欢探索他的其他艺术性的天分,例如作曲、爵士乐&蓝色钢琴、数字式媒介和爱好例如modding的个人计算机比赛和研究老肌肉汽车。 乘员组也铸造了他小组的正式头发设计师,他经常裁减并且称呼他们的头发。[translate] aARE YOU GOING TO BUY A TOY TRAIN 是您去买玩具火车[translate] http://eyu.zaixian-fanyi.com/fan_yi_2575815
14.采用光声色或其他标志等作为传递组织和技术信息的目标,以保证改变人们的宇宙观,动摇基督教会宣扬神创世界的理论基础,是近代自然科学诞生的重要标志的学说是( ) AIt is just __ toy. A. the B. an C. a D. 不填 查看完整题目与答案 根据2004年https://www.shuashuati.com/ti/a95ab5ffde4748de8cd4b0ed9ca90b11.html?fm=bd58a9d5c19338ce24216c991efdcb1f42
15.博客中文翻译2022(二百四十)图片来自Pixabay 虽然在开发最新最伟大、最先进、具有大量参数的深度学习模型方面取得了很多进展,但在解释这些模型的输出方面却付出了很少的努力。 在2020 年 12 月的一次研讨会上,Gradio 的首席执行官阿布巴卡尔·阿比德(Abubakar Abid)通过使用提示“两个 __ 走进一个 __”检查了GPT-3生成宗教文本的方式在观察了https://blog.csdn.net/wizardforcel/article/details/143137094
16.MongoDB权威指南全绝不原创的飞龙其原因是人类创造的独特号码,如汽车注册号码,有一个令人讨厌的变化习惯。例如,2001 年,英国实施了与以前例如,如果您想要存储个人资料图片或声音剪辑,那么 4MB 的空间可能会超出您的需要。另一方面,如果您如果您希望使用除了/data/db或C:\data\db之外的目录,那么您可以在执行服务时通过使用--dbpath标志来https://www.cnblogs.com/apachecn/p/18443273
17.江阴市青阳第二中学初一英语期中复习:重点词组句子(译林牛津版七108.坐在白色小汽车里的男人 the man in the white car 109.在树后的女孩 the girl behind the 16 看标志 look at the sign 17 为什么不? Why not (do sth.)? 18 我明白了 I see. at the toy shop near our shop 118 生日快乐 happy birthday 119 穿着一条蓝牛仔裤 https://www.ruiwen.com/en/news/9729.htm
18.商标类别标仔知识产权商标注册商标查询商标申请340031 火柴架 Match holders 与第八版及以前版本1402贵重金属火柴盒架,贵重金属火柴盒交叉检索。 340035 火柴盒 Matchboxes 与第八版及以前版本1402贵重金属火柴盒架,贵重金属火柴盒交叉检索。 安全火柴 贵重金属制火柴盒 贵重金属制火柴架 硫磺火柴 石蜡火柴 340002 雪茄及香烟烟嘴上黄琥珀烟嘴头 Tips of http://www.biaozai.com/kinds_search.php
19.HozukiKaedeHozukiMomijiKeychainBagPendantToyKey动力动漫钥匙扣女Pochita钥匙扣男钥匙圈亚克力汽车钥匙圈派对吊坠日本Cos女孩礼品链锯男 ¥3.61 - ¥5.06 最低起订量: 10 pieces 教小心灵教师节钥匙扣礼品不锈钢背包配件需要大心 ¥4.33 - ¥5.78 最低起订量: 10 pieces 最新设计东京复仇动漫Cosplay不锈钢印花标志图片创意个性时尚 https://www.alibaba.com/product-detail/NEW-Anime-Onii-chan-Wa-Oshimai_1600842027745.html
20.人文地理学实习报告6篇(全文)3.22植物群落的属性标志及其调查方法 群落分层结构:乔木层、灌木层、草本层、苔藓地衣层四个基本层。乔木(二)闽东方言系(Mingten Dialect System/ Ming Toyng Ng?),实际上是闽东、闽中、闽北、莆仙等闽(1)工业地理,包括重工业(柳工),轻工业(两面针),汽车工业(五菱),化学工业(柳化)。分别了解不同工业https://www.99xueshu.com/w/filej99d275c.html