“以图搜图”的奇葩用途深度

你在扫街的时候,突然发现某撩妹达人穿了一身炫酷的T恤。

你收到朋友送来的生猛红酒,好奇这到底是百年窖藏还是山寨葡萄糖。

你在编辑文案的时候,一张非常适合的图片却挂着水印,你需要一个清晰的版本(请支持正版。。。)

以图搜图就像一个“痒痒挠”,能够到文字搜索难以企及的痒点。这让我们对这种搜索方式的结果抱有很高的期待。它让很多人能透过互联网的森林,感受到若隐若现的人工智能灵魂。这可能正是人们对这种技术好奇的原因。

【图像识别的应用场景】

【陈杰】

视觉的秘密

人的视觉原理很简单:物体反射自然光在眼中成像。

如果面前是一面巨大的白墙,你很难看出其中的细节。但是如果在墙面上画了一只鸟,你一眼就可以分辨出来。

你之所以能看到眼前这个鸟,是因为你的视觉认为它是一个“斑点”。通俗来讲,就是某个东西和周围的物体产生了反差。

陈杰如此解释视觉的原理。

所以在你的眼中,眼前的场景是由一些“刺激点”组成的。这些便是图像的“特征点”。而如果机器能够和人一样准确地识别两张图片中相同的“特征点”,就可以实现以图搜图这种高科技了。

但对于人眼来说易如反掌的刺激点,怎么用机器语言记录呢?

陈杰告诉雷锋网,在机器眼中,每一个特征点都会被记录为描述性的数据,这些数据包括像素矩阵,颜色、纹理、梯度、形状分布等

在博云视觉的算法中,每张图片会被提取1000个左右的特征点,而这些特征数据的大小约为2Kb-4Kb。

虽然背后的算法极其精细,但是粗略来说,对数据库中的每张照片提取特征之后,图像搜索就可以开始了。

用户提交搜索的查询图片,系统会自动提取图片上的特征点,再用特征点和数据库中的图片特征做对比,两个图片的特征点匹配越多,系统就认为两张图片最为相似。于是,用户会得到一个

按照相似度排序的搜索结果列表。

陈杰说,“一般两张图片拥有10个匹配的特征点,我们就可以认为他们是相似图片。”

警察叔叔的利器

一般童鞋可能想不到,这个高科技解放了警察叔叔。

对于重大案件来说,嫌疑人的汽车往往是破案的重要线索。于是如何从数以亿计的监控图像中找出某个特定汽车,成为了警察叔叔的噩梦。

以往的方法是:警察叔叔们趴在电脑前,连续看上一两个月监控视频,才能基本找到所有包含目标汽车的监控图像。(由于汽车的移动,所以一般会在多个监控图像中发现目标。)

但是如果使用图像识别技术,只要依靠一张样本,就可以在几小时之内,基本找到所有目标图像。

陈杰告诉雷锋网,在和某地公安的联合实验中,在搜索结果的前200位中,包含了正确结果的90%。也就是说:如果目标共出现在50张图片中,那么在前200位结果中包含45个。

【利用监控图片搜索指定汽车】

“增强现实”的工具

但是,一辆车一定是以各个角度和姿态出现在监控图像中,那么识别系统为什么可以做出相对准确的识别呢?

陈杰表示,使用这种技术做图像识别,需要面对三个重要的干扰因素:

光照

由于同一个物体在不同光线下,特征点的像素呈现出的数据会有很大的差异。所以好的算法必须能够排除光线的干扰,提取物特征点最基础的信息。但是不可否认,在极端弱光(例如黑夜)或者极端复杂光线(例如酒吧)下,特征的辨识力会降低。

几何变换

一辆汽车从各个角度来看,有很大的区别。根据物体的拍摄角度不同,特征信息一定会发生变化。然而人眼仍然能够识别出两个不同角度的图像是同一物体。对于机器识别系统来说,则需要根据不同的角度变换进行计算,这样就能尽可能做到物体平移、旋转等几何变换之后依然可以进行准确匹配。

距离

如果物体在画面中位置过远,就会变得更小,这样图像上的细节就会大量丢失。这样的话,一张近视图和远视图就很难被机器认定为相似。为了解决这个问题,陈杰和团队采用了一种基于尺度空间理论的方法:将每张图片以不同的量级进行高斯模糊,这个动作是为了模拟人眼在不同距离看到的物体。在这些模糊图片进行特征提取和比对,就可以匹配距离镜头不同距离的同一物体。

解决了“距离”这个棘手的问题,这种图像识别的方法就可以完美地应用在增强现实的游戏中。在这种情况下,应用场景往往是预设而且固定的,所以游戏的提供商可以把真实的场景通过拍摄不同角度和远近的照片,然后录入数据库。玩家在进行游戏的时候,会佩戴带有摄像头的眼镜,这种情况下,图像识别系统就可以对玩家眼中的“景物”和数据库中的图片匹配,理解玩家的具体位置,从而在眼镜中加入各种奇幻的特效

蕾丝边的福音

你知道蕾丝吗?我自己都没有想到这个技术可以用于蕾丝制造行业。

陈杰说。

这种情况下这个蕾丝花纹搜索引擎就出现了,它对接了买家和卖家。这种搜索引擎,需要的恰恰是这种图像识别技术。

【蕾丝搜索引擎】

以驴找驴vs以驴找马

图像识别同样可以拯救红酒控。

陈杰告诉雷锋网,博云视觉服务的客户中,就有一个专门帮用户识别酒标的App。“这个团队拥有一个巨大的酒标数据库。可以通过拍照搜索的方式,获得很多奇特红酒的详细信息。”

寻找酒标是尺度空间理论图像识别的典型应用方式。因为它符合一个一个规则:在数据库中找到完全相同的图片/物体。用通俗的话来说,就是“以驴找驴”。而在我们的搜索需求中,还存在一种“以驴找马”的需求,它的目的是搜索相似图片/物体。

【各类红酒标】

陈杰告诉雷锋网,以驴找马这种需求,目前更多地使用区别于“尺度空间理论识别”的“机器学习”的技术路线,这也是普通人更熟悉的一种技术。

机器学习,主要原理是给一个运算力强大的计算机群学习大量的数据,然后让机器提取出这一类素材的内部规律,用这类规律帮人类工作。例如不久前战败李世石的阿法狗,使用的就是机器学习的方式。

【以驴找驴的搜索方式,可以更好地发现完全一致的图像结果】

这种技术在资源充足的情况下,后期会出现惊人的能力。但是它需要两个重要的因素:

1、用来“喂养”系统的巨大数据样本

“这种技术就像火箭发射,需要足够的燃料(数据)和强大的发动机(计算机性能)”陈杰说,

所以在很多场景中,“尺度空间识别”和“机器学习识别”需要结合起来,才能产生最优的效果。

有一点确定无疑,那就是随着图像识别领域的技术爆发,这种“解痒”的技术究竟可以用来解决很多具体的问题。正如“蕾丝边问题”一样,在很多情况下,没有人会把这种技术和具体的问题联系起来。

或者说:对科技的魔力,我们仍然懵然无知。

新民晚报官方网站xinmin.cn2024AllrightsreservedTech-vm-2-10

THE END
1.模板匹配——图像识别概述文章浏览阅读129次,点赞9次,收藏2次。图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从1950年开始的,一般是识别字母、数字和符https://blog.csdn.net/weixin_42291376/article/details/143456894
2.机器视觉系统高效的图像识别与处理技术机器视觉系统作为一种高效的图像识别与处理技术,在现代计算机视觉领域占据了重要地位。它通过模仿人类的视觉功能,能够分析和理解图像中的信息,为工业自动化、医疗诊断、交通监控等多个领域提供强大的支持。那么,我们如何才能提高这套复杂系统的性能呢? 如何有效学习图像特征? https://www.bcioqpgw.cn/cai-dian/349872.html
3.机器视觉技术人工智能在图像识别和分析中的作用人工智能的范围无处不在,它正在改变我们生活的方方面面,尤其是在图像识别和分析领域。机器视觉技术是人工智能的一个重要分支,它使得计算机能够通过摄像头或其他传感器捕捉到世界,并理解其中所包含的信息。 1. 什么是机器视觉? 机器视觉是一门科学与工程,旨在为计算机系统提供“看到”能力,使它们能够处理、解释并从图像https://www.iktpfbwjvk.cn/zhi-neng/552291.html
4.java版图像识别mob64ca12d94299的技术博客java版图像识别,#Java版图像识别的科普图像识别技术是计算机视觉领域中的一项重要任务,它使得计算机能够“看懂”图像并从中提取出有用的信息。在Java中,我们可以利用一些常用的库来实现图像识别功能。本文将介绍一种简单的图像识别实现方法,并通过代码示例阐明其核心概https://blog.51cto.com/u_16213336/12722140
5.什么是图像识别与理解?图像识别与理解是指通过对图像中各种不同的物体特征进行定量化描述后,将其所期望获得的目标物进行提取,并且对所提取的目标物进行一定的定量分析。比如要从一幅照片上确定是否包含某个犯罪分子的人脸信息,就需要先将照片上的人脸检测出来,进而将检测出来的人脸区域进行分析,确定其是否是该犯罪分子。https://www.shuashuati.com/ti/76cb0bcf35ab43f68bd363ad77bd7b67.html
6.什么是图像识别,图像识别的知识介绍图像识别是指利用计算机视觉技术对图像进行分析、识别和理解的过程。这种技术可以帮助计算机“看懂”图像,从而实现自动化处理、智能化判断等功能。随着深度学习等技术的不断发展,图像识别已经逐渐成为人工智能领域中的一个重要研究方向。 1.图像识别是什么 图像识别是一种利用计算机软件对数字图像进行分析、识别和理解的https://www.eefocus.com/baike/1545801.html
7.机器学习零基础?手把手教你用TensorFlow搭建图像识别系统(一)导语:这是Wolfgang Beyer的一篇博文,详细介绍了如何使用TensorFlow搭建一个简单的图像识别系统。本篇主要介绍图像识别和本试验中会遇到的一些概念。 如果你觉得这是一篇简单介绍人工智能、机器学习和深度学习的文章,那就错啦。你可以在网上搜罗到一大堆相关话题的文章,而这篇文章也并不是讨论人工智能是否会奴役人类或抢走https://www.leiphone.com/category/ai/Y4uyEktkkwb5YhJM.html
8.科学网—如何用Python和深度神经网络识别图像?你早已听说过自动驾驶汽车的神奇吧?没有机器对图像的辨识,能做到吗? 你的好友可能(不止一次)给你演示如何用新买的iPhone X做面部识别解锁了吧?没有机器对图像的辨识,能做到吗? 医学领域里,计算机对于科学影像(如X光片)的分析能力,已经超过有多年从业经验的医生了。没有机器对图像的辨识,能做到吗? https://wap.sciencenet.cn/blog-377709-1091943.html
9.ni图像识别linuxninilinux腾讯云开发者社区图像识别之augmix augmix: https://github.com/google-research/augmix 5.3K10 图像识别——突破与应用 最近,图像识别领域发布了白皮书,简单翻译一下做个总结。--- [2]图像识别图像识别的目标是识别图像中的对象和人,并理解上下文。图像识别属于机器知觉,机器知觉是机器学习(ML)和人工智能(AI)的一部分。https://cloud.tencent.cn/developer/information/ni%E5%9B%BE%E5%83%8F%E8%AF%86%E5%88%AB
10.ocr图片识别技术是什么?OCR的作用有哪些?可以放进口袋的扫描大师 ocr图片识别技术是什么?OCR的作用有哪些? ocr图片识别技术存在于很多地方,例如的银行的人脸识别系统,二维码识别系统。福昕全能王也运用了ocr图片识别技术进行工作,大家可以使用福昕全能王进行身份证的识别。 ocr图片识别技术是什么? ocr图像识别,是指利用计算机对图像进行处理、分析和理解,以识别https://www.foxitsoftware.cn/scanner/jiaocheng/691.html
11.图像识别模型袋鼠社区图像识别模型 - 图像识别模型是专门设计用于处理图像数据的机器学习模型,其目的是从给定的图像中提取特征、识别特定对象、场景、行为、属性或进行更复杂的视觉理解任务。这类模型广泛应用于诸多领域,如安防、自动驾驶、医疗诊断、零售分析、社交媒体、遥感、艺术与文化遗https://www.dtstack.com/bbs/article/16443
12.图像识别和chatgpt图像识别和ChatGPT:当AI遇上AI 当图像识别技术和机器学习交织在一起,我们迎来了一个新的智能时代。图像识别算法的发展和应用为我们提供了更多的机会,使我们能够以前所未有的方式与计算机进行交互https://tool.a5.cn/article/show/25254.html
13.图像识别图像识别,什么是图像识别,图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用,应用场景,包括电子商务,游戏,汽车,制造业和教育。现阶段图像识别技术一般分为人脸识别与商品识别,人脸识别主要https://baike.c114.com.cn/view.php?id=28373-30A559E6
14.计算机视觉与图像识别考试.pdfD.实现图像超分辨率的技术通常不直接依赖于这些方法 9.计算机视觉中的场景理解技术中,哪种技术可以用于分析和理解图像中的内容及其上下 文关系? A.语义分割 B.实例分割 C.人脸识别 D.目标检测和识别 10.在计算机视觉中,哪种技术可以用于将二维图像转换为三维立体信息? https://m.book118.com/html/2024/1002/8074076035006132.shtm