计算机是如何存储图像的?从图像的展现到图片识别!w3cschool笔记

随着python的大火,人工智能领域也在蓬勃的发展(人工智能的大火也导致了python的发展)。在人工智能的发展中,图像识别技术是里面发展得比较好的一部分技术,很多互联网大厂都在这一方面投入了很多精力并获得了不菲的成果。今天我们就通过介绍计算机图像存储的方式,来介绍一下图像识别的原理吧!

在初中物理中我们接触到三基色(红绿蓝)。三种基色的光可以合成所有颜色的光(而如果三种基色的光都没有,就没有光,就呈现出黑色),这就是我们可以看到彩色图片(显示器上的,发光的)的基础。

另外,物理学上还有三原色,是红黄蓝,三基色和三原色的区别是他们的原理,一种利用加色法(三基色)进行颜色合成,另一种利用减色法(三原色)进行颜色合成,通过减色法无法合成白色。三原色是我们可以看到的彩色图片(纸质照片,不发光,依靠反射光的)的基础

物理学上喜欢将一件物体无限的往最小方向分解,直到分解不了为止,因此我们看到了原子。在图像处理上,我们也将图片进行了分解,分解到最后,只剩下一个点,这个点就叫像素点。而一张图片,由很多很多的像素点组成,以目前常见的摄像头像素(1200万像素)为例,一张照片就有1200万个像素点。

如上图所示,每三个发光单元构成一个像素点。

有了物理基础,那么计算机只要通过数据控制每个像素点就可以了。我们上文提到过,每个像素点都有三种颜色构成,每张图片由很多很多的像素点组成,我们将像素点进行排列,就可以得到一个像素点矩阵(可以理解为一个二维数组或者一个方阵)。而每个像素点需要记录这个颜色的信息,那就又回到了物理学的范畴了。三基色调整颜色是通过三种颜色的光的发光强度不同来实现光的混合的。那么我们在每个像素点中记录每一个像素对应的rgb光的强度值,就能实现混合得到的光的颜色。

通过上述原理,数码图像最重要的格式——rgb模式就介绍得差不多了。rgb模式的原理就是通过一个二维数组来记录每个像素点的位置,每个像素点都有rgb三个属性值用来记录对应的数值(实际上应该是一个三维数组)。

在rgb模式中,每个属性值用一八位的二进制数值(也就是一字节,而一字节可以表示256种状态),一个像素点有三个这样的属性值,也就是说他可以合成256*256*256(1677多万)种颜色,也就是我们所说的真彩色。

rgb的出现是基于彩色显示屏的,在没有彩色显示屏的时代,其实使用的图片记录方式也很相似。比如以下要介绍的几种模式:

在上面我们提到了,每一个像素点都有rgb三个值。图像通道就是将单独的一个颜色拿出来的部分数据。如下图所示,一张图片可以拆分成3个通道。

当我们只选择绿色通道时,图片是这个样子的:

可以看到,在前一张图中的绿色,在只展示绿色通道的时候变成了白色(通过黑白的方式来展示这个值的强弱)。

讲了这么多,那这又关图像识别和图像处理有什么关系呢?

首先你得知道图像是什么,才能进行处理。既然图像是一个一个的像素点,那么我们就一个一个点的去理解他。我们在最开始一直提到过一个东西,就是图片是存储在一个二维数组(三维数组)里的。这种存储方式我们又喜欢管他叫——矩阵。图像识别的基础原理,就是通过矩阵的运算来判断图像是否有相似之处的。比如我有两个矩阵,他们的内容是一样的,那么计算机通过计算就可以得到相同的结果(其实更深化的讲,矩阵可以让计算机判断矩阵之中的相似区块,这部分可读者可以自行去了解卷积神经网络和特征值)。也就是说,图像识别的原理,是建立在图像矩阵上的。

图像处理就更简单了,我们既然知道了图像是怎么存储的,我们只需要对图像数据进行修改,就能对图像进行处理。

说了这么多,但却还没提到python,是因为上述的内容都是计算机原理,并不是python独家专有的。那么为什么小编在这里要提到python呢?其实是由于python的特殊性,python是现有语言里面生态比较好的,不管是机器学习还是图像处理库,python都有一套合理简单的解决方案,而且由于使用比较简单,而且也不需要追求太高的效率,很多机器学习的算法工程师都偏爱使用python进行开发。这也就是为什么现在python可以乘上人工智能的浪尖的原因了。

THE END
1.图像识别(ImageRecognition)的基本概念图像识别是计算机视觉领域的一个重要分支,它旨在识别图像中的对象、场景和特征。图像识别技术广泛应用于各个领域,如自动驾驶、医疗诊断、安全监控等。 在过去的几十年里,图像识别技术发展迅速,从基于手工特征提取的方法发展到深度学习方法。深度学习方法尤其在近年来取得了显著的进展,尤其是卷积神经网络(Convolutional Neurahttps://blog.csdn.net/universsky2015/article/details/136013603
2.什么是图像识别?图像识别的应用种类有哪些?简述:什么是图像识别?精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求。 图像识别的应用场景种类有哪些?1、通用物体和场景识别可识别超 什么是图像识别? 精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各https://www.tuidc.com/helpinfo/35905.html
3.图像识别的工作原理是什么?商业上如何使用它?51CTO博客图像识别的工作原理是什么?商业上如何使用它? 图像识别市场估计将从2016年的159.5亿美元增长到2021年的389.2亿美元,在2016年至2021年之间的复合年增长率为19.5%。机器学习和高带宽数据服务的使用进步推动了这项技术的发展。 。电子商务,汽车,医疗保健和游戏等不同领域的公司正在迅速采用图像识别。根据MarketsandMarketshttps://blog.51cto.com/u_13677412/5068369
4.什么是图像识别,图像识别的知识介绍图像识别是指利用计算机视觉技术对图像进行分析、识别和理解的过程。这种技术可以帮助计算机“看懂”图像,从而实现自动化处理、智能化判断等功能。随着深度学习等技术的不断发展,图像识别已经逐渐成为人工智能领域中的一个重要研究方向。 1.图像识别是什么 图像识别是一种利用计算机软件对数字图像进行分析、识别和理解的https://www.eefocus.com/baike/1545801.html
5.ocr图片识别技术是什么?OCR的作用有哪些?可以放进口袋的扫描大师 ocr图片识别技术是什么?OCR的作用有哪些? ocr图片识别技术存在于很多地方,例如的银行的人脸识别系统,二维码识别系统。福昕全能王也运用了ocr图片识别技术进行工作,大家可以使用福昕全能王进行身份证的识别。 ocr图片识别技术是什么? ocr图像识别,是指利用计算机对图像进行处理、分析和理解,以识别https://www.foxitsoftware.cn/scanner/jiaocheng/691.html
6.图像识别与目标检测的区别是什么?人工智能通常情况下,图像识别的任务是对整个图像进行分析,输出图像包含的物体类别。例如,给定一张包含猫的图像,图像识别的任务是判断这张图像中是一只猫。 目标检测:目标检测是指在图像中找到并标记出物体的位置,同时识别物体所属的类别。目标检测不仅可以告诉我们图像中有什么物体,还能告诉我们这些物体在图像中的位置信息。https://developer.huawei.com/home/forum/hwc/thread-0274147063516124022-1-1.html
7.图像识别是什么意思应该怎么翻译科学技术名词规范用词图像识别 英文翻译image recognition 名词定义利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。 所属学科测绘学>摄影测量与遥感学 名词审定测绘学名词审定委员会 见载刊物《测绘学名词(第三版)》 科学出版社 公布时间2010年 https://mkeji.911cha.com/Z3U1bw==.html
8.什么是无人机图像识别技术什么是无人机图像识别技术 随着科技的不断发展,无人机巡检已经成为了现代工业领域中一种常见的作业方式。无人机利用高空俯瞰的优势,可以快速准确地对设施进行巡视,提高了安全性和作业效率。然而,传统的无人机巡检仍然面临着一些挑战,例如巡检范围广、时间长、人工处理图像等问题。因此,图像识别技术的应用成为了解决https://www.wlzni.com/h-nd-896.html
9.计算机识别图像的原理是什么图像是由很多具备色彩种类、亮度等级等信息的基本像素点所构成的。计算机初始状态只能识别像素点上的基本信息,这个和生物的视觉是一样的,生物之所以可以分辨物体是由于生物神经系统对原始图像处理后的结果。而计算https://edu.iask.sina.com.cn/jy/37izahSNF4V.html
10.图像识别技术(1)什么是图像识别? 图像识别,又称为计算机视觉,是指利用计算机和人工智能技术对图像进行分析和理解,以自动识别和分类图像中的对象、场景、模式等信息。它是计算机视觉领域的一个重要研究方向。 (2)图像识别的发展过程 图像识别的发展过程可以追溯到计算机视觉的早期研究。以下是图像识别发展的主要里程碑和阶段: https://nic.hnuu.edu.cn/10043/2023/0029474.html
11.什么是计算机视觉?IBM计算机视觉需要大量数据。 它一遍又一遍地运行数据分析,直到能够辨别差异并最终识别图像为止。 例如,要训练一台计算机识别汽车轮胎,计算机视觉需要为其输入大量的轮胎图像和轮胎相关数据,供其学习轮胎差异和识别轮胎,尤其是没有缺陷的轮胎。 这个过程会用到两种关键技术:一种是机器学习,叫做深度学习,另一种是卷积神经网络https://www.ibm.com/cn-zh/topics/computer-vision