计算机视觉识别的工作方式主要通过以下几个步骤:
1.图像预处理:对图像进行预处理,如去噪、校正图像像素等,以确保图像质量。
2.特征提取:通过各种图像处理技术,从图像中提取有用的特征信息,如边缘、轮廓、颜色值等。
4.识别结果输出:根据分类结果,输出识别结果,如图像中的物体类型、人脸识别等。
每一个步骤都需要使用合适的算法和技术,才能确保视觉识别输出结果准确性和高效性。
下图左侧是亚伯拉罕·林肯灰度图像缓冲区的简单插图,每个像素由一组8位数字表示,范围从0(黑色)到255(白色),右侧是识别图像时软件识别出的不同的颜色值。
计算机视觉识别的主要应用功能
1、图像分类
不过由于单一目标识别对深度学习算法来说是正确率最高的,所以实际上很多应用会先通过目标检测方法找到该目标,再缩小撷取影像范围进行图像分类。所以只要是目标检测可应用的范围,通常也会使用图像分类方法。
图像分类,需要先对本地图像进行边框标记,这个操作需要手动标记才能完成,这样就催生出一个职业-人工智能标注师,比如下图左侧是原始图片,右图是被标记过的图像,就会把它标注到猫的分类中。
2、目标监测
一张图像内可有一或多个目标物,目标物也可以是属于不同类别。算法主要能达到两种目的:找到目标坐标及识别目标类别。
简单来说,就是除了需要知道目标是什么,还需要知道它在哪个位置。
3、语义分割
实例分割是语义分割的升级版本。它不是将相同的像素值分配给同一类中的所有对象,而是分段并显示同一类的不同实例。如果在图像中检测到多个相同的对象,则会相应地对其进行标记,如下图所示,绵羊1、绵羊2和绵羊3会被单独分割识别出来,它通常用于计数。
流行的计算机视觉库和框架
边缘设备部署
OpenCV
我们的合作伙伴alwaysAI将OpenCV构建为边缘计算环境的核心部分。这意味着在每个alwaysAI应用程序中,您都可以添加导入cv2并在您的应用程序中使用OpenCV。alwaysAI围绕OpenCV构建了一套工具,以实现端到端流程的无缝衔接,并解决了使用边缘设备时一些常见痛点。
TensorFlow是一个端到端的开源ML平台,能够执行无数的任务,包括计算机视觉。TensorFlowLite允许您在移动和边缘设备上运行模型,而TensorFlowJS适用于Web。它运行在Windows,macOS和WSL2上,支持Python,C,C++,Java等。
SeeedreTerminal
使用SeeedreTerminal设备快速部署TensorFlowLite框架,具体方法请看下面的地址:
reComputerforJetson
审核编辑:刘清
原文标题:边缘计算|什么是视觉识别?如何在边缘设备部署视觉识别?
长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层(0731-88081133)