机器学习—车辆种类图片识别hhmo

随着城市化建设不断发展,我国对交通建设的需求也不断增长,成为了世界上在交通领域基础设施建设最快的国家之一,但车辆管控问题、道路交通问题、车辆违章问题等层出不穷,很难做到全面、有效的管理。马路上的摄像头每天拍摄下的许多汽车照片,怎么在大量的图片中筛选出是汽车的图片,并且识别出车辆种类,这时车辆识别就显得尤为重要。

1.本选题采用的车辆不同种类数据集来自于网站,总共包含十种不同的车辆,分别为公交车、房车、消防车、卡车、吉普、小型客车、赛车、SUV、出租车和货车。在训练之前,把同种类型的车辆图片放到一个相同的文件夹并命名分类,在训练时因为图片像素大小不同而采用进行数据处理。

2.选题采用的机器学习框架为:使用的anaconda3环境下的pytorch深度学习库,pytorch版本为1.13.1,python的版本为3.9,cuda版本为11.3,开发环境为pycharm2022.3。

1.数据集的准备(十分类问题):

下载所需要的数据集:

2.导入需要用到的库:

3,遍历所有文件并对标签进行编号,划分训练集、验证集与测试集:

4.,建立csv文件保存图片的数据与标签:

5.设置getitem方法得到某个位置的数据和标签并做图像预处理:

利用pytorch库中的transformes方法将图片先用rgb格式打开,然后统一缩放为104X104的像素格式以便于输入网络进行训练,利用totensor函数将图片转换成向量的格式并利用ImageNet提供的均值和方差mean=[0.485,0.456,0.406],std=[0.229,0.224,0.225]

进行归一化处理,以便于数据可以在(-1,1)之间,减小数据量以及使其服从正态分布。

处理前和处理后的图片的对比:

处理前的图片

处理后的图片

6.读取训练集和测试集的照片:

7.构建神经网络:

神经网络采用经典的lenet-5网络,两个卷积层,两个池化层,一个全连接层,最后输出为10维的向量:

8.设置前向传播函数,优化器选择sgd,参数为lr=0.005,momentum=0.5,如果有显卡,设置可以使用cuda进行加速:

9.封装函数进行训练,设置每训练20次输出一次loss值,设置每一次epoch进行一次test来验证当前神经网络的准确率:

10.每次epoch进行一次网络模型的保存,一共设置20次epoch:

11.训练过程展示:

第一次epoch后准确率为35%

第三次epoch训练过程中的梯度下降展示:

训练时读取图片与标签展示:

在第七次epoch时,准确率已达到93%:

本次的程序设计主要内容是机器学习的图片标签分类学习,通过本次课程设计,加深了我对于机器学习以及图片分类任务的理解。

机器学习其实就是通过让计算机理解数据,并对数据进行对比处理进而获得一种模型对未被训练过的数据进行预测的一种方法.此次学习主要是对图片的十分类问题进行实践,多分类函数使用的是softmax,可以计算矩阵中不同维度模块的比重,且具有归一与非线性激活作用。而卷积层可以对矩阵进行维度扩大,从而获得更大的感受野,进而可以感知到图片中更多的特征。损失函数使用带有向量的sgd函数可以使训练在遇到死点时更好的跨越过去从而保证梯度的下降。

本次程序实际的不足:没有做到训练过程中图片的可视化,可以进一步学习matplotlib库或者vidsom库进行训练的可视化。可以使用更好的神经网络结构进行训练,比如vgg-16或者resnet等。

THE END
1.汽车图像识别汽车车型图像识别ff汽车日本九州大学的一个团队开发了一种欺骗图像识别技术的新方法。对许多研究人员来说,一般的方法是给图像添加一些功能,这些图像会错误地触发神经网络,并让它识别出它所看到的完全不同的东西。换句话说,怎样才能让人工智能看到汽车的图像,并把它归类为狗呢? 令人惊讶的https://cloud.tencent.com/developer/information/%E6%B1%BD%E8%BD%A6%E5%9B%BE%E5%83%8F%E8%AF%86%E5%88%AB
2.ocr图片识别技术是什么?OCR的作用有哪些?在我们想要将照片文字识别出来的时候,由于照片本身有的清晰,有的不清晰,那么如果没有OCR的帮助,就不能将不清晰的照片文字提取出来。因此大家在进行扫描的时候,都很看好OCR工具。 ocr图片识别技术的广泛运用加快了图片识别的速度,促进了识别技术的升级。通过使用ocr图片识别技术可以有效的促进智能办公的广泛应用。https://www.foxitsoftware.cn/scanner/jiaocheng/691.html
3.计算机视觉的应用车辆车牌识别目前已经是一种非常成熟的技术了,高速路上的违章检测,车流分析,安全带识别,智能红绿灯,还有停车场的车辆身份识别等都用到了车辆车牌识别,不仅能识别出车牌的号码,目前车辆识别技术已经能对道路上的车辆车型进行识别,通过识别摄像头获取的图像,能获取到车辆的型号及颜色等特征。 https://nic.hnuu.edu.cn/10043/2023/0029400.html
4.java海康车辆图片二次识别代码海康威视车牌识别sdkjava 海康 车辆图片二次识别代码 海康威视车牌识别sdk 我们一直都说EasyCVR开发上线以来,算是市面上兼容性较为优秀的视频能力平台,能够兼容国标GB28181、RTSP、海康SDK、Ehome协议的设备,其他主流厂家的私有协议也会不断开拓。 继EasyCVR支持海康SDK设备接入后,EasyCVR 1.1.3版本也已经支持大华私有协议SDK设备的接入。https://blog.51cto.com/u_16099355/9766961
5.图像识别sdk图像识别离线sdk图像识别私有化部署门禁部署人脸识别算法 百度云人脸识别接口采用先进的人脸识别技术,能够精准地识别人脸信息,确保门禁系统的高效运行。 13 2024-05 驾校考试车辆人脸识别接口调用 在驾校考试中,人脸识别接口调用主要实现了考生身份的快速验证。考生在进入考试车辆前,需通过人脸识别系统进行身份验证。系统会实时捕捉考生的面部特征,并与预先录入https://ai.tuidc.com/tuxiang/
6.华为图片ocr文字识别技术华为云帮助中心为你分享云计算行业信息,包含产品介绍、用户指南、开发指南、最佳实践和常见问题等文档,方便快速查找定位问题与能力成长,并提供相关资料和解决方案。本页面关键词:华为图片ocr文字识别技术。https://support.huaweicloud.com/topic/313142-2-H
7.满足你的好奇心——车牌识别过程有人说这样的容错率也太低了,很容易出错。是的,这的确容易出错,所以软件端做了进一步的技术深入:车辆轮廓识别。车辆轮廓识别与车牌识别的轮廓识别原理是一样的,可以参考下面车牌轮廓识别部分。 2、拍照 对进入有效焦距范围的车辆拍摄照片,这一步很容易理解。车牌识别系统的软件端会根据车辆进入的视频来截取图片,或者https://www.yoojia.com/ask/16-12007167422083917243.html
8.“车脸识别”神器秒查涉牌违法1秒分析300余张照片林玉栋介绍说,IDA系统是基于交通大数据、人工智能、深度学习算法应用、大数据的信号控制及优化等技术,将公安交通监控视频资源和卡口资源采集得到的车辆图像信息传送到云储存和服务器中,再通过交通大数据服务器进行图片二次识别、视频云分析和人脸建模对比,完成车辆识别和车牌识别,最后将车牌信息和车辆信息进行匹配,准确判断是https://news.cctv.com/2018/05/07/ARTIn9kel9esDwvbFab2xQBA180507.shtml