基于MATLAB的图片中文字的提取及识别

基于MATLAB的图片中文字的提取及识别

邹浩,余龙,邹勇博,刘宇童,和振乔,李少梅

(西安电子科技大学电子工程学院,西安,710126)

摘要

随着现代社会的发展,信息的形式和数量正在迅猛增长。其中很大一部分是图像,图像可以把事物生动地呈现在我们面前,让我们更直观地接受信息。同时,计算机已经作为一种人们普遍使用的工具为人们的生产生活服务。从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点。由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术。

关键词:MATLAB图像处理文字提取文字识别

TextExtractionandRecognitioninImagesBasedonMATLABZOUHao,YUlong,ZOUYongbo,LIUYutong,HEZhenqiao,LIShaomei

(XidianUniversityElectronicEngineeringCollege,Xi'an,710126)

Abstract

Withthedevelopmentofsociety,theformandquantityofimformationareincreasingquickly.Alargepartofthemareimages,whichcanmakethingsvividlypresentedinfrontofus,letusmoreintuitivetoacceptinformation.Atthesametime,thecomputerhasbeenasawidelyusedtoolforpeople'sproductionandlivingservices.Extractingtextfromimagebelongstothefrontierofintelligentinformationprocessing,anditisthecurrenthotresearchtopicinthefieldofartificialintelligenceandpatternrecognition.Asthetextwithhigh-levelsemanticfeatureandplaysanimportantroleonunderstanding,indexingandretrievalimagecontent.Therefore,thestudyonextractingtextsfromimageshaveimportantactualmeanings.Andbecauseextractingtextsfromstillimagesisthebasisforextractingtextsfromdynamicimages,thearticleemphaticallyintroducesthetechnologyofextractingtextsfromstillimages.

KeyWords:MATLABimageprocessingwordextractionwordrecognition

一.引言

随着计算机科学的飞速发展,以图像为主的多媒体信息迅速成为重要的信息传递媒介,在图像中,文字信息(如新闻标题等字幕)包含了丰富的高层语义信息,提取出这些文字,对于图像高层语义的理解、索引和检索非常有帮助。图像文字提取又分为动态图像文字提取和静态图像文字提取两种,其中,静态图像文字提取是动态图像文字提取的基础,其应用范围更为广泛,对它的研究具有基础性,

所以本文主要讨论静态图像的文字提取技

术。静态图像中的文字可分成两大类:一种

是图像中场景本身包含的文字,称为场景

文字;另一种是图像后期制作中加入的文

字,称为人工文字,如右图所示。场景文字

由于其出现的位置、小、颜色和形态的随机

性,一般难于检测和提取;而人工文字则字

体较规范、大小有一定的限度且易辨认,颜

色为单色,相对与前者更易被检测和提取,

又因其对图像内容起到说明总结的作用,故适合用来做图像的索引和检索关键字。对图像中场景文字的研究难度大,目前这方面的研究成果与文献也不是很丰富,本文主要讨论图像中人工文字提取技术。

二.静态图像中文字的特点

静态图像中文字(本文特指人工文字,下同)具有以下主要特征:

(1)文字位于前端,且不会被遮挡;

(2)文字一般是单色的;

(3)文字大小在一幅图片中固定,并且宽度和高度大体相同,从满足人眼视觉感受的角度来说,图像中文字的尺寸既不会过大也不会过小;

(4)文字的分布比较集中;

(5)文字的排列一般为水平方向或垂直方向;

(6)多行文字之间,以及单行内各个字之间存在不同于文字区域的空隙。在静态图片文字的检测与提取过程中,一般情况下都是依据上述特征进行处理的。

三.文字提取、识别的一般流程

≥<=threshithreshii2,12,03静态图像文字提取一般分为以下步骤:文字区域检测与定位、文字分割与文字提取、文字后处理。其流程如图1所示。

(图1)

四.文字提取、识别的详细步骤

1.在Matlab中调用i1=imread('字符.jpg'),可得到原始图像,如图2所示:

(图2)

2.调用i2=rgb2gray(i1),则得到了灰度图像,如图3所示:

(图3)

调用a=size(i1);b=size(i2);可得到:a=3,b=2即三维图像变成了二维灰度图像

3.调用i3=(i2>=thresh);其中thresh为门限,在

[0,255]之间这里,i2_max=double(max(max(i2)));%获取亮度最大值

THE END
1.王音棋最新照片获取指南,初学者与进阶用户的步骤教程(1)访问专业的摄影博客和图片分享网站,如蜂鸟网、图虫网等,搜索王音棋的相关照片。 (2)关注专业摄影师的账号,获取独家高清照片。 三、搜索步骤 1、打开搜索引擎,输入“王音棋最新照片”关键词进行搜索。 2、筛选搜索结果,查看与王音棋相关的社交媒体账号、新闻网站、摄影博客等。 http://www.buickzy.com/post/1469.html
2.基于决策导向非循环图SVM的汽车车型识别AET摘要:用决策导向非循环图支持向量机研究了汽车车型的识别。运用图像像素相减的差分方法去除背景,获取车对象;然后对图像进行均值滤波,以除去噪声干扰,再对图像用“分水岭”变化的阈值方法,获取车的二值图像;最后提取车的几何形状特征,并将其输入DDAG支持向量机进行训练和识别,以实现对车型分类的目的。 http://www.chinaaet.com/article/76325
3.超详细的编码实战,让你的springboot应用识别图片中的行人汽车整个开发过程涉及到这些步骤:提交照片的网页、神经网络初始化、文件处理、图片检测、处理检测结果、在图片上标准识别结果、前端展示图片等,完整步骤已经整理如下图: 内容很丰富,收获也不会少,更何况前文已确保可以成功运行,那么,别犹豫啦,咱们开始吧! 源码下载 https://cloud.tencent.com/developer/article/1912828
4.在线文字转音频二进制转ascii文字在线转换?步骤四:参数设置完成后,开始“点击添加文件”,选中我们需要识别的图片,按住Ctrl键可以批量添加,然后点击“打开”按钮会进行文件上传。 步骤五:当我们看到这个界面表示已经成功上传,此时根据页面中进度条来看下我们所需的转换时长即可。 步骤六:最后一步,点击“立即下载”将我们已完成识别的文件下载就可以使用了。 https://tool.a5.cn/article/show/70798.html
5.c#图片文字识别算法C#图片文字识别算法是一种计算机视觉技术,能够自动识别数字、字母和其他特定的文本。这种技术在图像处理、OCR(Optical CharacterRecognition)等领域都有应用。 实现这种算法的主要步骤如下: 图像预处理:包括图像去噪、图像二值化、形态学处理等。 文字区域分割:利用图像处理技术,实现文字的区域分割,去除其他无关区域。 https://www.volcengine.com/theme/1209785-C-7-1
6.北京首钢:打造钢铁全流程过程质量管控系统管理信息化综合2)基于图片识别的表面分类 板带钢产品的表面质量是最重要的评价指标之一,板带钢表面夹杂物、氧化皮、孔洞等缺陷不仅影响产品的外观质量,而且还会降低产品的抗腐蚀性、耐磨性和其它强度性能。目前我国大多数钢铁企业采用闪频光检测、基于 CCD 成像检测等表检系统,但表面缺陷识别的准确率均不高,检出率和分类率约为80https://articles.e-works.net.cn/erpoverview/article149780.htm
7.车标志识别图片大全图片关于车标志识别图片,您可以在网络上搜索“汽车标志图片大全”或“车标识别图片”,会出现很多相关的图片和资料。此外,一些专业的汽车网站https://www.car136.com/tag/chebiaozhishibietupiandaquantupian/
8.图片分类图像类服务开发应用开发Android机器学习服务开发步骤 端侧静态图片检测 云侧静态图片检测 视频流检测 自定义模型 展开章节 服务介绍 通过对图片中的实体对象进行分类并添加标注信息,如:人、物、环境、活动、艺术形式等信息,帮助定义图片题材和适用场景等。图片分类支持端侧识别和云侧识别。端侧识别即在设备上运行检测算法模型,返回识别结果,目前支持超过400个https://developer.huawei.com/consumer/cn/doc/hiai-Guides/image-classification-0000001050040095
9.车内饰图片识别大全易车汽车新闻为您提供关于车内饰图片识别大全的最新汽车资讯,车内饰图片识别大全相关的最新易车号文章,为你购车提供参考。https://news.m.yiche.com/tag/30525008.html