期刊动态

摘要:目前的人工视觉系统仍然无法处理一些涉及高速运动场景和高动态范围的真实世界场景。事件相机因其低延迟和高动态范围捕捉高速运动的优势具有消除上述问题的能力。然而,由于事件数据的高度稀疏和变化性质,在保证其快速性的同时将事件重建为视频仍然具有挑战性。因此提出了一种基于Transformer残差网络和光流估计的事件流重建算法,通过光流估计和事件重建的联合训练,实现自监督的重建过程,并引入去模糊预处理和亚像素上采样模块来提高重建质量。实验结果表明,在公开数据集上,提出的方法可以有效提高事件流的重建效果。

摘要:全球老龄化时代的到来引发的老年人健康监护问题不可忽视,而室内跌倒对独居的老年人有非常大的安全隐患。因此,为准确检测到跌倒动作,使用毫米波雷达三维点云信息进行室内跌倒检测,并提出一种基于外部注意力机制的PointLSTM网络实现三维点云在时序的分类。通过MIMO体制的毫米波雷达芯片采集人体动作的回波信号,利用集成雷达基带处理器的微控制器实现信号处理的部分,可将原始数据实时转换成三维点云,并提高点云处理中的计算速度及雷达硬件的整体性能。基于外部注意力机制的PointLSTM网络可实现点云在时空中的提取特征和分类识别,网络改进了PointLSTM帧间点信息的流失问题,并在信息提取中对所有数据实现特征联系,外部注意力机制通过独立的可学习参数优化了网络复杂度和识别精确率。实验结果表明,所提出的方法在室内环境下检测准确率可以达到98.3%,可以有效区分动作的类别,并验证了使用毫米波雷达三维点云检测人体跌倒的可行性。

摘要:构建基于云计算的蛋白质折叠空间结构预测框架,通过数据云存储设备获取蛋白质序列原始数据,采用HDFS(HadoopDistributedFileSystem)分布式存储方式保存于云端。资源和队列管理器RQM(ResourceQueueManagement)开启云端虚拟机后,以之作为扫描节点(SensorNode,SN),SN基于二维AB非格点模型建立最小蛋白质分子能量优化函数,采用局部搜索机制改进的量子遗传算法对其作优化求解。利用云端GPU设备处理模型训练数据,即可实现蛋白质折叠空间结构的自动化预测。实验结果表明:蛋白质序列能量势函数计算结果更小、执行效率更高、GDT-TS(GeothermalDevelopmentandTestingToolSuite)评价指标值更大。

摘要:乔木在维持生态平衡、保护生物多样性以及调节气候和改善空气质量等方面发挥着至关重要的作用。针对复杂背景下乔木识别准确率较低的问题,提出了一种基于树木多特征融合和知识蒸馏的亚热带常见乔木识别模型MFFMN-KD-TA。该模型采用3个并行的MobileNetV3_Small主干网络分别提取树叶、树干和树木整体特征;并通过知识蒸馏和嵌入TripletAttention模块的方法优化训练。试验结果表明,MFFMN-KD-TA模型在自建树木测试集上的准确率、精确率和F1分数分别为0.9609、0.9621和0.9608,较MFFMN模型分别提升了3.05%、2.83%和3.07%。与三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比,提出的多特征融合模型MFFMN-KD-TA参数量较小且能够较准确地识别乔木种类,为亚热带和其他地区的树种识别提供了新思路和新方法。

摘要:通过主动学习模型来选取最有价值的数据点进行标注是深度学习减少标注数据量的一种方式。预测损失模型是一类与任务无关的主动学习模型,该类模型在多个任务中都有不错的表现。但是这类模型均不是端到端的模型,不断变化的输入特征会导致损失预测网络在训练时出现输入偏差。提出了时序特征融合预测损失模型用于解决该模型的输入偏差问题。实验证明,提出的算法在各个任务中的性能与以往最先进的算法相比,平均提升约1.5%,与原预测损失模型相比,平均提升5%。

摘要:针对当前心音信号识别算法检测精度不佳问题,提出了一种混合卷积神经网络-支持向量机模型(CNN-SVM)的心音信号分类方法。通过PASCAL挑战实验数据,整理出正常与不正常两类心音信号数据库,通过预处理滤波及MFCC、一二阶差分特征提取、PCA降维,输入CNN-SVM模型进行训练。并从准确率、召回率、特异性、精确率和F分数5个方面进行性能评估。为了验证此算法的有效性,将混合CNN-SVM模型与单一SVM、CNN模型分别进行了对比。实验结果表明,该方法能够以较高识别率将两种心音信号区分开,其平均识别准确率接近于99%,相较于单一CNN方法提高了2.48%,同样高于单一SVM算法。

摘要:预测植物中的蛋白质-蛋白质相互作用(PPI)具有重要的生物学意义。同时采用了4种编码方法及深度神经网络构建了蛋白质相互作用预测模型。结果表明,提出的融合蛋白质语言模型Ankh与深度神经网络的方法构建的PPI预测模型性能在3种植物数据集上均获得了最优的AUPR和AUC值,Sen及MCC值也均优于其他4种蛋白质相互作用预测模型。当模型在水稻、大豆的植物PPI数据集上进行测试时,所提出的模型AUPR值分别为0.8025、0.7301,AUC值分别为0.9562、0.9507。这些优异的结果表明,融合蛋白质语言模型Ankh的PPI模型可以作为植物蛋白质相互作用预测的一个有前途的工具。

摘要:中文命名实体识别主要包括中文平面命名实体识别和中文嵌套命名实体识别两个任务,其中中文嵌套命名实体识别任务难度更大。提出了一个基于词汇增强和表格填充的统一模型TLEXNER,该模型能够同时处理上述任务。该模型首先针对中文语料分词困难的问题,使用词典适配器将词汇信息融合到BERT预训练模型,并且将字符与词汇组的相对位置信息集成到BERT的嵌入层中;然后通过条件层归一化和双仿射模型构造并预测字符对表格,使用表格建模字符与字符之间的关系,得到平面实体与嵌套实体的统一表示;最后根据字符对表格上三角区域的数值判断实体类别。提出的模型在平面实体的公开数据集Resume和自行标注的军事领域嵌套实体数据集上F1分别是97.35%和91.96%,证明了TLEXNER模型的有效性。

摘要:任务型问答系统一旦构建好,通常是固定不变的,能回答的问题非常有限,难以满足用户的需求。对此,提出一种自动实时更新知识库的方法,当用户提了一个问答系统回答不了的问题,系统会把该问题自动发送给人工客服,人工客服利用专业知识回复后,系统能够自动实时获取用户提的问题和人工客服回复的答案,并把这个问答对自动实时更新到知识库,之后如果其他用户提了类似的问题,问答系统就能够快速给出对应的答案。以政务领域的问答系统为例,应用文本向量化方法ERNIE构建知识库自动实时更新的问答系统。经过计算机实验证明,提出的方法能够实现知识库自动实时更新,构建的问答系统具有自主学习与记忆功能,提高了任务型问答系统的智能化水平。

摘要:垃圾分类是建设生态文明的重要一环,为解决重量级模型难以部署移动端设备的问题,提出基于YOLOv5网络改进的垃圾图像分类方法。采用融合GhostNet的主干网络,用线性运算代替传统卷积运算,降低了模型的参数量,提高了模型推理速度;通过在网络中加入改进版通道注意力模块,强化重要的通道特征,获取更多深层次的特征信息;采用加权边界融合方法,提升检测框的定位精度。经实验证明,该方法在自制数据集中较原模型的精度提高了8.5%,参数量减少了46.7%,平均推理速度提高了1.22ms,实现了精度和推理速度的综合提升。

摘要:针对中文事件抽取中语义表征不充分、特征提取不全面等问题,提出一种基于RoBERTa和多层次特征的中文事件抽取方法。通过RoBERTa预训练模型构建字向量,并基于词性标注和触发词语义信息融入进行字向量扩展;其次使用双向长短时记忆网络和卷积神经网络抽取全局特征和局部特征,并通过自注意力机制捕捉不同特征之间的关联,加强对重要特征的利用;最后通过条件随机场实现BIO序列标注,完成事件抽取。在DuEE1.0数据集上,触发词抽取和事件论元抽取的F1值达到86.9%和68.0%,优于现有常用事件抽取模型,验证了该方法的有效性。

摘要:输电巡检图像的背景复杂,目标检测易受干扰,基于YOLOX神经网络模型,提出一种输电线路山火检测方法。首先采用YOLOX的主干特征提取网络框架,并将其中多尺度特征提取模块的常规卷积替换为可变形卷积;其次在加强特征提取阶段增加了通道注意力和空间注意力模块的融合,能够自适应火焰的外形多变特点,更加有效地提取到山火特征,从而提高目标检测的准确率。经实验验证,所提方法能够较为准确地检测到山火,满足日常巡检的需求。

摘要:人体关键点检测在智能视频监控、人机交互等领域有重要应用。针对基于热图的人体关键点检测算法依赖高分辨率热图、计算资源消耗大的问题,提出一种结合不确定性估计的轻量级算法。使用低分辨率热图,结合不确定性估计预测误差分布的尺度参数,提高了预测结果的可信度;利用尺度参数监督和约束热图,缓解梯度消失,增强了网络的鲁棒性。COCO数据集上实验结果表明,与积分姿态回归算法相比,改进后算法的平均精度提高了3.3%,降低了资源占用。

摘要:近年来,随着深度学习技术的发展,基于编解码的图像分割方法在病理图像自动化分析上的研究与应用也逐渐广泛,但由于胃癌病灶复杂多变、尺度变化大,加上数字化染色图像时易导致的边界模糊,目前仅从单一尺度设计的分割算法往往无法获得更精准的病灶边界。为优化胃癌病灶图像分割准确度,基于编解码网络结构,提出一种基于多尺度注意力融合网络的胃癌病灶图像分割算法。编码结构以EfficientNet作为特征提取器,在解码器中通过对多路径不同层级的特征进行提取和融合,实现了网络的深监督,在输出时采用空间和通道注意力对多尺度的特征图进行注意力筛选,同时在训练过程中应用综合损失函数来优化模型。实验结果表明,该方法在SEED数据集上Dice系数得分达到0.8069,相比FCN和UNet系列网络一定程度上实现了更精细化的胃癌病灶分割。

摘要:随着电力用户信息采集系统的发展,更丰富的用户用电信息被用于用户用电信息异常的识别。基于FDI攻击进行虚假数据注入,构造用户用电信息异常数据集,并提出了一种基于召回率的改进Stacking集成分类算法。该算法采用K-近邻算法(k-NearestNeighbors,KNN)、随机森林模型(RandomForests,RF)、支持向量机(SupportVectorMachine,SVM)以及梯度决策树(GradientBoostingDecisionTree,GBDT)作为Stacking结构的基分类模型;采用逻辑回归(LogisticRegression,LR)作为Stacking结构的元分类模型。并基于召回率为基分类模型的输出结果进行权值赋值,从而作为元分类模型的输入数据集。通过实验验证,所提的基于召回率的改进Stacking集成分类算法相比于传统Stacking集成分类算法拥有更高效的分类性能。

摘要:为了能将庞大的深度学习模型压缩后部署到算力和存储能力有限的设备中时尽可能减小精度损失,对知识蒸馏模型压缩方法进行研究,提出了一种改进后带筛选的多教师模型知识蒸馏压缩算法。利用多教师模型的集成优势,以各教师模型的预测交叉熵为筛选的量化标准筛选出表现更好的教师模型对学生进行指导,并让学生模型从教师模型的特征层开始提取信息,同时让表现更好的教师模型在指导中更具有话语权。在CIFAR100数据集上的VGG13等分类模型实验结果表明,与其他压缩算法相比在最终得到的学生模型大小相同的情况下,精度上有着更好的表现。

摘要:LiDAR技术的发展为自动驾驶提供了丰富的3D数据。然而,由于遮挡和某些反射材料的原因引起信号丢失,LiDAR点云实际上是不完整的2.5D数据,这对3D感知提出了根本性挑战。针对这一问题,提出对原始数据进行三维补全的方法。根据大多数物体形状对称且重复率高的特点,通过学习先验对象形状的方法估计点云中遮挡部分的完整形状。该方法首先识别被遮挡和信号缺失影响的区域,在这些区域中预测区域所包含对象形状的占用概率。针对物体间遮挡的情况,通过形状的占用概率和共享同类形状形态进行三维补全。对自身遮挡的物体,通过自身镜像进行恢复。最后通过点云目标检测网络进行学习。结果表明,通过该方法能有效地提高生成点云3D边框的mAP(meanAveragePrecision)。

摘要:针对在单视图的乳腺肿块检测算法中漏检率和假阳性率较高的问题,提出了一种改进的自动检测算法。将扩张残留网络(DilatedResidualNetwork,DRN)结合重新设计的特征金字塔网络(FeaturePyramidNetwork,FPN)用于对乳腺肿块的检测。首先利用DRN中的膨胀卷积,减少对图像的下采样次数;再扩充网络的深度,使其输出满足FPN所需的输入;在FPN结构中,采用注意力机制降低不同特征图直接融合所造成的信息损失,同时采用密集连接代替原有的横向连接,充分融合浅层特征中目标的位置和细节信息。仿真实验显示,所设计的模型在CBSI-DDSM数据集上的检测精度相比于基准模型提升了7.1%。

摘要:针对化工过程中广泛应用的连续搅拌反应釜(CSTR)反应器,提出一种新的基于极限学习机的Hammerstein-Wiener模型的辨识建模方法。其中,Hammerstein-Wiener模型的两个非线性环节采用两个不同的极限学习机逼近,线性环节采用自回归ARX模型。因极限学习机的特殊结构,此模型可以表示成线性回归的形式,最终利用广义最小二乘法求解模型的参数。此方法辨识过程简单,辨识过程的计算量较小。最后对CSTR的辨识结果表明,在相同条件下与基于多项式的Hammerstein模型和ARX-LSSVMHammerstein模型相比,该方法具有较高辨识精度,表明了该方法的有效性。

摘要:为了解决城市中共享单车乱停乱放的问题,提出了一种基于OpenMV的共享单车规范停车系统。系统主要由OpenMV开发板、BC20通信定位模块以及OneNET云服务器等组成。其中OpenMV完成对停车状态的检测与识别,借助BC20内置的网络模块与OneNET云服务器进行数据交互,并将检测结果反馈至小程序客户端,从而实现对共享单车的停车检测和控制。系统通过大量的测试,实验结果表明系统运行稳定,识别准确率为94.1%,可以实现共享单车的规范停车自动检测,具有良好的市场应用前景与价值。

摘要:为解决垃圾网页检测中特征提取难度高、计算量大的问题,提出一种仅基于当前网页的HTML脚本提取语义特征的方法。首先使用深度优先搜索和动态规划相结合的记忆化搜索算法对域名进行单词切割,采用隐含狄利克雷分布提取主题词,基于Word2Vec词向量和词移距离计算3个单页语义相似度特征;然后将单页语义相似度特征融合单页统计特征,使用随机森林等分类算法构建分类模型进行垃圾网页检测。实验结果表明,基于单页内容提取语义特征融合单页统计特征进行分类的AUC值达到88.0%,比对照方法提高4%左右。

摘要:大多数传统的深度学习点云补全学习方法仅仅使用了全局特征而忽略了局部特征,为了更好地提取和使用点云的局部特征,提出了一个基于深度学习的端到端点云补全网络。在点云补全网络(PCN)的基础上,编码部分引入针对局部特征改进的动态图卷积(DGCNN),使用多个不同维度的边卷积提取较为丰富的局部特征,并按照距离弱化远点的特征;然后用深度残差网络连接的思想优化网络结构以实现多尺度特征的融合,并加入平均池化弥补全局池化造成的信息损失;在解码部分引入折叠网络(FoldingNet),使输出的点云更加完整。实验结果表明,该点云补全网络相对PCN等点云补全网络有部分提升,验证了新方法的有效性。

摘要:医疗文本的特征提取及分析在建设临床决策支持系统方面具有较大的实用价值。针对包含各种术语和缩写的原始医疗文本难以提取特征的情况,提出了一种基于BERT与Word2vec的医疗文本分析模型。该模型对医疗病历中关键医疗实体进行识别,基于知识建立权重评分机制,对医学文本进行语义分析。实验数据表明,模型在医疗文本特征提取方面具有一定优势,对高血压性脑出血病历的分析诊断性能良好,能有效应用于临床决策支持系统。

摘要:场景图生成(SGG)任务旨在检测图像中的视觉关系三元组,即主语、谓语、宾语,为场景理解提供结构视觉布局。然而,现有的场景图生成方法忽略了预测的谓词频率高但却无信息性的问题,从而阻碍了该领域进步。为了解决上述问题,提出一种基于增强语义信息理解的场景图生成算法。整个模型由特征提取模块、图像裁剪模块、语义转化模块、拓展信息谓词模块四部分组成。特征提取模块和图像裁剪模块负责提取视觉特征并使其具有全局性和多样性。语义转化模块负责将谓词之间的语义关系从常见的预测中恢复信息预测。拓展信息谓词模块负责扩展信息谓词的采样空间。在数据集VG和VG-MSDN上与其他方法进行比较,平均召回率分别达到59.5%和40.9%。该算法可改善预测出来的谓词信息性不足问题,进而提升场景图生成算法的性能。

摘要:为解决新疆兵团农业现代化建设中有感知无决策的问题,提出一种基于注意力机制模块(SENet)与卷积神经网络混合模型迁移学习的图像分类方法(TL-DA-SE-CNN)。该方法选择4种不同的CNN模型进行权重采集,包括VGGNet、ResNet、InceptionNet和MobileNet。模型使用SENet分类器代替卷积神经网络的全连接层,提取图像的结构性高阶统计特征进行主题分类,并使用BP算法进行参数调整,分类准确度达98.20%。实验结果表明,将CNN与迁移学习、数据增强和SENet相结合的技术提高了牲畜图像分类的性能,是卷积神经网络在农场自动化分群中的有效应用。

摘要:随着目前目标检测任务输入图像分辨率的不断增大,在特征提取网络的感受野不变的情况下,网络提取的特征信息会越来越局限,相邻特征点之间的信息重合度也会越来越高。提出一种FSA(FusionSelf-Attention)-FPN,设计SAU(Self-AttentionUpsample)模块,SAU内部结构通过CNN与自注意力机制(Self-Attention)进行交叉计算以进一步进行特征融合,并通过重构FCU(FeatureCouplingUnit)消除二者之间的特征错位,弥补语义差距。以YOLOX-Darknet53为主干网络,在PascalVOC2007数据集上进行了对比实验。实验结果表明,对比原网络的FPN,替换FSA-FPN后的平均精度值mAP@[.5:.95]提升了1.5%,预测框的位置也更为精准,在需要更高精度的检测场景下有更为出色的使用价值。

摘要:针对变压器结构复杂、维护成本高等特点,提出一种基于深度学习的变压器故障信号识别算法。首先分析变压器工作状态下的声纹信号并进行二维图像信号的转换,利用VGG16神经网络在图像中的优势,并在此基础上提出一种MCA注意力机制,该注意力机制能够同时保留背景信息和细节信息;其次对VGG16中的最大池化下采样进行优化,采用一种软池化的采样方法,减少图像中最大池化下采样带来的特征损失;最后为避免过拟合现象的发生,将VGG16顶层结构中的激活函数进行优化,引用可以自归一化的SELU激活函数。实验证明,广义S变换是将一维时域信号转换为二维图像信号的最佳选择,所提算法对于6类故障信号的平均识别率达到99.15%。

摘要:深度神经网络在高维数据的分类和预测中取得了巨大成功。训练深度神经网络是数据密集型的任务,需从多个数据源收集大规模的数据。这些数据中通常包含敏感信息时,使得深度神经网络的训练过程容易泄露数据隐私。针对训练过程中的数据隐私和通信代价问题,提出了一种深度神经网络的分布式训练方法,允许基于多个数据源共同训练深度神经网络。首先,提出了分布式训练架构,由1个计算中心和多个代理组成。其次,提出了基于多代理的分布式训练算法,允许代理在数据不出本地和减少通信代价的情况下,通过切割深度神经网络,实现分布式地共同训练模型。然后,分析了算法的正确性。最后,实验结果表明该方法是有效的。

摘要:为提升普铁接触网检修作业时的安全性以及传输信息的抗干扰性,设计了一套基于人工智能机器人技术加LoRa通信技术的普铁接触网状态监测系统。该系统主要由在作业现场内具有验电、挂接地线与回流线功能的机器人作为数据采集装置和作业现场外对状态信息的传递、处理以及在终端实现可视化监测的模式构成。经过监测模拟测试,机器人数据采集抗干扰结果符合预期,同时LoRa网关与云服务器数据传输正常,PC端可实现监测状态信息可视化查看。

摘要:道路交通标志检测是智能交通的重要环节之一,针对交通标志检测存在背景复杂、目标较小、检测速度慢等问题,选取工业界青睐的YOLOv3模型提出一种改进的检测方法。利用双向特征金字塔结构实现图像低、中、高层特征语意信息的双向融合,提升低层预测目标的分类和高层预测目标的定位能力;将原模型的主干特征提取网络进行改进,提出Darknet23网络,以提高网络的提取能力和减少计算量;根据目标形状的特点,使用K-means聚类算法得到用于训练合适的锚点框,并在边框回归中引入灵活性更强的L_(α-CIOU)损失函数,使网络朝着预测框与真实框重叠度较高的方向去优化。实验结果表明,该方法在CCTSDB数据集上mAP@0.75达到86.10%、mAP@0.5:0.05:0.95达到70.017%,相比原网络分别提升10.17%和5.656%,参数量减少3622091,速度提升8.27f/s,且优于SSD和FasterRCNN等主流的检测网络。

摘要:在无声或噪声干扰严重的环境下,或对于存在听觉障碍的人群,唇语识别至关重要。针对词语级中文唇语识别的问题,提出了SinoLipReadingNet模型,前端采用Conv3D+ResNet34结构用于时空特征提取,后端分别采用Conv1D结构和Bi-LSTM结构用于分类预测,并引入Self-Attention、CTCLoss对Bi-LSTM后端进行改进。最终在新网银行唇语识别数据集上进行实验,结果表明,SinoLipReadingNet模型在识别准确率上明显优于中科院D3D模型,多模型融合的预测准确率达到了77.64%,平均字错率为21.68%。

摘要:为了解决常见目标检测算法在课堂场景中难以有效应用的问题,提出了一种融合轻量化与梯形结构的学生行为检测算法。该算法基于YOLOv4架构,针对目标分类和分布空间的特点,提出一种新的“梯”形特征融合结构,并结合MobileNetv2思想,优化模型参数得到梯形-MobileDarknet19特征提取网络,既减少了网络的计算量,提高了工作效率,同时加强了目标特征的信息传输,提升了模型学习能力;在尺度检测阶段引入5层的DenseNet网络,增强网络对小目标的检测能力。实验结果表明,提出的YOLOv4-ST算法相比于原YOLOv4算法mAP提高了5.5%,相比于其他主流算法,在学生课堂行为检测任务中具有较好的实用性。

摘要:在复杂的靶场试验场景中,试验现场常常涉及扬尘、强光、遮挡等多变的自然环境。针对这种情况下快速运动的目标物体跟踪,提出了一种关联动态特征的单目标跟踪算法。首先使用门控循环单元(GatedRecurrentUnit,GRU)提取待跟踪目标的时序动态特征,获得候选处理目标框集合;然后利用卷积网络(ConvolutionalNeuralNetwork,CNN)提取候选目标框的深度卷积特征并确定目标位置,同时分离出背景卷积特征;在跟踪过程中,使用分离出的背景卷积特征图对网络进行参数更新,增强网络的鲁棒性与自适应性。实验结果表明,所提出的算法可以对靶场图像采集系统中的被试移动目标进行自适应跟踪,并且在复杂环境背景下算法仍能保持优异的鲁棒性与适应性。

摘要:局部放电是设备处于高电场强下,由于电场分布不均而导致的绝缘介质放电现象,设备产生局部放电对于绝缘层的危害很大,迅速检测识别设备的放电类型是工业正常运作的保障。针对电气设备局部放电类型识别问题,考虑到电气设备监测系统在诊断识别方面的时效性及精度,提出了基于边缘计算的局部放电模式识别方法,利用边缘计算架构的优势,基于云层训练、边缘推理思路,将复杂的识别算法训练优化过程部署在云层,将计算量大的识别算法卸载到边缘层,而计算量小的特征提取保留在终端设备层处理。通过构造局部放电相位分布谱图提取局部放电的统计特征参数,采用粒子群优化算法对广义回归神经网络模型进行优化,最后将统计特征参数作为神经网络的输入量,对放电类型进行识别。结果表明,所提模式识别方法识别准确率高,识别效率高。

摘要:对基于极化SAR影像的地物分类技术发展进行归纳与总结。首先提出地物分类技术的价值需求和应用特点,对其所要解决的科学问题进行归纳;其次总结分析极化SAR影像分类的一般技术流程;进一步对国内外研究现状与技术算法特点进行分类梳理,提出其在理论方法与地物分类应用中的技术优缺点,尤其对基于人工智能理论的极化SAR影像地物分类技术进行探讨;最后结合SAR遥感的发展趋势,指出未来极化SAR影像地物智能分类技术的研究方向。

摘要:目标检测算法在视频监控领域有着较大的实用价值。针对当前在资源受限的视频监控系统中实现实时目标检测较为困难的情况,提出了一种基于YOLOv3-tiny改进的目标检测算法。该算法在YOLOv3-tiny架构的基础之上,通过添加特征重用来优化骨干网络结构,并提出全连接注意力混合模块来学习到更丰富的空间信息,更适合资源约束条件下的目标检测。实验数据表明,该算法相比于YOLOv3-tiny在模型体积降低39.2%,参数量降低39.8%,且在VOC数据集上提高了2.7%的mAP,在提高检测精度的同时显著降低了模型资源占用。

摘要:针对临床医生在诊断肝包虫病时需要通过个人经验判断囊型肝包虫病分型,研究基于目标检测算法的肝包虫病灶自动检测与分类模型,实现对肝包虫病超声影像的自动识别与分类。使用YOLOv5l模型作为囊型肝包虫病病灶目标检测的模型,利用本地肝包虫病超声影像数据集对网络模型进行训练。基于YOLOv5l模型与随机梯度下降算法(SGD)优化算法的肝包虫病病灶自动检测分类模型可以很好地对5种类型的病灶进行有效的检测,平均精度均值(mAP)为88.1%,经过测试,该模型的测试速度可达40f/s。实验结果表明,基于YOLOv5l与SGD算法的肝包虫病病灶自动检测分类模型能够较好地识别病灶的具体位置,可以很好地辅助医生诊断肝包虫病。

摘要:车辆属性检测是一个基础任务,其属性检测结果可以被应用到很多下游的交通视觉任务。提出了一种基于YOLOv5的车辆属性检测改进算法。针对检测目标较小的问题,加入了卷积注意力模块,让网络模型把更多的注意力放在小目标对象上;针对数据集样本种类较少的问题,改进了YOLOv5的马赛克数据增强方式;使用自门控激活函数Swish,起到抑制噪声、加快收敛速度并提升模型鲁棒性的作用。此外,还在公开车辆数据集VeRi-776的基础上进行了详细的车辆属性标注,构建了一个车辆属性数据集。实验结果表明,改进后的算法比原始YOLOv5的平均精确率提升了4.6%,能够准确地检测到车辆图像的通用属性,可以供下游任务使用。

摘要:现有的空气质量预测方法很少考虑季节性因素,且预测的效果不佳,因此提出一种基于改进二元混沌乌鸦搜索算法(BinaryChaoticCrowSearchAlgorithm,BCCSA)和深层长短期记忆神经网络(LongShortTermMemory,LSTM)的空气质量预测方法。首先提出季节调整的方法对收集的原始空气质量数据进行预处理,以消除季节对预测的影响;然后提出改进BCCSA,对空气质量数据进行优化处理;最后,将自注意力机制加入到深层LSTM中,对空气质量数据进行预测。实验结果表明,该方法能有效地提高空气质量的预测精度。

摘要:随着近年来人机语音交互场景不断增加,利用麦克风阵列语音增强提高语音质量成为研究热点之一。与环境噪声不同,多说话人分离场景下干扰说话人语音与目标说话人同为语音信号,呈现类似的时、频特性,对传统麦克风阵列语音增强技术提出更高的挑战。针对多说话人分离场景,基于深度学习网络构建麦阵空间响应代价函数并进行优化,通过深度学习模型训练设计麦克风阵列期望空间传输特性,从而通过改善波束指向性能提高分离效果。仿真和实验结果表明,该方法有效提高了多说话人分离性能。

摘要:佩戴口罩可以有效预防病毒的传播,为减少通过人工方式检查口罩佩戴情况所消耗的大量人力资源,提出一种基于深度学习的口罩佩戴检测与跟踪方法,该方法分为检测和跟踪两个模块。检测模块在YOLOv3网络的基础上引入空间金字塔池化结构,实现不同尺度的特征融合;然后将损失函数改为CIoU损失,减少回归误差,提升检测精度,为后续跟踪模块提供良好的条件。跟踪模块采用多目标跟踪算法DeepSORT,对检测到的目标进行实时跟踪,有效防止重复检测,改善被遮挡目标的跟踪效果。测试结果表明,该方法的检测速度为38f/s,平均精度值达到为85.23%,相比原始YOLOv3算法提高了4%,能达到实时检测口罩佩戴情况的效果。

摘要:随着船舶智能化水平提高,船载远程会议系统对提高应急处理能力、推进船岸一体化网络建设有重要意义,麦克风阵列是保证远程会议系统语音效果和支持多模态交互的重要语音前端。但船舶舱室狭小尺寸一方面导致只能采用小尺寸麦阵,另一方面小舱室导致的强混响以及嘈杂舱室噪声也使传统麦克风阵列算法性能严重下降。考虑船舶舱室复杂环境下小尺寸麦阵DOA估计场景,提出了一种轻量级Mask-DOA估计神经网络模型。该方法在DOA估计神经网络引入Mask算法降低噪声和混响的干扰,并提取增强后的GCC-PHAT作为网络特征,从而在小尺寸麦阵上实现高精度DOA估计。仿真和实验结果表明,所提出的Mask-DOA模型面对复杂的船舶舱室环境更鲁棒,泛化能力更强。

摘要:交通标志在车辆的安全行驶和自动驾驶中都有着大量的研究。由于交通标志的种类繁多且受各种因素的影响,交通标志的分类检测也是一个具有挑战的难题。为此,提出了一种标签结合现实道路场景的交通标志分类检测方法,该方法分为数据生成部分和目标检测部分。实验结果表明,利用该方法生成训练数据,能够有效地训练深度卷积神经网络,实现现实场景交通标志的分类检测,并且优化的检测模型相比文中提到的模型具有更小的体积和更快的速度。

摘要:电磁导引是一种车辆自动导引方案,广泛应用于工业、物流等领域。为解决现有电磁导引方案对车辆机械结构要求较高、易受传感器预瞄距离短的限制、难以应用于小型自动导引车辆的问题,提出了一种基于全连接神经网络的导引方案。通过数据分析寻找有限预瞄距离内的最优传感器排布方案,设计和训练全连接神经网络模型,对车身姿态及车后道路的信息进行全面预测,以弥补传感器短预瞄所造成的前向道路探测能力的不足。经模拟和实际测试,该方案能极大改善较小体积车辆的短预瞄电磁导引系统的控制效果,实现车辆的稳定快速运行。

摘要:互联网对人民群众的生活和工作产生了重要影响,然而网络空间中隐藏着大量有害的博彩网站或赌博网站,很容易给网民造成损失和困扰,甚至可能扰乱社会秩序,因而研究对此类网站进行高效识别的方法具有重要意义。提出利用深度残差神经网络解决博彩类网页识别问题,基于深度残差网络的原理设计了算法GamblingRec。经验证,算法准确率达到了95.16%,正样本召回率为93.21%,表明基于深度残差神经网络的方法能够用于博彩类网页识别,并能达到较高的识别性能。

摘要:针对当下球类陪练机器人人机交互能力不足的问题,提出一种基于树莓派和YOLOv5目标检测算法的新型人机交互模式,使机器人实现前进、后退、左移、右移、抛球、踢球6种不同的动作;通过对在3种不同环境(室内、室外晴天、室外阴天)下搜集的人体姿态数据集进行标定、训练后,得到6种姿态在3种环境中测试集上的识别准确率分别为:室内96.33%、室外晴天95%、室外阴天94.3%。相比基于特征匹配和其他利用手势等小目标检测的算法,基于该算法的机器人具有更高的检测速度和准确性,使机器人更加智能化。

摘要:针对生活垃圾的高效分类及搬运处理,设计了一款以边缘嵌入式AI设备JetsonNano为控制器的光电智能小车系统,该系统设计以YOLOv5为目标检测算法,以Pytorch1.8.1为深度学习框架。使智能小车从指定区域出发,通过自身的光电传感器在指定范围内搜寻垃圾,利用六轴机械臂对垃圾进行分拣并送到指定分类地点。对采集到的5048张图片(包括5种垃圾类别)进行300次的迭代训练,实验测试结果表明:平均精确度达到91.8%,准确率达到94.5%,召回率达到89.03%。

摘要:近年来,如何通过人工智能对人的面部表情进行识别分析成为一个研究热点,利用人工智能可以快速地分析人的面部情绪,并以此为基础进行进一步研究。在深度学习中,传统的卷积神经网络存在对面部表情特征的提取不充分以及计算机参数量较大的问题,导致分类准确率较低。因此,提出了基于VGG16网络的人脸表情识别算法,通过与InceptionV3、InceptionResNetV2、ResNet50等模型实验对比,结果表明,VGG16神经网络在FER2013PLUS测试数据集上的识别准确率为79%,准确率比传统的卷积神经网络高。

摘要:在自动检测中,由于道路损伤数据集存在小目标损伤难检测与类别不平衡问题,导致道路损伤检测的准确率低、虚假率高。为此,在DSSD(DeconvolutionalSingleShotDetector)网络模型的基础上,提出一种结合注意力机制和Focalloss的道路损伤检测算法。首先,采用识别精度更高的ResNet-101作为DSSD模型的基础网络;其次,在ResNet-101主干网络中添加注意力机制,采用通道域注意力和空间域注意力结合的方式,实现特征在通道维度上的加权与空间维度上的聚焦,提升对小目标道路损伤的检测效果;最后,为了减少简单样本的权重,增大难分类样本的权重,使用Focalloss来提高整体的检测效果。在GlobalRoadDamageDetectionChallenge比赛所提供的数据集上进行验证,实验结果表明,该模型的平均精度均值为83.95%,比基于SSD和YOLO网络的道路损伤检测方法的准确率更高。

摘要:由于多源传感数据及其噪声构成复杂的非线性可分空间,数据融合是目前在资源受限的传感网络中安全、准确和高效地消除冗余数据的重要方法。结合SVM泛化能力强、凸优化的特点,侧重分析了非线性可分多源数据集转化为高维线性可分空间的可行性方法。仿真实验结果表明,宽度参数范围预估方法可以加速高斯核宽度参数的确定。针对多分类情形,仿真实验结果表明,通过控制误差积累,更能确保分类的有效性。

摘要:介绍了中国移动IT云针对IaaS层的智能运维场景体系规划,选择了数据基础较好的两个典型应用场景“智能化指标异常检测”和“智能化告警关联与溯源”进行了研究和论证,分别分析了两个场景适用的算法和实现过程,论述了两个场景实施后的效果评估方法,并经实际生产验证了场景实施的效果。

摘要:考虑到当前电力行业仍缺少有效的领域词发现方法,以电力行业科技项目文本为原始语料库,将基于互信息与左右熵的统计特征与传统语言构词规则特征相融合,提出了电力文本成词率的概念。所提方法首先利用成词率对电力文本进行无监督筛选得到初始候选词集,然后对候选词集进行文本切片算法和常用词过滤操作,最后进行词嵌入和谱聚类得到最终所需的电力文本领域词。实验结果表明,所提出的方法准确有效,为电力文本的领域词发现提供了一种新方法。

摘要:针对Staple算法在由于相机运动出现模糊情况下跟踪精度下降的问题,提出一种基于背景权重直方图的改进Staple目标跟踪算法。首先,针对传统颜色直方图忽略空间性的问题,提出对直方图引入位置权重;其次,利用背景区域颜色直方图抑制背景信息对目标区域直方图的影响,提出引入背景权重直方图,并完成直方图分类器的构建。该算法在OTB2015测试集上与其他5个先进算法进行实验比较,结果表明在距离精度和成功率上总体效果相对Staple分别提升了3.7%和2%。

摘要:为了满足人们对更好解锁方式的需求,提出了一种基于语音指令的电子门锁解锁方法及系统。该方法的设计理念是:利用手机号码的唯一性识别用户身份;利用语音识别技术,实现利用不同的语音指令打开不同门锁。该系统由电子门锁、手机和互联网服务器组成。对该方法及系统进行了详细设计和说明,据此即可进行代码编写、电路设计等产品化设计工作。基于本方法及系统的电子门锁适用范围宽、解锁便捷,并具有更好的安全性、更高的性价比,对电子门锁或智能门锁行业的发展将会产生重要影响。

摘要:基于上交所主板市场A股企业的财务指标数据来预测企业的财务风险,样本数据包括1227家正常上市企业和42家被财务预警的企业,数据严重不平衡,通过重采样技术解决了分类器在不平衡样本中失效的问题,运用Bagging思想的集成机器学习对预测模型进行提升与优化。正确挑选出有财务危机企业的概率最高达到92.86%,在此基础上,样本的整体准确率在经过模型的集成之后提高了5.4%。集成模型提高了对上市企业的财务预警能力,能为企业的正常经营和投资者的安全投资提供一定的借鉴。

摘要:针对人工阅片工作量大、阅片质量不佳且容易出现漏检、错判等问题,将FasterRCNN目标检测模型应用于肝包虫病CT图像的检测,并对目标检测模型进行改进:基于图片分辨率低、病灶大小不同的特点,使用网络深度更深的残差网络(ResNet101)代替原来的VGG16网络,用以提取更丰富的图像特征;根据目标检测模型得出的病灶坐标信息引入LGDF模型进一步对病灶进行分割,从而辅助医生更高效的诊断疾病。实验结果表明,基于ResNet101特征提取网络的目标检测模型能够有效提取目标的特征,检测准确率相比原始检测模型提高2.1%,具有较好的检测精度。同时,将病灶坐标信息引入LGDF模型,相比于原始的LGDF模型更好地完成了对肝包虫病病灶的分割,Dice系数提高了5%,尤其对多囊型肝包虫病CT图像的分割效果较好。

摘要:特征工程可以自动地处理和生成那些判别性高的特征,而无需人为的操作。特征工程在机器学习中是不可避免的一环,也是至关重要的一环。提出一种基于强化学习(RL)的方法,将特征工程作为一个马尔可夫决策过程(MDP),在上限置信区间算法(UCT)的基础上提出一个近似的方法求解二分类数值数据的特征工程问题,来自动获得最佳的变换策略。在5个公开的数据集上验证所提出方法的有效性,FScore平均提高了9.032%,同时与其他用有限元变换进行特征工程的方法进行比较。该方法确实可以得到判别性高的特征,提高模型的学习能力,得到更高的精度。

摘要:随着信息技术的发展,人脸识别在支付、工作和安防系统中应用的越来越多。在边缘计算系统中,为了处理的速度,通常选择较小的神经网络进行人脸识别,这样会导致识别率低。并且在实际应用中大多都是对于图片质量较高的人脸可以很好地识别,但对于受光照影响较大、表情和姿态变化大的图片识别率不是很高。因此,选择SqueezeNet轻量级网络,该网络层数小,可以很好地运用于边缘计算系统中。采用了预处理的方法来对图片进行预处理,然后改进了SqueezeNet网络的损失函数以及加入了ResNet网络中的残差学习方法。最后通过对LFW和IJB-A数据集进行测试,该研究方法明显提高了识别率。

摘要:通信技术的普及给人们带来便捷的同时,电信欺诈行为也急剧增加。由于诈骗行为特征、号码类型等与正常业务具有极高相似性,传统基于统计的电信欺诈检测方法难于筛选。提出将用户通信关系转换为一组拓扑特征,建立通信社交有向图,将具有统计特征的顶点表示用户,具有关系特征的边表示他们之间的活动。在通信社交图基础上,通过图卷积模块捕获用户的通信行为规律和通信社交关系特征,通过池化读出机制聚合通信社交网络的潜在特征,以识别电信欺诈行为。真实通信历史数据验证表明了该方法的有效性。

摘要:边缘设备的快速发展和深度学习的落地应用越来越多,两者结合的趋势越发明显。而针对低功耗边缘设备AI应用的潜力还未完全开发出来,大量设备隐藏着大量计算能力,释放其潜力所带来的社会效益和经济效益是非常明显的。因此,以目标检测任务中较为常见的人脸检测为例,将MTCNN人脸检测算法改进并移植到资源极其紧张的低功耗嵌入式平台,在一定环境条件下,最终成功地检测到人脸,并绘制出人脸候选框,结合舵机云台具备了一定的人脸跟踪能力。

摘要:计算机通信网络技术高速发展,日新月异,随之涌现的网络攻击、破坏现象形态各异、层出不穷。态势感知系统为网络安全提供了全面保障,提高态势评估和态势预测建模的稳定性、精准性和快速性是态势感知系统研究的重要方向。深度信念网作为一种深度学习智能算法,为网络安全态势评估和态势预测的精确性、理论化带来新方向。考虑深度信念网算法采用受限玻尔兹曼机作为基础网络,逐层预训练和微调为网络核心部分。构建广义网络安全态势评估指标体系,并建立计算机通信网络安全的态势评估和态势预测数据驱动模型。通过入侵检测数据集CIC-IDS2017进行实验仿真,验证了该模型的精准性和有效性。

摘要:Tor是一种基于洋葱路由通信协议建立的隐蔽加密通信系统。该系统基于互联网现有路由、数据加密等协议,构建了一套保护通信实体的身份隐匿机制,使得经过Tor网络传播的数据难以被有效追踪和分析。然而近年来这项隐蔽通信技术被罪犯大量使用,已成为网络犯罪和非法交易的温床。为有效应对该问题,提出一项基于机器学习的Tor网络识别检测技术,通过主动生成Tor网络流量,基于机器学习技术实施流特征提取与检测,从而发现参与Tor通信的网络实体及其通信类型,进而检出潜在的恶意暗网用户。实验表明,该方法可有效识别Tor通信实体以及通信行为,如电子邮件和FTP应用等。

摘要:基于软硬件协同设计的思想,利用HLS工具,在PYNQ-Z2平台上设计并实现了一个卷积神经网络加速器,对卷积运算采用矩阵切割的优化方法,均衡了资源消耗和计算资源,使得加速器的性能达到了最优。利用MNIST数据集对加速器IP核进行性能测试,实验结果表明:对单张图片的测试,该加速器相对于ARM平台实现了5.785的加速效果,对于1000张图片的测试则可达到9.72的加速效果,随着测试图片数量的不断增加,加速器的性能也将越来越优。

摘要:群体智能在解决非确定性多项式(NP)问题或搜索空间过大的问题时有着显著优势。将鸽群优化(PigeonInspiredOptimization,PIO)算法应用于入侵检测系统的特征选择中。提出基于Sigmoid的PIO(SPIO)和基于Cosine余弦相似度的PIO(CPIO)算法对入侵检测数据集KDDCUP99进行特征选择,并用机器学习的方法进行实验,建立模型并评估结果。

摘要:缺陷检测对于古建筑的保护和修缮具有重要的意义,传统的地砖缺陷检测通过目视检查,存在受人力影响大、耗时长等限制。基于深度学习的良好应用前景,建立故宫地砖缺陷的数据集,提出改进型FasterR-CNN的网络。首先,构建可变形卷积,通过网络学习并提取地砖中的缺陷特征;然后,将特征图输入区域生成网络中生成候选区域框,将生成的特征图和候选区域框进行池化操作;最后,输出缺陷检测结果。在故宫地砖图片数据集的测试下,改进后的模型平均准确率均值到达92.49%,与FasterR-CNN模型相比提高了2.99%,更适用于地砖缺陷检测。

摘要:深入分析了当前倒车影像系统在实际使用场景上的不足,介绍了雷达存在的辐射面有限、角度盲区、物体识别方面的缺陷,以及毫米波雷达的高成本难以普及应用。提出了基于ADAS的汽车倒车防碰撞系统设计,对系统倒车功能做了深入的原理分析,针对基于倒车摄像头图像分析的ADAS算法详细介绍了其技术关键点和基于倒车场景融合特征的创新应用,算法识别效果精准有效。针对不同车辆摄像头安装位置和朝向的差异创新设计了灵活的预警和报警区域的调节功能,结合TTS语音提醒和图文显示提醒司机采取合适的操作保障行车安全,极大地改善了该倒车防碰撞系统的用户体验和实际作用,为司机的安全行车提供了有力保障。

摘要:提出基于分块LBP-TOP(LocalBinaryPatternsfromThreeOrthogonalPlanes)特征和改进的加权稀疏表示分类解决微表情识别与专用线车辆状态检测问题。首先利用LBP-TOP特征描述符对从分块图像中选择出的有效块进行提取特征,将提取的特征作为字典,采取加权稀疏表示(WeightedSparseRepresentation,WSRC)和对偶增广拉格朗日乘子法(DualAugmentedLagrangeMultiplier,DALM)相结合的算法(WSRC_DALM)进行稀疏表示分类;然后利用不同尺寸的块划分图像,选择有效块提取特征,特征融合后参与分类。在CASMEⅡ与SAMM表情数据库上采用“留一人交叉验证”(LeaveOneSubjectOut,LOSO)的分类方法进行5分类,得到的识别率分别达到了77.30%与58.82%,在车辆状态检测检测数据库上的实验达到了84.60%的检测率。实验结果表明了所提出算法的有效性。

摘要:随着科学技术的不断进步,不法分子窃电手段日趋专业化多样化,而传统的防窃电技术实时性及可行性较低。研究对运行中智能电能表用电信息的数据采集及特征提取,分析异常用电数据,应用机器学习的方法对特征值进行学习,并推导出用电异常的判断阈值,采用关联规则数据挖掘方法对独立检测的结果进行融合,从而实现窃电数据的挖掘。最后验证了模型建立的准确性,并推导出用电异常案例的甄别方法。

摘要:在数字化矿山中,行人检测系统能够大幅减少事故伤亡,是保护工人安全的重要手段。为了构建高性能的行人检测系统,提出了一种基于边窗滤波和扩张卷积的矿井行人检测模型。具体来说,针对复杂恶劣的矿井环境,采用边窗滤波抑制视频图像中的干扰信号,提升图像质量。此外,考虑到行人目标的多尺度特性,在模型中引入扩张卷积增加特征的感受野,进而提升检测性能。大量的对比实验证明了边窗滤波和扩张卷积的有效性,模型在矿井数据集上获得94.3mAP和99.1%检测率的优异性能。

摘要:传统的卷积神经网络量化算法广泛使用对称均匀量化操作对模型权值进行量化,没有考虑到相邻权值量化之间的相互关系,即上一个权值的量化操作产生的量化噪声可以通过调整之后权值的量化方向加以弥补。针对上述问题,提出了一种基于权值交互思想的三值卷积神经网络量化算法,达到了16倍的模型压缩比,以ImageNet作为数据集,量化后的AlexNet和ResNet-18网络上模型预测准确率只下降了不到3%。该方法达到了较高的模型压缩比,具有较高的精度,可以用于将卷积神经网络移植到计算资源有限的移动端平台上。

摘要:在煤矿生产中,工人由于未佩戴安全帽而受伤的事故时有发生。为了构建数字化安全帽监测系统,提出了一种基于卷积神经网络的安全帽佩戴检测模型。采用先进的Darknet53网络作为模型主干,用于提取图片的特征信息。此外,在模型中引入注意力机制用于丰富特征之间的信息传播,增强模型的泛化能力。最后,制作了安全帽佩戴预训练数据集和实际矿井场景数据集,并在PyTorch平台进行全面的对比实验验证了模型设计的有效性,模型在实际矿井场景数据集上获得92.5mAP的优异性能。

摘要:提出一种基于音视频匹配层自适应加权融合的身份识别方法。在不同程度的噪声情况下,图像与声音的识别率会随噪声的增强而降低,凭借单个生物模态的识别,难以达到很好的预测结果;而且两种模态融合时的权值不同,融合系统的稳定性效果也不同。采用双模态的自适应加权融合不仅可以有效地弥补不同生物模态识别之间的优缺点,而且可以自适应选择最优的权值进行决策。实验表明,该方法的理论推测成立,比单模态的身份识别具有更高的识别率与鲁棒性。

摘要:传统的道路裂缝识别方法有基于R-CNN、SPPnet、HOG+SVM等多种方法,但识别精度低、检测速度慢。针对这些缺点,提出一种基于FasterR-CNN的道路裂缝识别方法。首先,采集道路裂缝图像,建立PascalVOC数据集;其次,基于谷歌开发的TensorFlow深度学习框架,用数据集对FasterR-CNN进行训练并分析各项性能参数指标。实验结果表明,在迭代20000次的情况下,可将训练损失降到0.1885,AP值达到0.7802,取得了良好效果。

摘要:非法入侵者通过伪装人脸欺骗识别系统,给人脸识别应用带来严重威胁。现有人脸活体检测方法多为在同一数据集内进行训练和测试,当应用在跨数据集场景中时效果并不理想。针对这一问题,提出了利用HOG等算法对上下文环境中的线索信息进行提取,提取出来的特征送入单类支持向量机进行训练、分类。将分类结果与上下文环境中异常线索的探测结果相结合。算法在公开的数据集NUAA和CASIA-FASD上进行了验证,实验结果表明在跨数据集检测时该算法的泛化能力及检测准确率较已存在算法有所提高。

摘要:为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(LatentDirichletAllocation,LDA)与Doc2Vec模型的文本相似度检测方法,并把该算法得到的模型命名为HybridDL模型。该算法通过Doc2Vec对文档训练得到文档向量,再利用LDA模型得到文档主题与各个主题下特征词出现的概率,对文档中各主题及特征词计算概率加权和,映射到Doc2Vec文档向量中。实验结果表明,新算法模型比传统的Doc2Vec模型对相似文本的判断更加敏感,在文本相似度检测上具有更高的准确度。

摘要:现有的文本相似度度量方法主要采用TF-IDF方法,把文本建模为词频向量,但未考虑文本的结构特征。现将文本的结构特征和TF-IDF方法进行融合,提出了一种面向科技项目文本的相似度度量方法。该方法首先对文本进行预处理,其次根据文本的结构特征提取模块文本,然后使用TF-IDF方法提取每个模块文本的TOP-N关键词,作为模块文本的特征向量表示,最后使用余弦聚类计算文本的相似度。实验结果表明,在电力行业的科技项目文档数据集上,所提方法优于TF-IDF方法。

摘要:伪装人脸识别在刑侦安防领域有着巨大的应用价值。针对现阶段对伪装人脸识别的研究较少、算法鲁棒性不强等缺点,提出了基于深度神经网络的伪装人脸识别算法。改进了SqueezeNet网络模型,并将其与FaceNet网络架构进行结合,用于人脸图像的身份识别。通过在训练数据集中引入伪装人脸图像,让网络学习到伪装的特征。实验结果表明,该算法识别准确率接近90%,相较于其他网络模型,具有更好的识别效果。

摘要:针对传统话题检测方法在微博短文本上存在高维稀疏的缺陷,提出了一种基于特征融合的K-means微博话题发现模型。为了更好地表达微博话题的语义信息,使用在句子中共现的词对向量模型(Biterm_VSM)代替传统的向量空间模型(VectorSpaceModel,VSM),并结合主题模型(LatentDirichletAllocation,LDA)挖掘出微博短文本中的潜在语义,把两个模型得到的特征进行特征融合,并应用K-means聚类算法进行话题的发现。实验结果表明,与传统的话题检测方法相比,该模型的调整兰德系数(AdjustedRandindex,ARI)为0.80,比传统的话题检测方法提高了3%~6%。

摘要:研究了利用人工神经网络对不同频带、栅宽的砷化镓高电子迁移率晶体管进行散射参数和噪声参数提取,基于两个神经网络分别对两组散射参数和噪声参数进行训练学习,比较不同隐含层和神经元数目得出平均相对误差和均方误差,找到对应散射参数和噪声参数神经网络的最佳的隐含层数和神经元数目是8-8-6和6-4。测试结果表明,散射参数平均相对误差的平均值为2.79%,噪声参数平均相对误差的平均值为2.05%,与常规单个神经网络结构相比,在平均相对误差方面提高了31.3%,表明该模型具备更好的精度和可靠性,十分适用于宽禁带、强非线性特征的射频晶体管参数提取。

摘要:针对中文文本自动校对提出了一种新的基于Seq2Seq和Bi-LSTM结合的深度学习模型。与传统的基于规则和概率统计的方法不同,基于Seq2Seq基础结构改进,加入了Bi-LSTM单元和注意力机制,实现了一个中文文本自动校对模型。采用F0.5与GLEU指标评价,通过公开的数据集进行不同模型的对比实验。实验结果表明,新模型能有效地处理长距离的文本错误以及语义错误,Bi-RNN以及注意力机制的加入对中文文本校对模型的性能有显著提升。

摘要:针对传统的浅层特征所提取特征的判别性有限、深度特征需要大量带标记样本且训练过程耗时长的问题,提出一种深度及浅层特征融合算法用于人脸识别。首先提取人脸的HOG特征并进行判别性降维;同时,提取人脸图像的PCANet特征并降维;其次,将降维后的深浅特征进行融合,并进一步提取判别性特征;最后,采用SVM分类器进行分类并在AR和YaleB数据库上对算法进行验证。实验结果证明,该算法能够比单独选用深度特征和浅层特征进行分类达到更高的识别率,且对特征维数具有更强的鲁棒性。

摘要:针对卷积神经网络(CNN)在通用CPU以及GPU平台上推断速度慢、功耗大的问题,采用FPGA平台设计了并行化的卷积神经网络推断系统。通过运算资源重用、并行处理数据和流水线设计,并利用全连接层的稀疏性设计稀疏矩阵乘法器,大大提高运算速度,减少资源的使用。系统测试使用ORL人脸数据库,实验结果表明,在100MHz工作频率下,模型推断性能分别是CPU的10.24倍,是GPU的3.08倍,是基准版本的1.56倍,而功率还不到2W。最终在模型压缩了4倍的情况下,系统识别准确率为95%。

摘要:传统人脸检测算法往往不能自动地从原始图像中提取有用的检测特征,而卷积神经网络可以轻易地提取高维度的特征信息,广泛用于图像处理领域。针对上述缺点,采用简单高效的深度学习Caffe框架并通过AlexNet网络训练,数据集为LFW人脸数据集,得出一个模型分类器,对原始图像数据进行图像金字塔变换,并通过前向传播得到特征图,反变换得出人脸坐标,采用非极大值抑制算法得出最优位置,最后达到一个二分类的人脸检测结果。该方法可以实现不同尺度的人脸检测,具有较高的精度,可用于构建人脸检测系统。

摘要:提出将Transformer模型应用于中文文本自动校对领域。Transformer模型与传统的基于概率、统计、规则或引入BiLSTM的Seq2Seq模型不同,该深度学习模型通过对Seq2Seq模型进行整体结构改进,从而实现中文文本自动校对。通过使用公开数据集对不同模型进行对比实验,采用准确率、召回率与F1值作为评价指标,实验结果表明,Transformer模型相比较于其他模型,在中文文本自动校对的性能上有了大幅提升。

摘要:图像分类是根据图像的信息将不同类别的图像区分开来,是计算机视觉中重要的基本问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本。该系统基于Caffe深度学习框架,首先对数据集进行训练分析构建深度学习网络,提取数据集图像特征信息,得到数据对应的分类模型,然后以bvlc-imagenet训练集模型为基础,对目标图像进行扩展应用,实现“以图搜图”Web应用。

摘要:为建设国家电网客户服务中心的智能对话系统,需要从大量文档、知识库、对话等数据中提炼知识形成知识图谱,提出一种融合事实图谱和事理图谱的新型知识图谱框架,能够基于多源异构数据共建新型知识图谱,在国网领域精准问答、客服系统知识支撑、对话管理引导、知识推理等方面均有较好性能。融合后的图谱及应用系统在国网客服中心问答平台中投入使用,大幅提升了客服人员工作效率和服务质量。

摘要:针对目前齿轮箱系统在利用神经网络故障诊断时存在正确识别率低和依靠经验选择参数的问题,提出了基于粒子群优化BP网络的齿轮箱故障诊断方法。简要介绍利用齿轮振动原理提取特征参数建立故障模型,该模型以齿轮箱特征向量为输入、故障类型为输出,详细分析了通过BP神经网络、概率神经网络和粒子群优化BP神经网络实现齿轮箱故障诊断。仿真结果表明,BP神经网络对齿轮箱故障诊断收敛速度慢,故障识别率为82%;概率神经网络的模型故障诊断识别率依据经验选取spread值决定,故障识别率最大为98%;粒子群优化后的BP神经网络故障诊断分类识别率为100%且自适应能力强。

摘要:探讨卷积神经网络(ConvonlutionalNeuralNetwork,CNN)在肝包虫病CT图像诊断中的应用。选取两种类型的肝包虫病CT图像进行归一化、改进的中值滤波去噪和数据增强等预处理。以LeNet-5模型为基础提出改进的CNN模型CTLeNet,采用正则化策略减少过拟合问题,加入Dropout层减少参数个数,对二分类肝包虫图像进行分类实验,同时通过反卷积实现特征可视化,挖掘疾病潜在特征。结果表明,CTLeNet模型在分类任务中取得了较好的效果,有望通过深度学习方法对肝包虫病提供辅助诊断和决策支持。

摘要:设计并实现了NVIDIA嵌入式平台JetsonTX2上的车辆跟踪系统。从摄像头采集YUV420格式的视频数据,然后将数据送到TegraParker硬件HEVC编码器进行编码,输出码流经过RTP封装后通过UDP广播发送,利用Gstreamer多媒体框架开发接收及解码程序,最后,针对获取的视频动态进行车辆的跟踪与显示。运行YoloV2检测算法,对车辆进行检测,从而为跟踪系统提供跟踪对象。利用Kalman滤波算法对车辆的位置进行预测,再经过Meanshift算法进行车辆跟踪。系统能够实现帧率为60f/s的超高清4K视频实时编码和传输,此系统中的HEVC硬件编码器编码速率比PC端x265编码器大3个数量级,PSNR比PC端x265编码器高6dB,更加适用于智能交通中。

摘要:神经网络的存储能力一直是一个重大的缺陷,其存储主要体现在权重系数上,因此参数量一多,训练起来就十分困难。给神经网络设计一个外部关联存储器,能有效对神经网络的输入进行关联查询,并将查询的结果作为辅助输入传入到神经网络中去。此外,设计了自然语言语句的向量嵌入模型,并将模型和关联存储器集合起来形成一个自动关联语句语义向量的关联存储系统,其性能指标达到了设计要求。

摘要:针对视频序列中运动目标跟踪过程中可能出现的目标旋转、遮挡、形变等原因造成的跟踪失败问题,提出了一种基于目标多区域分割的跟踪方法。主要通过将目标划分为多个部分相互重叠的区域,然后选择跟踪过程中相对稳定的多个区域进行定位,进而对跟踪的目标采用不同目标区域权重更新不同的模板更新策略,这样选择主要可以增加算法的抗遮挡、抗旋转能力。实验结果表明,该方法对目标遮挡、旋转等具有一定的适应能力。

摘要:对绝缘栅双极型晶体管进行参数预测可以有效地避免因其失效带来的经济损失和安全问题。对绝缘栅双极型晶体管参数进行分析,设计了一个基于LSTM网络的绝缘栅双极型晶体管参数预测SoC硬件系统。该系统使用ARM处理器作为总控制器,控制各个子模块的调用和数据的传输,FPGA内通过对矩阵向量内积算法进行优化提高LSTM网络内部的数据运算速度,并且采用多项式近似的方法降低了激活函数所占用的资源。实验结果表明,系统的预测平均准确率为92.6%,计算速度相比于CPU快了3.74倍,同时具有低功耗的特点。

摘要:近年来卷积神经网络和循环神经网络在文本分类领域得到了越来越广泛的的应用。提出一种卷积神经网络和长短时记忆网络特征融合的模型,通过长短期记忆网络作为池化层的替代来获得长期依赖性,从而构建一个联合CNN和RNN的框架来克服单卷积神经网络忽略词语在上下文中语义和语法信息的问题。所提出的方法在减少参数数量和兼顾文本序列全局特征方面起着重要作用,实验结果表明,可以通过更小的框架来实现相同级别的分类性能,并且在准确率方面超越了同类型的其他几种方法。

摘要:使用财务数据构建一个多因子选股模型,在支持向量机分类上进行预测优化。选股上使用排序法对数据进行预处理,再使用支持向量机对股票收益进行分类预测,最后使用数据到分离超平面的距离进行排序,优化支持向量机的分类预测。实证中,从中证500成分股中选出股票组合,在2016年四季度到2018年一季度获得累计收益88.96%。择时策略的均线策略和通道突破策略均能有效降低波动率和回撤。还使用高频数据来降低均线策略的滞后性,波动率又得到进一步降低。本模型利用支持向量机性质提高预测精度,结合技术分析优化了策略的收益,为多因子选股和交易提供了新的研究视角。

摘要:身份认证技术有了很大的发展,随之不断出现的是各种伪造合法用户信息的欺诈手段。针对这一问题,提出一种基于深度学习人脸活体检测算法,分析了真实人脸和欺诈人脸之间的区别,将真实人脸和照片进行数据去中心化、zca白化去噪声、随机旋转等处理;同时,利用卷积神经网络对照片的面部特征进行提取,提取出来的特征送入神经网络训练、分类。算法在公开的数据库NUAA上进行了验证,实验结果表明该方法降低了计算的复杂度,提高了识别准确率。

摘要:针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统。设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计。实验结果表明,与CPU相比,CPU+FPGA的异构系统是双核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是双核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,当前设计在性能上超过之前的工作。

摘要:针对车站、商场等大型场所中客流量大、背景复杂等原因导致多尺度人脸检测精度低的问题,建立了一种基于RefineDet多层特征图融合的多尺度人脸检测方法。首先利用第一级网络进行特征提取并在不同尺度的特征图上粗略预估人脸位置;然后在第二级中通过特征金字塔网络将低层特征与高层特征融合,进一步增强小尺寸人脸的语义信息;最后,通过置信度和焦点损失函数对检测框进行二次抑制,达到边框的精确回归。实验中将人脸候选区域的宽高比只设置为1:1,以此来降低运算量并提高人脸检测精度。在WiderFace数据集上的实验结果表明,该方法能有效检测不同尺度的人脸,在Easy、Medium、Hard3个子数据集上测试结果分别为93.4%、92%、84.4%的MAP,尤其对小尺寸人脸的检测精度有明显提高。

摘要:长期以来,各类交通事故严重影响了人们生命财产安全和社会经济发展。交通事故分析是对交通事故资料进行调查研究,发现事故动向和各种影响因素对事故总体的作用和相互关系,以便定量地认识事故现象的本质和内在规律。通过对交通事故中记录驾驶员违法行为的文本数据进行分析,提出了一种文本主题提取模型和技术,来挖掘交通事故中驾驶员风险驾驶因素,解决以往交通事故统计中交通违法行为难以挖掘的问题,计算出影响交通事故的最大支配因素。最后以北京地区一般程序处理的交通事故为例,结合北京市交通管理专家经验,验证该模型可应用于交通事故中违法行为的主题提取,结论与长期治理经验相吻合。

摘要:针对图像质量客观评价方法在实际应用场景下性能退化的问题,将人眼视觉特性融入图像特征处理的多个环节,提出一种融合视觉结构显著和视觉能量显著特征互补的方法。首先,根据人眼特性对图像的灰度能量、对比度能量和梯度结构三层互补特征进行空域-频域联合变换处理;其次,分别提取前述三层视觉特征的多通道信息并进行评价;最后,基于视觉特性和图像失真度将各层视觉特征评价从内层至外层逐步自适应综合。实验表明,本方法具有较高的水平和更好的稳定性,提高了实际应用场景下的评价性能。

摘要:为了验证股票的价格运动与过去应该是相似的这一假设,运用K近邻算法,将价格运动简单划分为涨跌两类进行预测,进行假设验证。使用滑窗方法比较现在的价格运动与何时的历史价格更为相似,将多个K近邻模型组合成集成模型,实现模型的泛化和策略收益的调整。使用中证500指数的历史价格数据进行预测实证,2017年~2018年9月的预测结果显示单个K近邻模型策略获得76.72%的收益,现在的价格运动与遥远的过去更为相似,集成模型能更好地控制风险。该模型利用K近邻模型的含义验证了股票价格运动具有相似性,可以作为证券交易的择时策略。

摘要:人脸识别技术是深度学习的重要研究领域。为了克服传统开环人脸认知模式以及深层神经网络结构的缺陷,模仿人类实时评测认知结果自寻优调节特征空间和分类认知准则的认知模式,借鉴闭环控制理论思想,探索了一种基于深度集成学习的人脸智能反馈认知方法。首先,基于DEEPID网络建立人脸图像由全局到局部具有确定映射关系的非结构化特征空间;其次,基于特征可分性评测和变精度粗糙集理论,从信息论角度建立非结构化动态特征表征的人脸认知决策信息系统模型,以约减非结构化特征空间;再次,采用集成随机权向量函数连接网络,构建简约非结构化特征空间的分类认知准则;最后,构建人脸认知结果熵测度指标,为人脸特征空间和分类认知准则的自寻优调节机制提供量化依据。实验结果表明,较已有方法,该方法有效地提高了人脸图像的识别率。

摘要:随着计算机技术的发展,融合计算机视觉、机器学习、深度学习等技术的火灾图像处理技术得到了广泛的研究和应用。针对传统图像处理方法预处理过程复杂且误报率高等问题,提出一种基于深度卷积神经网络模型进行火灾检测的方法,其减少了复杂的预处理环节,将整个火灾识别过程整合成一个单深度神经网络,便于训练与优化。针对识别过程中类似火灾场景对火灾检测产生干扰的问题,利用火灾的运动特性,创新性地提出利用火灾视频前后帧火灾坐标位置变化来排除灯光等类似火灾场景对检测的干扰。对比了众多深度学习开源框架后,选择Caffe框架进行训练及测试,实验结果表明,该方法实现了对火灾图像的识别和定位,适应于不同的火灾场景,具有很好的泛化能力和抗干扰能力。

摘要:针对在进近着陆的过程中,仪表着陆系统(ILS)易受到外界环境及空域的干扰,导致导航精度降低的问题,提出一种利用惯性导航系统(INS)与GBAS着陆系统(GLS)进行改进的组合导航算法,将组合导航系统输出位置信息之间的差值作为BP神经网络改进的无迹卡尔曼滤波器(UKF)的量测值,通过最优加权的方法得到系统的全局最优估计值。相比于传统的联邦滤波算法,该算法能有效降低测量噪声,减小飞机进近着陆时的误差,提高导航精度。

摘要:基于特征提取和模式识别的多体制通信信号自动调制识别技术是软件无线电领域中的重要研究课题,是复杂电磁环境下频谱管理、频谱检测等非协作通信领域的关键技术之一。提出一种基于深度学习的通信信号调制模式识别算法,应用自编码技术进行特征提取,获得具有较好的抗干扰能力的特征集,然后使用BP神经网络对经过筛选的特征进行分类识别,实现了MQAM通信信号调制模式自动识别。仿真实验结果表明,所提出的方法分类识别效果好,有效提高了数字调制信号自动识别的抗干扰能力。

摘要:4G网络技术的成熟使得用户对运营商的业务需求越来越高,如何维系用户和通过对用户属性的研究来迎合用户对业务的需求,建立方便快捷的体验服务手段,建设维系挽留系统是我国通信运营商未来发展的重中之重。首先分析移动用户维系发展现状,提出用户维系发展属性。其次,采用数据挖掘方法建立以用户稳定度和用户价值评价为基础的数据挖掘分析模型,并通过用户数据进行验证。最后,针对存量维系如何进行多渠道精准推送提出进一步展望。

摘要:由于图像中的雨线条纹具有不同形状、尺寸且分布不均匀,单一神经网络学习分布不均匀的雨密度能力弱,去雨效果不显著,对此提出雨密度感知引导扩张网络对单张图片去除雨的方法。网络分为两部分:(1)雨密度感知网络对不同密度雨的图片进行分类(大雨、中雨、小雨);(2)联合雨密度感知分类信息引导扩张网络学习不同的雨密度特征细节,用于检测雨线和去雨。实验证明了该方法在合成和真实数据集上去雨的有效性。

摘要:深度神经网络由于结构类似于生物神经网络,因此拥有高效、精准抽取信息深层隐含特征的能力和能够学习多层的抽象特征表示,且能够对跨域、多源、异质的内容信息进行学习等优势。提出了一种基于多用户-项目结合深度神经网络抽取特征、自学习等优势实现信息个性化推荐的模型,该模型通过对输入多源异构数据特征进行深度神经网络学习、抽取,再融合协同过滤中的广泛个性化产生候选集,然后通过二次模型学习产生排序集,实现精准、实时、个性化推荐。通过真实数据集对模型评估实验,实验结果表明,该模型能够很好地学习、抽取用户隐特征,并且能够一定程度上解决传统推荐系统稀疏性、新物品等问题,同时实现了更加精准、实时、个性化的推荐。

摘要:图像着色的目标是为灰度图像的每一个像素分配颜色,它是图像处理领域的热点问题。以U-Net为主线网络,结合深度学习和卷积神经网络设计了一个全自动的着色网络模型。在该模型中,支线使用卷积神经网络SE-Inception-ResNet-v2作为高水平的特征提取器,提取图像的全局信息,同时在网络中使用PoLU(PowerLinearUnit)函数替代线性整流函数(ReLU)。实验结果证明此着色网络模型能够对灰度图像进行有效的着色。

摘要:针对卷积神经网络(CNN)中空间上的指静脉信息丢失的问题,提出了一种基于胶囊网络(CapsuleNetwork,CapsNets)的指静脉识别算法。CapsNets在整个学习过程中以“胶囊”的形式从底层传递至高层,如此以向量的形式封装指静脉的多维特征,特征会在网络中被保存,而不是丢失后进行恢复。采用60000张图像作为训练集,10000张图为测试集,通过对图像增强、裁剪后进行网络学习。通过实验表明,CapsNets的网络结构特征相比CNN在处理脊线区域时效果更加明显,对比VGG精确度增加了13.6%,loss值也收敛到0.01。

摘要:设计了一种基于深度学习的实时识别硬件系统框架。该系统框架使用Keras完成卷积神经网络模型的训练并提取出网络的参数,利用ZYNQ器件的FPGA+ARM软硬件协同的方式,使用ARM完成对实时图像数据的采集、预处理及显示,通过FPGA实现卷积神经网络的硬化并对图像进行识别,再将识别结果发送至上位机进行实时显示。系统框架采用MNIST和FashionMNIST数据集作为网络模型硬化试验样本,实验结果表明,在一般场景下该系统框架能够实时、准确地完成图像数据的获取、显示及识别,并且具有可移植性高、处理速度快、功耗低的特点。

摘要:手写体数字的识别是人工智能识别系统中的重要组成部分。因个体手写数字的差异,现有识别系统准确率较低。基于TensorFlow深度学习框架完成手写体数字的识别及应用,首先建立TensorFlow深度学习框架,并分析了Softmax、卷积神经网络(CNN)模型结构,再对手写体数据集MNIST的60000个样本进行深度学习,然后进行10000个样本的测试对比,最后移植最优模型到Android平台进行应用。实测数据验证,相对于传统的Softmax模型,基于TensorFlow深度学习CNN模型识别率高达99.17%,提升了7.6%,为人工智能识别系统的发展提供了一定的科研价值。

摘要:针对目前深度学习中的卷积神经网络(CNN)在CPU平台下训练速度慢、耗时长的问题,采用现场可编程门阵列(FPGA)硬件平台设计并实现了一种深度卷积神经网络系统。该系统采用修正线性单元(ReLU)作为特征输出的激活函数并使用Softmax函数作为输出分类器。利用流水线技术并针对每一层的特征运算进行了并行处理,从而能够在1个系统时钟周期内完成整个CNN中的295次卷积运算。系统最后采用MNIST数据集作为实验样本,实验结果表明,在50MHz的工作频率下,FPGA的训练用时相较于通用CPU的训练用时提升了8.7倍,经过2000次迭代后系统识别的准确率为92.42%。

摘要:基于Google第二代人工智能学习系统TensorFlow构建神经网络对烟雾图像进行识别检测,通过改进的运动检测算法截取疑似烟雾区域图像,并结合PCA降维算法和InceptionResnetv2网络模型在TensorFlow平台下进行烟雾特征的训练识别。该算法实现了较大范围的火灾实时检测报警,经过实验证明整个检测过程准确地识别了视频流中的烟雾区域,相比于传统烟雾识别方法具有更高的准确率和自适应性,为大范围的火灾烟雾报警提供了一种有效方案。

摘要:提出了一种用于图像分类的卷积神经网络,将不同池化方式对图像分类的影响进行了分析对比,采用重叠池化和dropout技术,较好地解决过拟合问题。与传统神经网络相比,该方法在CIFAR-10数据集上获得了较好的结果,在测试集上准确率比训练集上准确率高9%左右。

摘要:提出一种基于机器视觉的智能导盲眼镜系统的设计方案。采用三星公司Cortex-A8架构的S5PV210作为中央处理器,搭载Linux系统,配备双目采集、GPS定位、语音播报、GSM短信、语音通话、无线传输六大核心功能模块搭建智能导盲眼镜系统的硬件平台,结合深度学习算法在远程云服务器上完成了对目标场景的智能识别,最后以语音的形式实时对盲人的行走作出准确引导。系统测试结果表明,该智能导盲眼镜系统在测试环境下不仅能对盲人出行正确导航,还具有一定的目标识别能力,能帮助盲人进行简易物品归类。该系统还兼有GPS定位、语音通话、GSM短信等多项辅助功能。

摘要:无人机的广泛运用,在给人们带来便利的同时,也引发了不良影响。比如,无人机飞入禁飞区引发安全问题,由于不正当的使用侵犯公民的隐私等,因此需要构建一个无人机警察系统,对无人机实施监控,遏制乱飞现象。采用传统的识别方法,灵活性不足,精度也不够高。为此提出一种基于深度学习的无人机识别算法,通过训练一个基于卷积神经网络(CNNs)的学习网络,得出一个高效的识别模型,实现无人机和非无人机间的分类。模型的测试结果表明,该方法具有较高的识别率。

摘要:现有生产线工业机器人抓取点固定,工件只能以固定的姿态提前摆放在固定的位置,这种装配模式很难满足复杂的工业生产要求且效率低下。设计了基于视觉引导的机器人装配系统改进原有系统。设计了机器视觉系统,实现了工件的快速识别、定位以及姿态确定功能;设计了抓放系统,实现了工件的精确抓取和安装功能;采用VisualStudio的MFC开发,实现图像处理算法,并利用Socket通信将坐标和姿态数据发送给机器人。通过实验验证本系统具有良好的稳定性和快速性,可以满足生产的要求,大幅提高生产效率。

THE END
1.全球364个车标,值得收藏全球364个车标,值得收藏 364个汽车标志!一天一个够认一年的!再也不怕在路上遇到陌生车标了! 文章由易车号作者提供https://news.m.yiche.com/hao/wenzhang/38823562/
2.360个车标大集合,奔驰宝马奥迪不算豪车,能认出100个算大神众所周知,车标作为汽车的特定符号或品牌图腾,除了装饰美化作用外,每个车标也都有设计寓意,比如代表了该汽车品牌的文化内涵和企业的发展,也有的车标能深刻体现出产品的性格。如今汽车品牌越来越多,形形色色,我们作为一个有着年销量超2000万体量的全球第一消费大国,大街上的汽车各式各样,车标也是五花八门。那对于车标https://www.yoojia.com/ask/17-11825353158599246878.html
3.名车标志识别图片大全图片—100个常见车标大全100个常见车标大全13-30 此外豪华品牌还有雷克萨斯、玛莎拉蒂、林肯、悍马、阿尔法罗密欧、Jeep、MINI、捷豹、路虎、沃尔沃、英菲尼迪、凯迪拉克、讴歌、DS、特斯拉等。100个常见车标大全31-48 在国内常见的外企汽车品牌,主要有大众、Smart、本田、丰田、日产、马自达、斯巴鲁、三菱、铃木、福特、别克、雪佛兰、斯柯达、标致https://baijiahao.baidu.com/s?id=1728608657774667357&wfr=spider&for=pc
4.车标大全汽车标志图片大全名车标志图片及名称→MAIGOO知识【车标大全】汽车标志图片大全 名车标志图片及名称壮志凌云 0 ★★★ 关注 如果对一个汽车品牌感兴趣,你应先从它的标志开始;如果喜欢一个汽车品牌,你至少要了解它的标志意义;如果要了解一个汽车企业的发展历程,你要先知道它的标志演变。以下名车标志品牌,你认识多少? 国产汽车标志 比亚迪 成立时间:1995年 https://m.maigoo.com/goomai/160836.html
5.谢元谢元,男,人民交通出版社汽车专业高级策划编辑,现任新浪微博社区委员会专家成员。 国籍 中国 出生日期 1979年 毕业院校 北京理工大学 职业 编辑 中文名称 谢元 民族 汉族 出生地 新疆维吾尔自治区 代表作品 全球名车图谱、国内外车标大全等 主要成就 汽车专业高级策划编辑 https://baike.sogou.com/v55893588.htm
6.敏实海拉(嘉兴)汽车零部件有限公司企业标签: 汽车零部件及配件;汽车零部件;汽车制造业;共用发光车标;制作模具;加热雷达罩;发光车标;尾部发光车标;浙江省;嘉兴市;秀洲区; 更多 发布企业产品,获得合作机会 统一社会信用代码: 91330411MA2JDUE93E 法定代表人: 谢力峰 3家关联企业 注册资本: 15000万人民币 成立日期: 2020-07-22 电话: 057***https://qiye.qizhidao.com/company/04d0369804326de74ac886afb6361c82.html
7.邓承浩深蓝汽车科技有限公司法定代表人/高管/股东自动驾驶 新能源汽车 科技创新 深蓝汽车科技有限公司 重庆长安汽车股份有限公司 手机搜狐网2024-06-15 19:30 长安深蓝车标正式公布:“倒三角” 有特斯拉那味 在新能源阵营,长安汽车没有展现出其在燃油车的实力,目前还没有一款中高端爆款电动车发售,为此长安汽车推出了深蓝”汽车品牌,专注于新能源。日前,深蓝https://www.aiqicha.com/person?personId=a839817e64adb14e04749cc0445e63e6
8.中国安全产业协会自动驾驶可分为“渐进性”、“革命性”两大技术路线。 当前自动驾驶领域根据入局企业所采用技术可大致分为两大路线, 一是福特、宝马、奥迪等传统车企所采用的“渐进性”路线,即在汽车上逐步增加一些自动驾驶功能,依托摄像头、导航地图以及各种传感器,为驾驶员提供自动紧急制动、全景泊车、自适应巡航等辅助驾驶功能。 http://www.chinasia.org.cn/?serviceshow/tp/358/id/25774.html
9.华为云鲲鹏开发技能图谱管理图谱车型车标技能技能描述 面向智慧门店的汽车类型与品牌识别技能。本技能使用多个深度学习算法,实时分析视频流,对门店入口处的车辆进行抓拍,识别该车的品牌和类型(轿车/SUV等)并将识别结果上传至您的后台系统。 摄像头部署建议请参见摄像头部署。技能配置项请参见运行时配置参数。技能接口设计请参见技能结果上传接口。 https://support.huaweicloud.com/topic/1420506-4-H