人工智能与识别技术信息与电脑China Computer & Communication2019年第7期基于深度学习的图像识别技术的研究丁旭甫 王宏生(沈阳工业大学,辽宁 沈阳 110870)摘 要:随着科技的蓬勃发展,人工智能逐渐应用于图像处理领域。传统图像处理与识别以人为提取特征为手段,但大量特征提取给图像识别造成了一定困扰,由此引进了深度学习图像识别技术。相比于传统方法,深度学习能够提供基于学习的特征表示,在自动特征提取和分割识别准确率方面具有良好表现。基于此,针对深度学习的图像识别技术进行综述,并总结了讨论内容。关键词:深度学习;图像识别技术;卷积神经网络中图分类号:TP391.41 文献标识码:A 文章编号:1003-9767(2019)07-124-02Research on Image Recognition Technology Based on Deep LearningDing Xufu, Wang HongshengAbstract: With the vigorous (Shenyang University of Technology, Shenyang Liaoning 110870, China)processing. Traditional image processing and recognition uses human-made feature extraction as a means, but a large number of development of science and technology, artificial intelligence is gradually applied to image feature extraction has caused some problems to image recognition, thus introducing depth learning image recognition technology. Compared with traditional methods, in-depth learning can provide learning-based feature representation, and has good performance in is summarized, and the discussion content is summarized.automatic feature extraction and segmentation recognition accuracy. Based on this, the image recognition technology of depth learning Key words: deep learning; image recognition technology; convolutional neural network0 引言像进行预处理、特征提取分析、特征分类等处理,识别图像近年来,随着数字图像处理的不断发展,图像识别成为中特定的一个或多个目标、物体。图像识别技术可以满足用当下研究者的重点研究方向之一。图像识别技术已被广泛应户在不同场景下的视觉应用需求,主要包括移动互联网图像用于医学、军事、工业和农业领域,其中,医学图像、生物检索与挖掘、军事公安刑侦图像比对、智能机器视觉等领域。特征图像、手写数字图像和车牌图像成为了研究热点与难点。2 深度学习概述机器学习与深度学习是当下主要的两类图像识别方法,但机器学习图像识别方法存在特征提取量大,精确度不高等问题,2.1 深度学习内涵由此引入了深度学习,以改进网络模型。深度学习架构由多机器学习是在模型训练过程中找到一个函数,通过特定层非线性运算单元组成,是利用深度神经网络在大量数据中输入得到特定输出,但此类函数有很多,需要利用深度学习进行特征提取、特征分类的一种自动学习过程。其中,学习训练模型进行试错,寻找具有泛化能力的函数。深度学习的到的高阶表示中包含低阶信息,最终实现图像分类与识别[1]。结构为含有多个隐层的多层感知器,通过组合低层特征形成本文系统综述了基于深度学习的图像识别技术的最新研究进更加抽象的高层特征,并以数据的分布式特征表示[2]。展。2.2 深度学习网络结构1 图像识别深度学习在图像处理领域的主要网络结构包括深度神经图像识别指利用机器学习、深度学习等技术方法,对图网络(DNN)、深度信念网络(DBN)和卷积神经网络(CNN)。作者简介:丁旭甫(1993—),女,内蒙古包头人,硕士研究生在读。研究方向:智能信息处理。— 124 —信息与电脑2019年第7期China Computer & Communication人工智能与识别技术2.2.1 深度神经网络(DNN)3.3 医学图像识别深度神经网络由许多基本神经元构成,神经元之间通过权重连接,由输入层、隐含层、输出层构成基本的网络模型。随着计算机辅助诊断系统的出现,细胞、器官肿瘤等医其使用反向传播算法训练模型,采用梯度下降法更新全连接网学图像与人工智能诊断的结合愈发越密切。Mohamed等人基络结构中的权重。广义上,深度神经网络是深度学习的总称[3]。于所在机构收集了乳腺X线图像,构建并训练了1个CNN2.2.2 深度信念网络(DBN)模型,用于准确快速分类乳腺密度,从而明确乳腺癌的发生深度信念网络采用无监督方法,堆积多个受限的玻尔兹几率。该模型分类的AUC达到了0.988 2。Yann LeCun教曼机,以达到训练目的。它是一个可以对训练数据进行深层授利用CAMELYON系列挑战赛提供的数据,构造并评估了表达的图形模型[3]。Hinton等人提出非监督贪心逐层训练算GoogLeNet、AlexNet、VGG16和FaceNet等4个较为主流法和多层自动编码器深层结构[4],改进深度置信网络,优化的深度学习模型,并使用测试图像检测训练完成的模型,发深层结构。现模型的AUC均达到了0.995,表明深度学习技术可显著提2.2.3 卷积神经网络(CNN)高病理诊断的准确性。卷积神经网络由一个或多个卷积层、池化层、全连接层4 结 语组成。卷积层由多个特征平面组成,每个特征平面由具有相同基于深度学习的图像识别技术广泛应用于诸多领域,取连接权重的多个神经元构成。它可以采用反向传播算法进行得了显著效果,在生产和生活中发挥了关键作用。卷积神经训练,使图像具有更好的识别效果。卷积形式为:网络改进是当下的重点研究方向之一,深度学习目前还有待 hlMj=∑Wjml∗hlm−1+bl (1)深入研究。目前,针对不同类型图像的模型与算法,合理利m=1其中,hlj是第l卷积层输出的第j个特征图,hml-1用深度学习方法提高图像识别精度,是各个领域的研究难点。(m=1,…,M)是第l-1卷积层输出的第m个特征图;Wljm是连接第l-1卷积层输出的第m个特征图的卷积核;bl是第l层卷积层的偏置[5]参考文献。[1]刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机3 实际应用应用研究,2014,31(7):1921-1942.3.1 手写体字符识别[2]孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810.手写体字符识别最早应用于人工智能领域,K近邻[3]彭伟.深度强化学习[M].北京:中国水利水电出版(KNN)、K-MEANS、贝叶斯等机器学习算法,在MNIST社,2018:71-74.数据集上进行试验与应用。但是,基于卷积神经网络的深度[4]Salakhutdinov R,Hinton G.Semantic Hashing[J].学习方法可得到更好的效果。MNIST数据集由0~9的10International Journal of Approximate Reasoning,2009, 个28×28像素的阿拉伯数字手写体图片组成,进行归一化、去噪、滤波等预处理操作过后,建立模型,对图片中的手写50(7):969-978.数字进行特征提取,并采取适当的分类模型进行分类,达到[5]李书清.卷积神经网络模型分析[J].无线互联科技, 识别的目的[6]。2018,15(19):41-43.[6]李卫.深度学习在图像识别中的研究及应用[D].武汉:3.2 生物特征识别武汉理工大学,2014:64.目前,指纹、虹膜、人脸等生物特征识别成为深度学习[7]陈虹旭,李晓坤,郑永亮,袁烺,邵娜,杨磊,刘磊.基研究领域的热门话题。人工设置生物特征较为繁琐,调试出于深度学习的指纹识别方法研究[J].智能计算机与应用,2018, 最优结果较为困难。陈虹旭等人采用深度学习中的卷积神经8(03):64-69.网络识别正常指纹、困难指纹(指纹图像缺失、破损)和虹膜,[8]陈虹旭,李晓坤,郑永亮,等.基于深度学习的虹膜识提取感兴趣区域并进行归一化,进而提高指纹及虹膜识别的别方法研究[J].智能计算机与应用,2018,8(2):108-115.准确率[7-8]。Nair等人利用Rectified线性修正单元组成的深[9]Hinton G E.Rectified Linear Units Improve Restricted 度神经网络结构,将深度学习应用于人脸识别,提高了精度[9]。Boltzmann Machines Vinod Nair[C].// International Conference on 特定情况下,单一特征识别具有局限性,孙文辉将单一特征International Conference on Machine Learning,2010.进行融合[10],提出基于深度学习的多生物特征研究,基于堆[10]孙文辉.多生物特征图像深度学习建模与识别研究栈极限深度学习,构建深度神经网络模型。[D].天津:天津科技大学,2018:56.— 125 —