兰州文理学院学报(自然科学版)
)JournalofLanzhouUniversitfArtsandScience(NaturalSciencesyo
Vol.34No.3
Ma020y2
() 文章编号:2095G6991202003G0093G05
基于深度学习的交通标志识别技术研究
高铭悦,董全德
()宿州学院信息工程学院,安徽宿州234000
摘要:目前人工智能在自动驾驶中得到大量的应用,深度学习是实现人工智能的技术之一,尤其是深度学习中的卷积神经网络擅长处理图像分类、图像识别、目标分割和检测等方面的问题,本次实验对卷积神经网络的以提高对G实验结果表明,改进模型比标准模型的LeNetG5模型进行改进,TSRB数据库中交通标识的识别率.识别率提高了0.并验证了算法的可行性.24%,关键词:深度学习;交通识别;LeNetG5模型中图分类号:TP393 文献标志码:A
0 引言
行设计的一种可以识别二维形状的模式,在平移、缩放、倾斜情况下具有高度不变性,可以看成是一种特殊的多感知器或前馈神经网络,其大量神经元按照一定的组织方式对视野的交叠区进行反
]3
应[.1962年,Hubel和Wiesel对猫的视觉皮层4]细胞进行研究,提出感受野的概念[.1979年,
,)研究的领域之一,深度学习(tellienceAIDeegp
)是实现人工智能的强大技术,已经在图learning像处理、视频和音频分析、自然语言处理等领域得到广泛应用.在深度学习发展史上,卷积神经网络
1]
,展起着无法替代的作用[它具有局部连接和权
目前计算机视觉是人工智能(ArtificialInG
(有着举足ConvolutionNeuralNetwork,CNN)
轻重的位置,对计算机视觉领域的研究和实际发值共享的特点,特别适合图像分类和识别、目标分割和检测等方面的问题.
交通标志识别一直是自动驾驶的研究内容,
Fukushima在Hubel和Wiesel提出的感受野基
础之上建立神经认知器模型,此模型被认为是第
]5
,一个卷积神经网络[1989年,LeCun等初次提
出权值共享技术,又将卷积层和汇合层1998年,进行结合,组成卷积神经网络结构,被认为是现代
6]
卷积神经网络的基础[卷积神经网络的神经元.
可以响应部分交叠范围的神经单元,适合图像分类和识别.
1.1 卷积神经网络结构
标准的卷积神经网络有输入层、交替的卷积层(又称检测层)和汇合层(又称池化层和下采样、层)全连接层和输出层构成,它们都可以看成是特殊的隐含层,其模型如图1所示.作为计算机视觉领域最成功的深度学习模型,卷积神经网络在深度学习兴起之后不断演化出大量的变种模
]7
型[.
通过摄像头采集交通标志,引入LeNetG5识别检测出交通标志所在的区域,再对交通标志进行分类识别并确定对象.LeNet最初设计的目的是用于识别手写字符和打印字符,最早用于美国银行
]2
,支票手写数字识别,效果非常好[之后被不断地
优化改进.本文采用LeNetG5对GTSRB数据库
进行实验,通过减少卷积层、全连接层特征层数,得到一种效率更高的交通标志识别方法.
1 卷积神经网络
收稿日期:2020G02G15
卷积神经网络是仿照生物的视觉神经系统进
1.2 卷积神经网络基本流程
将未经加工的原始数据输入卷积神经网络模
);;年度宿州学院科研平台开放课题项目(农业生态大2019kf032018年第二批产学合作协同育人项目(201802070215)y)数据分析与应用技术国家地方联合工程研究中心开放课题项目(AE2018010com.
););基金项目:2018年安徽高校自然科学研究项目(KJ2018A04472017年度宿州学院重点科研项目(2017zd192019y
),:作者简介:高铭悦(女,安徽宿州人,助教,硕士,研究方向:大数据、人工智能等.1991GEGmail118677289@q.q
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.兰州文理学院学报(自然科学版) 第34卷94
图1 标准卷积神经网络
,型的第一层(输入层)再经过输入层之后卷积层和汇合层的作用,可以将这些卷积层和汇合层当做一个整体看成是一个复杂的函数F同时CNN,由数据损失和模型所需的参数正则化损失共同组成,对于卷积神经网络模型的训练可以抽象为从
最初输入的原始数据到期望结果的拟合过程,中间需要经历特征学习,特征学习是将原始数据映射为特征,再进行分类,之后映射为样本标记,图2是卷积神经网络的基本流程8.
[]
图2 卷积神经网络基本流程图
2 LeNet5卷积神经网络G
这样做的mod函数进行一次非线性处理得到的.
目的是为了既可以减少后续数据处理量,同时保留有效信息.
第三层是第二个卷积层,共有16个10×10
作为网络基本结构,包含3个卷积层、2个汇合层,输入原始数据可以是图像或矩阵,除输入层外,总共有7层,包含1个全连接层和1个输出
9]
层[.
LeNetG5主要是将卷积层和汇合层相互结合
的卷积特征图,且这些卷积特征图的神经元都与上一层的5×5领域进行局部连接.
第四层是第二个汇合层,包含16个5×5的
),每个卷积特征图的像素大lutionalfeaturemap小是2由一个5×5的卷积核对输入图像8×28,进行内卷积得到,其中每个神经元与输入中相应的5×5区域相连接,第一个卷积层共有156个参个偏置,6个卷积核共有(25+1)×6=156个参数,另外还有122304个连接.汇合特征图大小为1其中每个汇合特4×14像素,
第二层是汇合层,共有6个汇合特征图,每个
2.1 标准LeNet5模型G
第一个卷积层共有6个卷积特征图(convoG
汇合特征图,这些汇合特征图同样经过上一层的卷积特征图,与2×2的不重叠窗口进行平均汇合再非线性处理,使得汇合特征图行与列各自缩小为原来的二分之一,整体缩小为原来的四分之一.卷积特征图,由于上一层的汇合特征图和卷积核都是5×5的大小,所以这一层与上一层的连接为是因输入通过补零扩大,其他部分保持不变,使得特征图大于1×1像素.接下来才是全连接层,每个神经元都由上一层的所有神经元连接,共包含其值由上一层的输出与本层的权值84个神经元,
进行内积后加上偏置,最后使用尺度化双曲线正全连接,但是这一层不是全连接层,而是卷积层,
第五层是第三个卷积层包含120个1×1的
]10
,数[因为每个卷积核有5×5=25个权值和1
征图都是由上一层的卷积特征图经过大小2×2、步长为2的窗口进行平均汇合,然后再利用SiGg
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.第3期
高铭悦等:基于深度学习的交通标志识别技术研究
95
每一个神经元代10个欧几里得径向函数神经元,
表一个类别,这些神经元都与上一层的所有神经元相连,最终的输出值由上一层的输出和本层的权值进行欧式距离平方所得.
2.2 LeNet5模型算法G
LeNetG5模型的改进主要是将非线性变换从汇合层转移到了卷积层,并把输出层的激活函数用Softmax函数替换原来的欧几里得径向函数,同时去掉一个卷积层只保留一个全连接层,其中输入层可以用x表示,通常是一个矩阵或者一张图像.由于卷积层、汇合层和全连接层都可以看成是特殊的隐含层,所以可以用H1=(表示第h1,α),一层隐含层,即第一个卷积层(其中第α个CL)卷积面h1,α的卷积核为W式为:
⌒1,α切函数进行变换而得.最后一层是输出层,共有
题得到最优解并不意味着全局问题可以得到最优解,具体流程如图3所示.
图3 识别交通标识流程图
3.1 图像预处理
针对GTSRB数据库的交通标识图像进行剪裁,获取不同类别的交通标识,同一类别的标识符受拍摄距离、光照阴影以及天气影响等会有不同的误差,会出现清晰度不高、大小不一致、剪裁范围不标准等现象,所以对于数据集需要进行预处理,确保得到最好的识别结果,图4为GTSRB部分样本图.
,偏置是b,计算公
1,α1,α合层,其中第α个汇合面h2,h1,α是通过对α的汇合来计算的,计算公式为:
()h1,σ(x❋W+b).1α=
表示第二层隐含层,即第一个汇H2=(h2,α)
1,α积层,其中第β个卷积面是利用所有的汇合面h2,α(),(h2,ownh1,.2α=dλα)2τ2
)表示第三层隐含层,也是一个卷H3=(h3,β,β以及偏置3,和相应的卷积核W3计bβ进行计算,2,α算公式为:
3β3βh3,σ(∑αh2,bα❋W2,α+).β=
,
,
⌒)表示第四层隐含层,是一个汇合H4=(h4,β层,其中第β个汇合面h4,是通过对h3,的汇合来ββ计算的,计算公式为:
()3
图4 GTSRB数据库部分样本
,5β接层,其中h5是利用、三维张量W5来计和偏置b)(),(h4,ownh3,4λβ=dβ.4τ4
表示第五层隐含层,是唯一的全连H5=(h5)
55
)h5=σ(b.β+∑βWhβ4,
,
分成GTSRB数据库中共有43类交通标识,
两套训练集和测试集,其中一套有39209个训练样本和1另一套有22630个测试样本.6640个训练样本和1本次实验采用第一2569个测试样本,套训练集和测试集,这些训练集和测试集的图像格式是.将它们转换成统一的.m类型,ppjpg格需要在带入模型之前对这×250像素之间都有,些样本集进行处理,经过归一化处理为32×32像素大小,转换结果如图5所示,确保模型能够识别标识的形状和特征.
交通标识统一尺度后进行灰度化处理,使彩式,图像的大小也不是统一的,从15×15到250
算,计算公式为:
该层可以用h5、权值矩阵W6和o表示输出层,
6
偏置b通过S计算公式为:oftmax产生伪概率,
()5
3 LeNet5模型识别交通标志G
6
()o=softmaxW6h5+b.()6
解决图像识别问题主要分解为预处理、特征
提取与选择、分类器设计等步骤,主要目的是将图片识别问题分解成简单、可控且清晰的小问题,在解决这些小问题时尽可能得到最优解,但是子问
色图变成灰度图,并进行去噪,然后进行切分,从垂直和水平角度进行切除多余部分,只保留需要标识的图标区域,然后将保留的部分重置位于中央位置,再将其余部分细化添加.
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.兰州文理学院学报(自然科学版) 第34卷96
表1 测试卷积层卷积核和全连接层节点数
第一层
卷积核个数
122030
第二层
卷积核个数
20202020303030304040404050505050
全连接
层节点数500500500500500400400400400400400300300300300300
准确率/%98.5398.0297.8098.0497.9098.3397.2397.8998.3298.3497.6998.4197.9198.0498.3098.23
图5 归一化为32×32像素大小
40122030401220304012203040
的卷积特征图数目,第一个卷积层的卷积特征图从1开始,每间隔1个增加,一直增加到1第二2,个卷积层的卷积特征图的数目也是间隔增加,一直增加到2通过卷积特征图数目的不断增加可0,3.2 实验
本次实验采用W以Pindows1064位环境,Gy
硬件thon作为软件平台搭载TensorFlow框架,经处理好的G分出训TSRB数据集先进行分类,练集和测试集,针对模型进行设置具体参数和网络结构细节,包括每个卷积层卷积核的个数、大小、步长,每个汇合层的类型、窗口大小、步长,全连接层的节点数目、激活函数的类型、损失函数的类型以及层与层之间的关系等.
针对卷积层的卷积核个数进行测试,如表1以测试LeNetG5模型识别交通标识的效率.
模型的改进是增加LeNetG5模型两个卷积层
((环境为IntelR)CoreTM)i5G3380MCPU@2.
,,主频2.内存大小为8G将已90GHz9GHzB.
表2 模型其他具体参数
参数卷积核1的大小汇合窗1的大小卷积核2的大小汇合窗2的大小
设置值51225122
卷积核1的移动步长汇合窗1的移动步长卷积核2的移动步长汇合窗2的移动步长
同时全连接层也可以进行节点数的测试,40、50,
可以选择3通过反复测试,选择合适00、400、500,的卷积核个数和全连接层的节点数.
个数为1第二层卷积层的卷积核个数为2全2,0,连接层的节点个数为5除此之外,其他的具体00,参数如表2所列.
3.3 结果
此次实验每次迭代的交通标识样本数量为
通过测试,可以选择第一层卷积层的卷积核
所列.卷积层的卷积核个数可以选择12、20、30、
4 结束语
通过增减卷积层和全连接层对网络模型进行简化,使得实验迭代次数达到一定值时能够提高交避免出现对清晰GTSRB数据集进行平衡处理,
图像的判别率失衡,在保持准确率的基础上得到更高性能的网络模型.参考文献:
[]王坚.基于深度属性学习的交通标志识别方法研究1
[]赵银玲,周武能.基于改进卷积神经网络的交通标志2
[北京:北京交通大学,D].2017.
本文在LeNetG5标准模型基础上进行改进,
每测试一次经过的训练次数为5初始学100,00,
习率为0.在训练网络的过程中,随着迭代次01,数的增加,在迭代训练1程序结束,训练000次后,集的识别准确率为9测试集的识别准确5.87%,率为9将本次实验数据用L4.56%.eNetG5标准模型进行实验,两者相比较本文方法准确率提高了0.证明改进模型更有效.24%,
通标识的识别准确率.未来的研究中,可以考虑对
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.第3期
高铭悦等:基于深度学习的交通标志识别技术研究
97
[]刘亚文.基于卷积神经网络的动态Q3R码识别系统[]肖林霞.基于卷积神经网络的目标运动跟踪跟踪研究4
[]杨金鑫.基于深度学习的细胞图像分割与识别算法研5
究[北京:北京邮电大学,D].2017.[济南:山东科技大学,D].2017.[广州:华南理工大学,D].2019.
213.
]:识别方法[计算机系统应用,J.2018,27(10)209G[]曹正凤,李少丁,王栋梁,等.基于深度学习的端到端6
11G12.
]:车牌检测识别系统[中国交通信息化,J.2018(9)
[]弓耀辉.]图像文字识别中的预处理技术研究综述[7J.[]王瑞.基于卷积神经网络的图像识别[开封:河南8D].
大学,2015.
():信息通信,201798G9.
[责任编辑:李岚]
ResearchonTrafficSinReconitionTechnoloasedgggyB
onDeeearninpLg
(,,,)SchoolofInformationEnineerinSuzhouUniversitSuzhou234000,AnhuiChinaggy
GAOMinGue,DONGQuanGdegy:,AbstractAtpresentartificialintelliencehasbeenwidelsedinautonomousdrivin.Deelearningyugpg
,isoneofthetechnoloiestorealizeartificialintellienceeseciallonvolutionalneuralnetworksinggpyc
rovedtoenhancethereconitionrateofthetrafficsinsintheGTSRBdatabase.ThrouhtheexerGpgggp
,imentalresultstheimrovedmodelwas0.24%hiherthanthestandardmodeltoverifitsfeasibiliGpgyt.y
:;;KeordsdeeearnintrafficreconitionLeNetG5modelplggyw
,,deeearninregoodatdealinithimaeclassificationimaereconitiontaretsementationplgagwggggg
,anddetection.InthisexerimenttheLeNetG5modeloftheconvolutionalneuralnetworkwasimGp
Copyright©博看网 www.bookan.com.cn. All Rights Reserved.
因篇幅问题不能全部显示,请点此查看更多更全内容