Page 64 - 电力与能源2021年第五期
P. 64
5 5 6 袁 奇, 等: 基于图像识别技术的高压电缆附件数字化工艺库设计与研究
图片分析、 预处理、 字符识别和识别矫正等, 每个 之则为一致, 从而实现最终的比对审核和判定 [ 8 ] 。
步骤都关系着最终识别结果的准确性。比如要进
2 结语及展望
行字符识别的图片越清晰( 即预处理做的越好),
识别效果往往就越好。字符识别是图片的字符识 通过引入图像识别技术、 OCR 和一致性检测
别过程中最重要的环节。目前最广泛使用的字符 算法技术, 将高压电缆附件数字化工艺库中的图
识别技术 是 OCR 。 OCR 是针对印刷体字符, 采 纸、 工艺说明书、 技术协议与数据库中的原始模板
用光学识别的方式将纸质文档中的文字转换成为 进行特征值抽取比对, 从而快速识别两者之间的
黑白单元构建的图像, 并通过识别软件将图像中 差异性, 比对准确率得到了大大的提升, 避免了漏
的文字转换成文本格式, 供文字处理软件进一步 查、 误判, 及 对 高 压 电 缆 附 件 工 艺 后 续 造 成 的
编辑加工的技术 [ 6 ] 。 影响。
在 OCR 识别过程中主要分为 4 个部分。 ( 1 ) 本文建立了一个基于 B / S 架构数字化高
( 1 ) 图片预处理。该模块的功能主要是将样 压电缆附件工艺库, 录入所有现有高压电缆附件
本图片进行尺寸统一、 分割、 灰度化和二值化等预 的技术协议以 及工艺图纸, M y SQL 关系型数据
处理, 为后续的字符识别做准备。 库管理系统的存储量大大增加, 并且更便于检索,
( 2 ) 训练字库。利用 OCR 的开源引擎 对 目 能够极大程度地保证数据的一致性与完整性, 满
标工 艺 图 片 里 的 特 征 字 符 进 行, 以 提 高 识 别 准 足工作人员用户需求, 安全可靠且可共享。
确率。 ( 2 ) 图形识别利用 LBP 及 HOG 特征提取算
( 3 ) 字符识别。利用开源 OCR 识别引 擎 对 法提取图纸中的图形特征从而获取局部相似性,
图片进行字符识别。在系统中实现对一张图片的 并结合分形维数的对比算法与工艺库中的标准化
字符识别只需调用 P y tesseract库里的Ima g e _ to _ 图纸进行鉴别比对, 最终形成比对报告, 协助管理
Strin g 方法。 Text就是识别后返回的字符内容; 人员实现高效审核。
Lan g 是自己训练的字库或者 Tesseract自带语言 参考文献:
包; Im g 是预处理后的图片。 [ 1 ] 向洪,何维晟,吴照国,等 . 一起电缆终端接头故障仿真
( 4 ) 识别矫正。对拒识或误识的图片字符进 分析研究[ J ] . 电工技术, 2021 ( 3 ): 139-140.
行矫正。对于灰度图可以进行灰度调整, 也就是 XIANG Hon g , HE Weishen g , WUZhao g uo , etal.Sim-
ulationanal y sisofcableterminal j ointfailure [ J ] .Electric
对比度增强。以灰度图为例, 试验发现增强前拒
En g ineerin g , 2021 ( 3 ): 139-140.
识, 增强后则识别正确。 [ 2 ] 王鹰,王毅,王志龙,等 .110kV 户外电缆终端的现状及
1.3 一致性检测算法 发展趋势[ J ] . 电网技术, 2008 , 32 ( 增刊 2 ): 291-293.
分形几何学对自然界出现的一些不规则几何 WANG Yin g , WANG Yi , WANG Zhilon g , etal.Cur-
体给出了数学描述, 其本质是“ 自相似”。用分形 rentsituationanddevelo p menttrendof110kV outdoor
cableterminal [ J ] .PowerS y stem Technolo gy , 2008 , 32
理论进行图像分析的原理是利用图像的分形维数
( S2 ): 291-293.
特征对目标图像进行处理及分析。分形维数直观 [ 3 ] 李上国 . 高 压 电 缆 终 端 绝 缘 油 老 化 特 性 的 研 究[ D ] .北
上与物体表面的粗糙度相吻合, 图纸中不同物体 京:华北电力大学, 2011.
的粗糙度有很大差别, 因此可用分形维数作为判 [ 4 ] YU SONG , WENHONG WANG.Textlocalizationand
别两 张 图 纸 中 对 应 位 置 的 图 形 是 否 一 致 的 detectionfornewsvideo [ C ]// In : 2009SecondInterna-
tionalConferenceonInformationandCom p utin gScience ,
参数 [ 7 ] 。
Manchester , 2009.
高压电缆附件工艺图纸尺寸普遍偏大, 本文 [ 5 ] 林克正,张元铭,李昊天 . 信息熵加权的 HOG 特征提取
采用盒维数作为分形维数的计算方式, 利用分形 算法 研 究 [ J ] . 计 算 机 工 程 与 应 用, 2020 , 56 ( 6 ):
维进行图纸比对。 147-152.
图纸比对时, 将图纸分别划分为 P×Q 个区 LIN Kezhen g , ZHANG Yuanmin g , LI Haotian.Re-
searchon HOGfeatureextractional g orithm wei g htedb y
域, 利用分形维数计算方法进行盒子像素的计算,
informationentro py [ J ] .Com p uterEn g ineerin g andA pp li-
根据两张图纸的分形维数差值绝对值, 根据参考 cations , 2020 , 56 ( 6 ): 147-152.
阈值来进行判断, 若小于阈值则判定为不一致, 反 ( 下转第 565 页)

