Page 109 - 电力与能源2024年第二期
P. 109

陆增洁,等:基于机器学习的电力系统操作票语音指令识别的应用研究                                      249

                DNN-HMM 拥有优异的泛化性,不仅拥有极强的                         执行辅助方案。搭配一键开票系统,可为数字化
                连续性,而且还支持帧与帧的拼接,使其中的特征                           倒闸操作模式提供智能语音指令识别技术支撑。
                参数变得丰富,而且每个情况下都仅仅需要一个                            3.2 用户操作软件设计
                神经网络来完成。研究结果显示,DNN-HMM 在                             通过机器学习技术,研究了电力系统操作票
                处理复杂的大规模语言信息方面性能非常优异。                            语音指令识别应用,并将其转换成了一款软件,以

                    采用 DNN 作为替代 GMM-HMM 的语音识                     实现其初步功能。为了确保软件的可用性,采用
                别技术,可显著改善 DNN 的观察概率,但其时间                         了 IDEA2022 版 本 的 编 程 语 言 ,以 及 jdk1.8 和
                顺序和空间分割的特点,使其应用范围受到限制,                           mysql5.7 版本的环境配置。
                并且应用灵活性也不够。为了解决上下文相关性                                在 软 件 开 发 过 程 中 ,使 用 Insomnia 和 post⁃
                建模的挑战,循环神经网络(RNN)和卷积神经网                          man 进行接口测试。在项目中使用 springboot 中

                络(CNN)已经成为了一个可行的方案。RNN 的                         的 Junit 来 进 行 单 元 测 试 ,并 且 需 要 导 入 依 赖 于
                网路结构可以根据当前的输入来模拟当前的输                             spring-boot-starter-test 的测试程序。这些测试程
                出,从而大大提高了建模的准确性。尽管 RNN 具                         序将会对数据流向、常规报错处理和逻辑错误处
                有较高的准确性,但由于梯度的不断变化,很容易                           理进行调试,以确保用户能够体验到最佳的效果。
                出现崩溃,从而使其无法被有效地训练。为此,学                           采用统一的 restful 风格接口,其前端可以直接将
                者们采用门控技术构建出了一个具有较高准确性                            数据呈现给用户,而无需经过任何处理,其后端则
                的 长 期/中 期 记 忆(LSTM)网 络 系 统 。 LSTM-               可以将数据转换为 JSON 格式,从而将前后端完

                RNN 的应用极大地改善了语言的上下文处理效                           全隔离,使系统的架构变得更加清晰,并且易于维
                果,其在准确度、稳健性等方面的表现都被广泛验                           护和更新。数据库方面使用 MySQL 数据库,它
                证。CNN 则拥有卷积的稳定性、池化的特点,既                          是一个关系型数据库,由于 MySQL 数据库速度
                可以将复杂的上下文处理结果转换为易操作的图                            快、体积小、源码开放,并且单个 MySQL 服务还

                像,又可以抵抗外界的干扰,从而大大降低了计算                           能够支持 10 000+的数据并发量,可以很好地支
                成本。时延神经网络(TDNN)和 CNN 都被认为                        撑整个项目的稳定运行。
                可以有效地帮助 CNN 处理连续语音识别,但前者                             JAVA 技术是一种面向对象的语言,能够将类
                更加精准,而后者则更加灵活,因此,将它们有机                           和接口集成在一起,并且具有可移植性,使得其能够
                地融为一体,可以带来显著的积极效果。                               在各种不同的平台上运行。此外,AVA 还是一种
                                                                                              J
                                                                 解释型语言,能够在编写程序时进行快速的翻译和
                3 软件控制系统设计
                                                                 执行,而无需复杂的机器学习过程,如果翻译过程没
                3.1 整体软件系统概述                                     有出现任何问题,就会继续进行,否则就会停止。
                    基于机器学习的电力系统操作票语音指令识                          3.3 用户操作软件工作流程

                别的软件系统,主要包含用户操作的登录功能、操                               这个系统的语音指令识别系统使得访问者必
                作票排序、操作票选定、操作指令识别预演操作、                           须使用一个合法的账号来访问,这样就能够保障
                操作票操作信息录入、操作票操作项目步骤校验                            系统的稳健性。系统会根据用户的身份验证,将
                等功能。在执行倒闸操作的过程中,电力系统操                            一组操作票排序,然后将其存储到系统中。当系
                作票语音指令识别需按步骤与流程识别对应的语                            统检查到这些操作票时,它们会被认为符合规范,

                音操作指令,为倒闸操作流程提供语音指令的正                            因此被允许继续使用。
                确性验证,并提供相应的流程引导与指示,保障工                           3.4 用户操作软件界面展示
                作人员的倒闸操作步骤与工作票一致。本文衔接                               (1)登录页面。访问该站点时,请务必先点击
                相关操作票系统提出了一种数字化智能倒闸操作                            登录按钮,以确认账号和密码是否正确。如果账
   104   105   106   107   108   109   110   111   112   113   114