Page 13 - 电力与能源2021年第二期
P. 13

卢士达, 等: 基于贝叶斯和大数据分析的业务连续性风险管理                                   1 1
                                                                                                      6
              3.2  贝叶斯网络与模糊集理论的结合                              中心业务连续性的样本数据, 在没有数据支持的
                   将模糊集理论的相关概念更深地加入到贝叶                         情况下, 本研究选用ISM 构建模糊多态贝叶斯网
              斯网络中, 使模糊贝叶斯网络能对模糊问题、 不确                         络结构。
              定性高的问题以及多态问题进行有效处理, 这种                              ISM 能全面、 准确地描述云数据中心业务连
              应 用 可 以 将 BN 节 点 变 量 转 化 为 模 糊 节 点               续型影响因素的组成, 以及影响因素之间的关系。
              变量   [ 10-14 ] 。                                 因此, 将ISM 确定结构模型更换为模糊多态贝叶
              3.2.1  模糊贝叶斯网络表示                                 斯网络结构, 能充分发挥解释结构模型在系统安

                                                , , ,…,        全分析中的优势, 构建出更加科学合理的模糊贝
                   将假定所研究的系统用 X= { x 1 x 2 x 3
                 }
              x n 表示, 然后用u i 表示x i 所有可能的状态集。                   叶斯网络结构。
                   假设x i∈X , x i 可被模糊化为模糊随机变量                      由于ISM 影响因素本身不存在任何状态, 为
                ,
              u i 并且x i 的状态可能被模糊随机变量u i 继承,                    构建模糊多态贝叶斯网络, 本研究依据最低合理
              则推出x i 的模糊集:                                     可行准则将模糊贝叶斯网络节点风险等级划分为
                                              }        ( 1 )
                                 , , ,…, u ik                  可忽略状态、 可接受状态和不可接受状态三种。
                         U i= { u i1 u i2 u i3
                                              ——— u i 的 第 j        基于模糊多态贝叶斯网络的云数据中心业务
              式中  k ——— u i 的 模 糊 状 态 数; u i j
              个模糊状态, U i j= { x i u i j x ) |x i∈X }。          连续性风险评估模型的具体思路如下。
                                  , (
                          , (              位于u i 中第 j 个            ( 1 ) 分析影响云数据中心业务连续性的因素,
                   其中, x i u i j x ) 为变量 x j
                                      在给定x i 条件下的概             按其影响大小选出关键的影响因素, 然后以此为
              模糊状态u i j   的程度, 用 u i j
              率表示。                                             基础构建指标体系。
                                           }, 用有向线段表               ( 2 ) 用ISM 构建解释结构模型, 进而分析出
                              , , ,…, u n
                   假设U = { u 1 u 2 u 3
              示变量中的因果依赖关系, 即:                                  影响因素间的相互关系。
                           , )
                                      ,
                  L =  {( u i u j | i≠ji=1 , 2 , 3 ,…, n ,         ( 3 ) 利用模糊贝叶斯网络知识将解释结构模
                         j=1 , 2 , 3 ,…, n } U ×U      ( 2 )   型转换为模糊贝叶斯网络结构。
              用条件概率表示, 即:                                          ( 4 ) 确定模糊贝叶斯网络各节点的状态, 然后
                       {          )] i=1 , 2 , 3 ,…, n } ( 3 )  进行网络推理计算。
                  P = P [ u i| π ( u i  |
                         )———模糊变量u i 的父节点集合。
              式中  π ( u i
                                                              4  基于云日志的风险预警应用
                   综上所述, 推出模糊贝叶斯网络:
                            FBN = U , L , P }          ( 4 )       为了保证大规模分布式云数据中心的高可用
                                    {
              3.2.2  模糊贝叶斯网络知识推理技术                             性和可靠性, 需要对大规模云数据中心的状态进
                   模糊贝叶斯网络推理分为预测推理、 诊断推                        行监控, 以及时发现系统的异常行为状态。结合
              理和支持推理三种形式。                                      云数据中心的日志特点, 构建基于深度学习的日
                   使用模糊贝叶斯网络知识推理技术能够将各                         志分析及异常检测方法, 根据云数据中心的运行
              子系统或组成部分在系统正常时起到的作用进行                            日志信息检测当 前的调用或者服务请求是否合
              定量分析, 并且可以快速计算出其正常工作时的                           理, 对于异常的调用和服务请求给出预警。
              概率以及系统故障条件下各子系统或组成部分出                           4.1  云日志解析技术
              现故障的概率, 最终可以做到迅速有效地识别系                          4.1.1  大数据云日志
              统中 防 御 薄 弱 的 地 方, 保 障 系 统 的 正 常 运 行 及                日志是软件系统非常关键的组件, 它记录了
              维护。                                              软件运行时的信息, 监控系统中发生的事件。
              3.3  风险评估模型的构建                                       日志具有以下两个特点: 大数据级别; 非结构
                   现阶段模糊贝叶斯网络的建模方法是使数据                         化。因此, 直接从表面上的数据发现有用的信息
              学习建模和人工建模相结合, 将两种方法的优势                           十分困难。日志分析的第一步应该为日志解析:
              发挥出来。由人工搭建模型, 通过样本数据学习                           将非结构化的日志转化为结构化的形式。在此基

              修正人工搭建的不足, 最终确定模糊贝叶斯网络。                          础上提出了一个基于日志匹配树的无监督日志解
              但是样本数据学习这一阶段缺乏大量关于云数据                            析方法。这个方 法对于每一条新生成的原始日
   8   9   10   11   12   13   14   15   16   17   18