Page 13 - 电力与能源2021年第二期
P. 13
卢士达, 等: 基于贝叶斯和大数据分析的业务连续性风险管理 1 1
6
3.2 贝叶斯网络与模糊集理论的结合 中心业务连续性的样本数据, 在没有数据支持的
将模糊集理论的相关概念更深地加入到贝叶 情况下, 本研究选用ISM 构建模糊多态贝叶斯网
斯网络中, 使模糊贝叶斯网络能对模糊问题、 不确 络结构。
定性高的问题以及多态问题进行有效处理, 这种 ISM 能全面、 准确地描述云数据中心业务连
应 用 可 以 将 BN 节 点 变 量 转 化 为 模 糊 节 点 续型影响因素的组成, 以及影响因素之间的关系。
变量 [ 10-14 ] 。 因此, 将ISM 确定结构模型更换为模糊多态贝叶
3.2.1 模糊贝叶斯网络表示 斯网络结构, 能充分发挥解释结构模型在系统安
, , ,…, 全分析中的优势, 构建出更加科学合理的模糊贝
将假定所研究的系统用 X= { x 1 x 2 x 3
}
x n 表示, 然后用u i 表示x i 所有可能的状态集。 叶斯网络结构。
假设x i∈X , x i 可被模糊化为模糊随机变量 由于ISM 影响因素本身不存在任何状态, 为
,
u i 并且x i 的状态可能被模糊随机变量u i 继承, 构建模糊多态贝叶斯网络, 本研究依据最低合理
则推出x i 的模糊集: 可行准则将模糊贝叶斯网络节点风险等级划分为
} ( 1 )
, , ,…, u ik 可忽略状态、 可接受状态和不可接受状态三种。
U i= { u i1 u i2 u i3
——— u i 的 第 j 基于模糊多态贝叶斯网络的云数据中心业务
式中 k ——— u i 的 模 糊 状 态 数; u i j
个模糊状态, U i j= { x i u i j x ) |x i∈X }。 连续性风险评估模型的具体思路如下。
, (
, ( 位于u i 中第 j 个 ( 1 ) 分析影响云数据中心业务连续性的因素,
其中, x i u i j x ) 为变量 x j
在给定x i 条件下的概 按其影响大小选出关键的影响因素, 然后以此为
模糊状态u i j 的程度, 用 u i j
率表示。 基础构建指标体系。
}, 用有向线段表 ( 2 ) 用ISM 构建解释结构模型, 进而分析出
, , ,…, u n
假设U = { u 1 u 2 u 3
示变量中的因果依赖关系, 即: 影响因素间的相互关系。
, )
,
L = {( u i u j | i≠ji=1 , 2 , 3 ,…, n , ( 3 ) 利用模糊贝叶斯网络知识将解释结构模
j=1 , 2 , 3 ,…, n } U ×U ( 2 ) 型转换为模糊贝叶斯网络结构。
用条件概率表示, 即: ( 4 ) 确定模糊贝叶斯网络各节点的状态, 然后
{ )] i=1 , 2 , 3 ,…, n } ( 3 ) 进行网络推理计算。
P = P [ u i| π ( u i |
)———模糊变量u i 的父节点集合。
式中 π ( u i
4 基于云日志的风险预警应用
综上所述, 推出模糊贝叶斯网络:
FBN = U , L , P } ( 4 ) 为了保证大规模分布式云数据中心的高可用
{
3.2.2 模糊贝叶斯网络知识推理技术 性和可靠性, 需要对大规模云数据中心的状态进
模糊贝叶斯网络推理分为预测推理、 诊断推 行监控, 以及时发现系统的异常行为状态。结合
理和支持推理三种形式。 云数据中心的日志特点, 构建基于深度学习的日
使用模糊贝叶斯网络知识推理技术能够将各 志分析及异常检测方法, 根据云数据中心的运行
子系统或组成部分在系统正常时起到的作用进行 日志信息检测当 前的调用或者服务请求是否合
定量分析, 并且可以快速计算出其正常工作时的 理, 对于异常的调用和服务请求给出预警。
概率以及系统故障条件下各子系统或组成部分出 4.1 云日志解析技术
现故障的概率, 最终可以做到迅速有效地识别系 4.1.1 大数据云日志
统中 防 御 薄 弱 的 地 方, 保 障 系 统 的 正 常 运 行 及 日志是软件系统非常关键的组件, 它记录了
维护。 软件运行时的信息, 监控系统中发生的事件。
3.3 风险评估模型的构建 日志具有以下两个特点: 大数据级别; 非结构
现阶段模糊贝叶斯网络的建模方法是使数据 化。因此, 直接从表面上的数据发现有用的信息
学习建模和人工建模相结合, 将两种方法的优势 十分困难。日志分析的第一步应该为日志解析:
发挥出来。由人工搭建模型, 通过样本数据学习 将非结构化的日志转化为结构化的形式。在此基
修正人工搭建的不足, 最终确定模糊贝叶斯网络。 础上提出了一个基于日志匹配树的无监督日志解
但是样本数据学习这一阶段缺乏大量关于云数据 析方法。这个方 法对于每一条新生成的原始日