贝叶斯网络(也称为置信度网络、因果网络)使用概率积分表示不确定性。这称为贝叶斯积分或条件概率。条件概率描述为给定事件B、事件A发生的概率为x,则
P(A|B)=x (6-56)
概率积分最基础的规则是联合事件的概率,即
P(A|B)P(B)=P(A,B) (6-57)
式中,事件A和B发生的概率为事件B发生的概率,乘以给定事件B的情况下事件A发生的条件概率。转换公式或者贝叶斯规则式(6-58)是基于式(6-57)得到的。
不定性知识的推理,长期以来一直被认为是AI领域中的一个重要研究问题,而概率方法是迄今为止最为流行的方法,这主要归功于贝叶斯网络(Bayesian Belief Network)良好的知识表达框架。在一些领域中,借助贝叶斯网络,人们能揭示和发现许多令人信服的概率依赖关系。贝叶斯网络为因果关系的表示提供了便利的框架,它是一个功能强大的能处理不确定性的工具。贝叶斯网络用图形模式描述变量集合间的条件独立性,而且允许将变量间依赖关系的先验知识和观察数据相结合。从1981年R.Howard和J.Matheson提出贝叶斯网络以来,贝叶斯网络的研究已引起了人们相当大的兴趣。经过十几年的发展,贝叶斯网络广泛应用于故障检测、医疗诊断、交通管理、数据挖掘等方面。
现实世界中,一个对象通常可以由若干属性变量来描述,这些变量集的各种取值组合就构成了该对象的状态空间。由于这些变量间存在着一定的关系(独立或依赖),所以通过对它们的研究,可以得到对象的知识表达。贝叶斯网络模拟人的认知思维推理模式,用一组条件概率函数,以有向无循环图(DAG)形式表示不确定性的因果推理模型。贝叶斯网络的信息由两部分组成:首先是表示条件独立性信息的网络结构S,S中的每一节点表示特定域中的一个概念或变量,在节点间的连接(有向弧)表示了可能的因果关系,体现了域知识定性方面的特征;其次,每一节点都附有与该变量相联系的条件概率分布(CPD)函数,如果变量是离散的,则它表现为给定其父母节点状态时该节点取不同值的条件概率表(CPT)。由于贝叶斯网络表示了因果过程的总体结构,故它可被看作是拥有许多不同组合的一个抽象知识库。这是从总体理论结构上来理解贝叶斯网络。从数学推理过程上讲,贝叶斯网络中每一节点有一组有限的排他状态,其似然分配表示为信度值,有向连接表示它们之间的相关或者推论关系,事件本身的不确定性以节点的信度值表示,专家知识的不确定性以条件概率表示。通过在贝叶斯网络中输入证据,更新节点的后验信度值,则可以对节点事件进行推理。
定义1:给定随机变量集合vi、vj和随机变量V,如果式(6-59)成立,则称随机变量V条件独立于变量集,记作:I(V|vi,vj)
P(V|vi,vj)=P(V|vj) (6-59)
定义2:给定n个随机变量构成的集合v={V1,V2,…,Vn},建立在该集合上的联合概率分布P(V1,V2,…,Vn)可以表示为一个贝叶斯网络B<Bs,Bp>,它由两部分构成:(www.daowen.com)
1)Bs为贝叶斯网络结构,是一个具有n个节点的有向无循环图,图中节点为随机变量,节点的状态对应于变量的值,图中有向边表示节点之间的条件(因果)的依赖关系。
2)Bp为贝叶斯网络的条件概率表集合,每个节点Vi都有一个条件概率表,用来表示Vi同其父节点Pa(Vi)的相关关系:条件概率P(Vi|Pa(Vi))。
利用条件独立性进行分解,可将联合概率分布简化表示为乘积形式,如下式所示:
从中可看出,按照条件独立性进行分解,极大地减少了计算联合概率所需的参数数目;进一步分析可以看出,如果给随机变量赋予不同的序号,会产生不同的贝叶斯网络结构;因此,一个联合概率分布可以表示为多个不同结构的贝叶斯网络。
利用建立的贝叶斯网络模型解决实际问题的过程称为贝叶斯网络推理。在推理中,那些值已确定的变量构成的集合称为证据D,需要求解的变量集合称为假设X,一个推理问题就是求解给定证据条件下假设变量的后验概率P(X|D)。
贝叶斯网络的推理实际上是进行概率计算。具体而言,在给定一个贝叶斯网络模型的情况下,根据已知条件,利用贝叶斯概率的计算方法,计算出所感兴趣的查询节点发生的概率。在贝叶斯网络推理中,主要有以下两种推理方式:
(1)因果推理 是由原因推知结论,也称为由顶向下的推理。目的是由原因推导出结果。已知一定的原因(证据),则用贝叶斯网络的推理计算,求出在该原因的情况下结果发生的概率。
(2)诊断推理 是由结论推知原因,也称为由底向上的推理。目的是在已知结果时,找出产生该结果的原因。已知发生了某些结果,根据贝叶斯网络推理计算,得到造成该结果发生的原因和发生的概率。该推理常用在病理诊断、故障诊断中,目的是找到疾病发生、故障发生的原因。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。