理论教育 基于信息熵理论的不确定性度量方法

基于信息熵理论的不确定性度量方法

时间:2023-06-13 理论教育 版权反馈
【摘要】:在信息论中,认为信源输出的消息是随机的。香农指出信源给出的符号是随机的,信源的信息量应是概率的函数,以信源的信息熵表示。直到1948年,香农提出了“信息熵”的概念,才解决了对信息的量化度量问题。热力学中的热熵是表示分子状态混乱程度的物理量。香农用信息熵的概念来描述信源的不确定度。

基于信息熵理论的不确定性度量方法

信息多少的量度。1928年R.V.L.哈特莱首先提出信息定量化的初步设想,他将消息数的对数定义为信息量。若信源有m种消息,且每个消息是以相等可能产生的,则该信源的信息量可表示为I=logm。但对信息量作深入而系统研究,还是从1948年C.E.香农的奠基性工作开始的。在信息论中,认为信源输出的消息是随机的。香农指出信源给出的符号是随机的,信源的信息量应是概率的函数,以信源的信息熵表示。

这里,熵与温度、压力、焓等一样,也是反映物质内部状态的一个物理量。它不能直接用仪表测量,只能推算出来,所以比较抽象。在作理论分析时,有时用熵的概念比较方便。信息作为一个很抽象的概念。人们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到1948年,香农提出了“信息熵”的概念,才解决了对信息的量化度量问题。信息熵这个词是香农从热力学中借用过来的。热力学中的热熵是表示分子状态混乱程度的物理量。香农用信息熵的概念来描述信源的不确定度。

信息熵的定义:假设X是一个离散随机变量,即它的取值范围Χ={x1x2…}是有限可数的。设pi=P{X=xi},X的熵定义为

若式(2-1)中,对数的底为2,则熵表示为H2Χ),此时以2为基底的熵单位是bits,即位。若某一项pi=0,则定义该项的978-7-111-51794-8-Chapter02-2.jpg为0。对于熵的理解,可以认为变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。在信息论中,条件熵描述了在已知第二个随机变量Y的值的前提下,随机变量Χ的信息熵还有多少。其定义如下:

其中,HX|Y)表示得到Y后,X的平均信息量,即平均不确定度。条件熵HX|Y)可以看成由于信道上存在干扰和噪声而损失掉的平均信息量。条件熵HX|Y)又可以看成由于信道上的干扰和噪声的缘故,接收端获得Y后还剩余的对符号X的平均不确定度,故称为疑义度。

互信息(Mutual Information)是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性:IXY)=HX)-HX|Y)。IXY)可以理解成知道了Y后对于减少X的不确定性的贡献。IXY)的公式:(www.daowen.com)

联合熵定义为两个元素同时发生的不确定度。联合熵的计算公式如下:

一条信息的信息量大小和它的不确定性有直接的关系。比如说,我们要搞清楚一件非常非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。相反,如果我们对某件事已经有了较多的了解,我们不需要太多的信息就能把它搞清楚。所以,从这个角度,我们可以认为,信息量的度量就等于不确定性的多少。

目前采用熵理论分析连锁零售企业供应链系统的研究文章并不多,有些关注主要集中在供应链系统的不确定信息的量化计算,涉及熵增、耗散结构、复杂性以及控制等。张彦高等(2004)分析了供应链系统形成耗散结构的条件,对供应链系统的正负熵流进行了分析和诠释,并构建了一个供应链熵流的模型;贾燕等(2003)用熵论研究了供应链的复杂性,提出了复杂性量化分析模型与方法,从而得到了供应链各节点之间复杂性产生的原因以及复杂性沿供应链在上下游合作伙伴之间的传递过程;楚杨杰等(2005)分析了供应链系统信息共享的内容,利用信息时效熵和质量熵对信息系统进行评价,提出了具有主动信息共享功能的层次信息共享系统的设计模型;霍红等(2005)研究了熵势能与管理系统的关系,结合熵增原理和耗散结构理论,提出了降低供应链系统的混乱度、提高供应链管理效益的有效途径;徐鑫等(2005)从定量和定性的角度分析了供应链系统的不确定性,指出供应链不确定性本质和不确定性产生的因素,并通过实际案例分析对供应链不确定性做出了精确的评估。余昌仁(2006)基于熵理论来分析供应链内部风险形成原因并对其做出度量,并提出了应用熵理论来管理供应链内部风险的对策,即引入负熵与降低正熵,该文为后续采用熵方法论分析供应链内部风险提供了一个新的视角。覃正(2006)针对供应链网络结构,从系统论的角度应用信息熵概念,定义了供应链的聚合度,建立了供应链系统稳定性的数学模型,通过聚合度、冗余度指标揭示了供应链的抗干扰能力和稳定性。何国建(2009)引入耗散结构及熵理论并在此基础上首先分析了供应链符合耗散结构的条件,解释其如何形成耗散结构,以及供应链中熵的存在;然后对供应链熵流进行分析,建立模型,对供应链进行定性熵流分析,找出影响供应链运作的因素,并对其管理提出建议;对供应链的熵值进行了分析,并将供应链的熵分为结构熵、运行熵、环境熵三大类,运用定量分析的方法,对供应链熵值进行计算并在此基础上给管理层提出建议。

综上所述,熵作为组成系统的微观状态的无序性(或混乱度)的量度,按照信息论基本原理的解释,信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;如果指标的信息熵越小,该指标提供的信息量越大,在综合评价中所起作用理当越大,权重就应该越高。目前在供应链研究中,熵权基于其简单性与客观性在供应链多指标综合评价中得到较好的应用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈