国际情感计算模型的相关研究与进展

更新时间：2025-01-03 理论教育 版权反馈

【摘要】：目前有很多从各个角度出现的对情感模型的探索研究，下面介绍一些已有的人工情感计算模型。OCC模型是早期对于人类情绪研究提出最完整情绪模型之一。Sloman指出与这一层相关联的情感包括羞耻、羞辱和悲痛等。人类情感包括身心两个方面的相互作用，但计算机就不像我们一样拥有身体，因此Canamero试图通过模拟人类的生理系统来虚构“类似”的身体。由动机强度导致的行为要受Abbott情感的影响。

目前有很多从各个角度出现的对情感模型的探索研究，下面介绍一些已有的人工情感计算模型。

1.OCC（A.Ortony、G.Clore、A.Collins）情绪模型

1988年，Ortony、Clore和Collins在所出版的《情感的认知结构》一书中，就给出了一个著名的“OCC”认知鉴定的情绪模型。OCC模型是早期对于人类情绪研究提出最完整情绪模型之一。

OCC情绪模型中，将情绪依其起因区分为三大类：事件的结果、智能体的动作和对于对象的观感。模型共定义了22种基本情绪，并定义了情绪的阶层关系。详细的分类与阶层关系如图3-14所示。Ortony等认为：对于有情感的机器而言，他们的模型也许并不重要，但要使计算机可以推断情感，尤其在理解自然语言、协同解决问题和进行规划方面，那么只有具备了某些结构才能涉及情感的概念。

图3-14 OCC情绪模型

OCC模型采用的不是基本情感集或一个明确的多维空间来表达情感，而是用一致性的认知导出条件来表述情感。特别是，在该模型中，假定情感是对事件（高兴与否）、智能体（满意与否）和对象（喜欢与否）构成情势的倾向（正面或负面的）反应。通过不同认知条件推导归纳，大约规范出22种情感类型，其中包括用来产生这些情感类型的基本构造规则。应该说，OCC是第一个易于计算化实现的认知型情感产生模型。

OCC模型中，首先设置一些函数，例如D（p，e，t）表示人物p在t时刻对事件e设定的期望值：正值表示期待的事件具有有利的结果，负值表示不利的结果。I_g（p，e，t）代表全局强度变量（例如期待、现实、接近度）的一种组合。现在如果设P_j（p，e，t）表示一种“欢乐”的潜力，那么产生“欢乐”的规则为如果D（p，e，t）＞0，那么设

P_j（p，e，t）=f_j（D（p，e，t），I_g（p，e，t））

式中，f_j（·）是将欢乐具体化的函数。类似的规则可以用来计算其他情感。例如，可设“悲痛”的潜力函数为P_d（·），然后将上述规则中的测试条件改为小于0（负期望值），并用f_d代替f_j来进行计算。

当然，上述规则并不会引起欢乐的状态或者一种欢乐的情感体验，但可用来构建触发快乐强度I_j的规则，即可有如果P_j（p，e，t）＞T_j（p，t），那么设

I_j（p，e，t）=P_j（p，e，t）-T_j（p，t）

否则设

I_j（p，e，t）=0

式中，T_j为阈值函数。

从而通过这一规则来激活快乐情感；当超过设定的快乐阈值时，就产生“快乐”情感。结果强度值对应于欢乐集合中的一种情感，例如适中的值对应“愉悦”，特别高的值对应“幸福”等。当然在OCC模型里，也可以构造其他情感类型的相应规则，只是要比欢乐和痛苦的规则更为复杂。

OCC模型将情感作为情势——包括事件、对象和智能体——的结果来生成。因此处于某种情感状态就是自我的一种情势，这样模型也就允许一种情感触发另一种情感，或触发同一种情感。这无疑极大地提高了OCC模型的情感生成能力，不仅能推断和产生认知型情感，而且还可以触发对其他情感的主观体验。

2.CogAff模型

英国伯明翰大学的A.Sloman提出情感三层体系结构。Sloman推测成人大脑中至少有三层体系结构：一个反应层、一个传输层和一个自我监控层，如图3-15所示。

在Sloman的体系结构中，反应层探测周围环境中的事物，并自动执行进程，以决定如何反应。传输层能够进行计划、评价选择、作出决定以及分配资源。在传输层也包括对成功或失败进行认知评价、情感学习，并具有将可靠的学习结果传给反应层的能力。第三层的自我监控主要进行后期管理，防止目标彼此混淆，并可以寻找有效的途径来提供传输层操作、选择策略及分配其资源。Sloman指出与这一层相关联的情感包括羞耻、羞辱和悲痛等。

为了适应处理过程发生快速变化的情况，模型又增加了一个警觉系统，警觉系统可以从各层获得输入，并且能向各层输出。CogAff模型对于人工智能研究和使用情绪的主要贡献是，引发出专门的情感反应要依据情感处理过程中动机的发生。这意味着同样的情形可以触发不同的情感反应，如图3-16所示。

图3-15 CogAff模型

图3-16 有警觉系统的CogAff模型

基于CogAff模型，Sloman又发展了一个H-CogAff模型，如图3-17所示。该模型力图覆盖正常成人信息处理过程的主要特征，但作者也承认这个体系结构还缺乏实现的细节。

3.Salt&Pepper模型

里斯本大学的Botelho提出了一个Salt&Pepper模型来反映自治智能体的人工情绪（见图3-18）。Salt&Pepper模型有三个主要层次：认知和行为发生器、情感发生器以及中断管理器。还有，情感引擎包括情感传感器、情感发生器和情感监控器。

在情感信息处理中，情感引擎首先通过情感发生器对智能体的全局状态进行估价，把情感信息分类为情感标记、对象的评价、紧急性评价，然后把每个情感信息以节点的形式存储在长期记忆单元，节点之间可以互相交互，节点还包含相应的情感反应信息。情感的强度与这些节点的活动水平相关。产生情感反应，然后这些情感反应使智能体全局状态发生改变。

图3-17 H-CogAff模型

图3-18 Salt&Pepper模型

4.D.Canamero模型

布鲁塞尔自由大学的D.Canamero构建了这样一个系统，在该系统中，情感引发了人造荷尔蒙的变化，并由此对生理变化产生情感的过程进行了模拟。

人类情感包括身心两个方面的相互作用，但计算机就不像我们一样拥有身体，因此Canamero试图通过模拟人类的生理系统来虚构“类似”的身体。

Canamero的系统模拟的是一个二元社会，居民分为“Abbott”和没有情感的“Enemy”两类，其中一部分具有产生与Enemy相处的行为、动机和情感能力。每个Abbott的行为、动机和情感都有对应的生理含义。特别是，动机是要趋向于“生理”的动态平衡。比如，当一位Abbott散步时，如果体温升高感到太热时（动机），就会想办法降低体温。每个动机都有一个强度值与其对应，强度值最高的动机控制行为和意图。

由动机强度导致的行为要受Abbott情感的影响。情感可以由外部事件触发，也能被内部的生理变化或模式触发。

Canamero的系统模仿了情感的生物化学处理过程，其情感模型考虑的主要是动机的强度。

5.Cathexis模型

麻省理工学院J.Velasquez提出了一种名为Cathexis的情感综合产生器模型（见图3-19）。它是一种包含专门情绪系统的网络结构，他把这种专门的情绪系统称为专门主体（见图3-20）。每个专门主体代表的不是某种单一的情感类型，而是一类相关的情感状态，例如恐惧、痛苦、惊骇等。在每个专门主体中，有不同的传感结构监控外部（环境事件）刺激以及内部（内驱力水平、感觉运动处理的反馈行为）刺激，来激发由不同专门主体所代表的情绪类型，以获得适当的情感状态。这些传感结构依据刺激的情况增加或减少它们所属的专门主体中的情绪强度。对于每个专门主体有两个阈值：第一个阈值是α，控制着情绪的激发，一旦情绪超过这个阈值，这个情绪专门主体会发出信号传给其他的专门主体，并且传给行为系统，行为系统会根据这些情绪系统的状态来选择适当的行为；第二个阈值是ω，控制着情绪专门主体的饱和水平。每个专门主体中还设有一个衰减函数ψ（），用以控制情绪状态的持续时间。其中，四个情感发生器分别是：①神经中枢情感发生器，用以模仿神经递质等化学物质引发的情感影响；②动机情感发生器，用以模拟由痛苦激发产生动力之类的情感影响及情感的互相激发；③感觉运动情感发生器，用以模拟姿势、面部表情等行为引发的情感影响；④认知情感发生器，用以模拟大脑皮层推理的情感影响。

图3-19 Cathexis模型体系(www.daowen.com)

图3-20 情绪专门主体

Cathexis系统由专门主体构成，类似于智能社会中的智能体。每个专门主体代表一种基本情感类型，可以对输出行为施加影响。与对每种情感都有不同规则的OCC模型不同，Ca-thexis模型只有一条更新规则。在t时刻，按如下规则更新每个专门主体p（p=1，2，…，P）的情感强度I_p（t），即新的强度是其衰减前值、发生器和其他情感强度影响的一个函数：

式中，ε_p，l（l=1，2，3，4）分别为四个发生器赋予专门主体的对应值；α_p，m为专门主体m作用于专门主体p的兴奋效益；β_p，m为专门主体m作用于专门主体p的抑制性效益；f为控制情感强度随时间衰减的函数；g为保证情感强度在零与饱和值之间取值的约束函数。每个专门主体都有一个饱和阈值，当情感强度超过了这个阈值时，就不再增加。这是为了保证模型的非线性行为。

6.EM模型

葡萄牙的Custodio等人提出的基于情感模型（Emotion Model，EM）是一种可用于智能控制的模型，如图3-21所示。

图3-21 EM模型

EM模型由认知层和感知层组成。外界环境对系统的刺激同时在这两层的处理器中并行处理。前者抽取以模式匹配为目标的认知图像（IC），该图像包含能恢复原始图像的足够丰富的信息；后者则抽取输入图像的基本特征，产生简化的感知图像（IP）。此外，在感知层中还要建立一个愿望向量DV，该向量的每一个分量对应一个基本刺激的评价，例如“好”、“坏”等及相应的对策（反应）。在IP与DV之间有一个直接的映射。在系统的主存储器中存放有过去经历过事件所对应的认知图像、感知图像和DV。认知处理器在从外界刺激获得认知图像后，就会在主存储器中寻找匹配，而在其工作存储器（内存）中，则存放当前输入的认知图像、DV、感知图像以及匹配过程的结果。系统对输入刺激的反应（采取的行动）主要来自DV，但在必要时也可以来自认知处理器。系统所采取的行动会使环境发生变化，使系统感受到新的刺激，这种反馈刺激使系统知道其行为的效果，同时也使系统能在不同的层次上进行学习，在感知层更新感知映射，而在认知层则对认知图像进行DV标记。可以看出，这一模型的感知层如果将其与认知层的联系短路，就是前述基于行为的系统。由于感知层与认知层之间的相互作用，EM能完成更复杂的任务，并进一步与基于理智（逻辑推理）的上层系统接口。

图3-22 HMM

7.隐马尔可夫模型（HMM）

这是Picard于1995年提出的一个HMM（见图3-22）。这个模型有三个情绪状态，但它可以扩充为多个。Picard认为，一个人的情绪状态（即快乐、兴趣和悲伤）不能被直接观察，但某一状态的特征能够被观测得到（如声音的波动特征），通过特征来找出可能的情感状态。

也可以用整个HMM结构图描述状态，进而来识别更大规模的情感行为。后者需要一系列的HMM结构图，每个HMM结构图对应一种情感行为，或对应每个人对给定行为的不同情感反应特征。

用整个HMM状态图来表现一种情感，模型能抓住情感的动态的一面。HMM适合表现由几种情感组成的混合情感，就像忧郁就可以由爱和悲伤组成；还适合表现由几种纯的情感状态基于时间的不断交替出现而组成的混合情感，“爱恨交加”的HMM状态图就可能是在爱和恨两种之间的循环，可能还时不时在中性状态上停顿。

8.Kismet模型

Kismet是麻省理工学院C.Breazeal设计的一个机器人，Kismet的组成主要有感知系统、行为系统、注意系统、动机系统和运动系统，如图3-23所示。

图3-23 Kismet模型

a）Kismet外形 b）Kismet部件结构 c）Kismet体系结构

感知系统把传感器得到的原始数据进行转换和加工，用来指导行为的产生。

动机系统由情绪和驱力两个相关联的子系统构成，驱力子系统表现机器人的基本“需要”，用强度来量化。情绪子系统有两个作用：一个是可以产生情绪表达；另一个是对外界输入的刺激和内部需要进行综合判断，从而引起表现行为的各种变化来调整与环境之间的交流。

注意系统用来挑选出外界环境中对机器人感兴趣的事物，以引导机器人的注意和使机器人的视线朝向他们。

行为系统用来使机器人的行为组织成连贯的动作。

运动系统用来实际输出机器人的运动和表现。它由四个子系统组成：运动技巧系统、面部表情系统、发音系统和视觉运动系统。

Kismet的情感模型是作为环境、内部刺激和行为动作的媒介，通过这个模型，机器人对外界输入的刺激和内部需要进行综合判断，从而引起表现行为的各种变化。Kismet的情绪反应由下面几个部分组成：一个突然的事件（情绪的刺激），事件的情感估价（情绪的评价），特有的表达（情绪的激活），激发一个行为反应的动作趋向（情绪的表达）。

情绪的刺激：Kismet的情绪系统被外部事件激发，激发事件包括视觉和听觉刺激。机器人的当前情感状态影响外界刺激的激发程度。

情绪的评价：这部分是用来对一个给定的刺激使用三种情感特征[唤醒（Arousal）、效价（Valence）、姿态（Stance）]进行标记。

情绪的激活：Kismet处理的情绪状态有快乐、生气、厌恶、恐惧、悲伤、惊奇、兴趣、厌烦八种基本情绪以及平静。

每个情绪的激活水平用下面公式描述；

Aemotion=Eemotion+Bemotion+Pemotion-δ_t （3-2）

式中，Eemotion代表激活能量；Bemotion代表与激活阈值有关的偏移量；Pemotion表示激活情绪的持续水平；δ_t表示情绪转移的延迟时间。

图3-24 Kismet的情感空间

情绪的表达：情绪的表达采用一个三维空间（见图3-24）。三个维度对应的是唤醒、效价和姿态。机器人当前的情感状态是空间中的一个点，当它的情感状态改变时，这个点在这个三维空间内运动。空间中每个点均代表一种情感状态，整个空间被分成以若干个点为中心的几个区域，每个区域代表特定的一种情感状态。某时刻的情感状态是综合考虑Kismet的感知系统、动机系统和行为系统的作用而得到的。距离该情感点最近的区域将被激活，Kis-met根据该区域代表的情感状态产生相应的面部表情，表情的强度和该情感状态点与被激活区域中心的距离成正比。

9.机器人WE-3RV和WE-4R的情感模型

日本早稻田大学开发的WE-4R情感机器人由视觉、听觉、触觉和嗅觉传感器来感知外界刺激信号。依据大脑模型的三层结构——反射、情绪和智力来建造WE-4R的智力模型，如图3-25所示。另外，把情绪区分为“学习系统”、“心境”和“动态响应”。WE-4R可根据外部和内部的刺激相应地改变它的情绪状态，并且可通过面部表情、面部颜色和身体姿态来表达情绪。WE-4R可表达9种表情，并且每种表情的强度按照与中性表情的差别又分为50个等级。WE-4R的情感空间（见图3-26）由激活、愉悦和确定三维构成，空间中用情绪向量和心境向量来表达情感。其中，心境向量位于激活和愉悦的二维空间中。为了描述心境向量的激活成分，采用一个由一种神经网构成的内部钟来表述。此外，WE-4R还引入了个性的概念，它包括感知个性和表达个性。其中，感知个性决定刺激如何影响机器人情感状态；表达个性则影响机器人表情和颈部运动。

图3-25 WE-4R的智力模型

图3-26 WE-4R的情感空间

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

有关机器智能：人工心理的文章

国际情感计算模型的相关研究与进展

2025年高中生迟到检讨书如何撰写

如何撰写2025年单位员工迟到的检讨书

如何撰写2025年值日迟到的检讨书

如何撰写2025年会议迟到反思报告

2025年员工迟到的反思与检讨该如何撰写

2025年军训迟到检讨书怎么写

如何撰写2025年年度上班会议迟到检讨书

2025年会议迟到检讨书如何撰写

相关推荐