理论教育 实例学习的两个空间模型详解

实例学习的两个空间模型详解

时间:2023-06-15 理论教育 版权反馈
【摘要】:图4-2实例学习的两个空间模型执行时,首先由示教者给实例空间提供一些初始示教例子。②规则的表示形式应适应归纳推理。规则空间的表示方法应该支持归纳推理,常用的归纳方法有:把常量变成变量,省略条件,增加选择项,曲线拟合等。4)实例选择学习环节根据一批示教例子来搜索规则空间,由此产生出可能合理的假设规则的集合H。

实例学习的两个空间模型详解

实例学习不仅可以学习概念,也可获得规则。这样的实例学习一般是通过所谓的实例空间和规则空间的相互转化来实现的。实例空间是所有示教例子的集合,而规则空间是所有规则的集合。学习结束之前,这些规则称为假设规则。反过来,这些规则又需要进一步用实例空间的实例来检验,同时也需要运用实例空间中的实例所提供的启发式信息来引导对规则空间的搜索。所以,实例学习可以看作是实例空间和规则空间相互作用的过程。

实例学习应在规则空间中搜索、匹配所求的规则,并在实例空间中选择一些示教例子,以便解决规则空间中某些规则的歧义性。系统就是这样在实例空间和规则空间中交替进行搜索,直到找到所要求的规则。

两者的关系模型如图4-2所示。

图4-2 实例学习的两个空间模型

执行时,首先由示教者给实例空间提供一些初始示教例子。由于示教例子的形式往往不同于规则的形式,程序必须对示教例子进行解释,然后再利用被解释的示教例子去搜索规则空间。一般情况下,不能一次就从规则空间中搜索到要求的规则,因此还要寻找一些新的示教例子,这个过程就是选择示教例子。解释实例和选择实例这两个过程如此循环,直到搜索到要求的规则。

1)实例空间

有关实例空间的第一个问题是示教例子的质量,第二个问题是实例空间的搜索方法。

(1)示教例子的质量。高质量的示教例子是无二义性的,它可以对搜索规则空间提供可靠的指导。低质量的示教例子会引起互相矛盾的解释,因此只能对规则空间的搜索提供试探性的指导。

(2)例子空间的搜索方法。搜索例子空间的目的一般是选择适当的例子,以便证实或否决规则空间中假设规则的集合。第一种方法是选择对划分规则空间最有利的例子,以便很快缩小在规则空间的搜索范围;第二种方法是在假设规则集中选择最有希望的假设,再选择适当的示教例子证实它;第三种方法称为“基于期望的过滤”,它选择示教例子的目的是否决假设规则集中的某个假设规则,于是学习系统只注意与假设矛盾的例子;第四种方法选择示教例子的要求是使计算量最小。

2)解释实例

解释示教例子的目的是从例子中提取出用于搜索规则空间的信息,也就是把示教例子变换成易于进行符号归纳的形式。有时这个变换过程是很困难的。

3)规则空间

定义规则空间就是规定表示规则的各种算符和术语,也就是说,规定的描述语言可以表示的所有规则的集合是规则空间。与规则空间有关的两个问题是对规则空间的要求和规则空间的搜索方法。(www.daowen.com)

(1)实例学习对规则空间的要求:

①规则的表示与实例的表示一致。如果示教例子和规则的表示形式相差很大,那么解释例子和选择例子的过程就很复杂。因此,最好采用相同的形式来表示规则和示教例子。

②规则的表示形式应适应归纳推理。规则空间的表示方法应该支持归纳推理,常用的归纳方法有:把常量变成变量,省略条件,增加选择项,曲线拟合等。

③规则空间中应能够包含所有可能产生的规则。在有些实例学习的问题中,初始化时,所要求的规则并不一定全都包含在规则空间中,即规则空间的描述语言不一定能够表示全部要求的规则。解决的办法是引入新的术语,扩充规则空间的描述语言,使之能够适应所有的规则。

(2)搜索规则空间的方法:下面介绍搜索规则空间的四种方法。这些方法都具有一个假设规则的集合H。各种方法的区别在于怎样改进假设规则集H,以便得到要求的规则。

①变型空间方法。变型空间方法是一种数据驱动方法。这种方法使用统一的形式表示规则和例子。初始的假设规则集H包括满足第一个示教正例的所有规则。在得到下一个示教例子时,对集合H进行一般化或特殊化处理。最后使集合H收敛为只含要求的规则。

②改进假设方法。改进假设方法也是一种数据驱动方法。这种方法表示规则和例子的形式不统一。程序根据例子选择一种操作,用该操作去改进假规则集H中的规则。

③产生与测试方法。产生与测试方法是一种模型驱动方法。这种方法针对示教例子反复产生和测试假设的规则。在产生假设的规则时,使用基于模型的知识,以便只产生可能合理的假设。

④方案示例方法。方案示例方法也是一种模型驱动方法。它使用规则方案的集合来限制可能合理的规则的形式。最符合示教例子的规则方案被认为是最合理的规则。

数据驱动方法的优点是可以逐步接受示教例子,逐步学习。特别是变型空间方法,它很容易修改集合H,不要求程序回溯就可以考虑新的例子。反之,模型驱动方法难以进行逐步学习。它通过检查全部例子来测试和放弃假设。在使用新例子时,它必须回溯或重新搜索规则空间,因为原来对假设的测试已不适用于新例子加入后的情况。

模型驱动方法的优点是抗干扰性较好。由于使用整个例子集合,程序就可以对假设进行统计测量。在用错误例子测试假设时,它不因一两个错误例子而放弃正确的假设。反之,数据驱动方法用当前的例子去修改集合H,因此一个错误例子就会造成集合H的混乱。解决方法是每次用新例子修改集合H时只作较小的修改。这可以减小错误例子的影响,当然也使学习过程变慢了。

4)实例选择

学习环节根据一批示教例子来搜索规则空间,由此产生出可能合理的假设规则的集合H。此后,系统需要获取新的例子来检验和改进集合H。实例选择这一步的任务就是确定需要哪些新的例子和怎样得到这些例子。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈