理论教育 机器学习的基本模型简介

机器学习的基本模型简介

更新时间:2025-01-03 理论教育 版权反馈
【摘要】:图4-1一种机器学习的模型模型中包含学习系统的四个基本组成环节。信息质量对学习难度有明显的影响。2)知识库影响学习系统设计的第二个因素是知识库的形式和内容。指学习系统通过增加词典条目和表示结构来扩大表示能力,以便学习更复杂的知识。学习系统实质上是对原有知识库的扩充和完善。3)执行环节学习环节的目的就是改善执行环节的行为。

一种机器学习的模型如图4-1所示。

图4-1 一种机器学习的模型

模型中包含学习系统的四个基本组成环节。环境和知识库是以某种知识表示形式表达的信息的集合,分别代表外界信息来源和系统具有的知识。学习环节和执行环节代表两个过程:学习环节处理环境提供的信息,以便改善知识库中的显式知识;执行环节利用知识库中的知识来完成某种任务,并把执行中获得的信息回送给学习环节。

下面讨论系统中的各个环节。

1)环境

环境可以是系统的工作对象,也可以包括工作对象和外界条件。例如:在医疗系统中,环境就是病人当前的症状、检验的数据和病历;在模式识别中,环境就是待识别的图形或景物;在控制系统中,环境就是受控的设备或生产流程。就环境提供给系统的信息来说,信息的水平和质量对学习系统有很大影响。

信息的水平指信息的一般性程度,也就是适用范围的广泛性。这里的一般性程度是相对执行环节的要求而言的。高水平信息比较抽象,适用于更广泛的问题。低水平信息比较具体,只适用于个别的问题。环境提供的信息水平和执行环节所需的信息水平之间往往有差距,学习环节的任务就是解决水平差距问题。如果环境提供较抽象的高水平信息,学习环节就要补充遗漏的细节,以便执行环节能用于具体情况。如果环境提供较具体的低水平信息,即在特殊情况下执行任务的实例,学习环境就要由此归纳出规则,以便用于完成更广的任务。

信息的质量指正确性、适当的选择和合理的组织。信息质量对学习难度有明显的影响。例如,若施教者向系统提供准确的示教例子,而且提供例子的次序也有利于学习,则容易进行归纳。若示教例子中有干扰,或示例的次序不合理,则难以归纳。

2)知识库

影响学习系统设计的第二个因素是知识库的形式和内容。(www.daowen.com)

知识库的形式就是知识表示的形式。常用的知识表示方法有特征向量、谓词演算、产生式规则、过程、LISP函数、数字多项式、语义网络和框架。选择知识表示方法要考虑下列准则:可表达性、推理难度、可修改性和可扩充性。下面以特征向量和谓词演算方法为例说明这些准则。

(1)可表达性。特征向量适于描述缺乏内在结构的事物,它以一个固定的特征集合来描述事物。谓词演算则适于描述结构化的事物。

(2)推理难度。一种常用的推理是比较两个描述是否等效。显然判定两个特征向量等效较容易,判定两个谓词表达式等效的代价就较大。

(3)可修改性。特征向量和谓词演算这类显式的表示都容易修改,过程表示等隐式的方法就难以修改。

(4)可扩充性。指学习系统通过增加词典条目和表示结构来扩大表示能力,以便学习更复杂的知识。一个例子是AM(Lenat,1983年),它可根据老概念定义新概念。知识库的内容中,初始知识是很重要的。它总要利用初始知识去理解环境提供的信息,以便形成和改进假设。学习系统实质上是对原有知识库的扩充和完善。

3)执行环节

学习环节的目的就是改善执行环节的行为。执行环节的复杂性、反馈和透明度都对学习环节有影响。

复杂的任务需要更多的知识。二分分类是最简单的任务,只需一条规则。如某个玩扑克的程序有约20条规则,MYCIN这类医疗诊断系统使用几百条规则。在实例学习中,可以按任务复杂性分成三类:一是基于单一概念或规则的分类或预测;二是包含多个概念的任务;三是多步执行的任务。

执行环节给学习环节的反馈也很重要。学习系统都要用某种方法去评价学习环节推荐的假设。一种方法是用独立的知识库作这种评价。如AM程序用一些启发式规则评价学到的新概念的重要性。另一种方法是以环境作为客观的执行标准,系统判定执行环节是否按预期标准工作,由此反馈信息评价当时的假设。

若执行环节有较好的透明度,学习环节就容易追踪执行环节的行为。例如,在学习下棋时,如果执行环节把考虑过的所有走法都提供给学习环节,而不是仅仅提供实际采用的走法,系统就较容易分析合理的走法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈