机器学习的系统能力并不适合于所有任务。当前机器学习的成功主要依赖于监督学习,通常使用DNN来完成。在教育领域中部分工作适合这种方法,而且决策能力还相对较弱,在某些情况下效率低下。区分教育问题是否适合机器学习,我们可以考虑以下几点因素。
1.特征性强问题的方法
这里提到的特征性强的、目标明确的问题是指学习定义明确的输入输出匹配的函数问题,机器学习可以学习预测任意X相关的y值。
这一准则适用于分类(例如,在图像中标记狗的品种,根据患癌症的可能性标记医疗记录)和预测(例如分析贷款申请,以预测未来违约的可能性)。
在教育问题中存在非常多的具有规律性、特征性非常强的内容,如:启发形象思维的教具、模具,许多有规律的教学过程数据,甚至有意进行夸大的、夸张的教学实物等,非常满足机器学习的要求。教学训练的多样本为加强学习的准确性提供了有力的训练保障。DNN的一个显著特征就是在样本数量达到足够多后,性能趋于稳定的算法,因而在训练数据中获取所有相关输入特征尤为重要。在教学当中的图片、图案、文字、文章、三维模型、三维物体的识别,像这种有规律的、带有特征性的、短期内不变的内容是可以进行机器学习训练的。所以在机械制图、机械原理、物流、虚拟现实操作等课程上非常适合用机器训练的方法完成对其目标的识别。
就拿VR/AR的识别问题来说,它们可以完成目标(比如:物体和楼房)特征的捕捉训练,可以形成带有数字化博物馆的识别能力、浏览能力,甚至可以形成导游能力。
对于常规的教学过程(比如:网络教育的选课、注册、缴费等过程),适合于机器训练,可以通过数据变化曲线找出相应的输入函数和输出函数,找出事物的规律,在掌握规律的基础上给出针对过程的相应管理措施。
机器学习是一个数据量非常大的工作,笔者曾经参加过车牌识别的项目,训练车牌的各种情形后才能投入最基本的使用,这其中包括车牌字的提取、伪造识别、字的识别、字的伪造等系列识别工作,机器学习在投入使用后还在不断更新,逐渐趋于稳定,识别率趋于正常化。目前拟人机器学习训练方法在图像识别上、数据变化曲线中可以很快完成训练,只要进行有限次数的训练就可以达到投入使用的应用标准,比如:给几幅不同角度的照片,就可以识别出房子的建筑风格,这是因为加入了人识别的思维。
2.规律性不强问题的方法(www.daowen.com)
在教育问题上,并不是所有的问题都可以通过训练来完成。很多教育事件呈现突发性,尤其在新的教育模式下(比如:网络教育)将呈现出不规则性,部分过程学问题没有规律性,还有许多带有人为因素和感情因素,尽管DNN原则上可以表示任意函数,计算机很容易模仿和延续训练数据中的偏差,但会错过一些难以观测到的相关数据间的规律性,用训练的方法可能达不到相应的效果,找不到相应的规律和行为规则,像这样的问题和事件可以考虑以下方法处理。
数据通常可以通过监测现有流程和用户交互来创建。通过聘用人员来明确标记部分数据,创建全新的数据集,或通过模拟相关问题设置来创建。
训练的模型样本越多,处理的问题就越成熟,处理的问题就会越准确,在许多突发事件的训练当中,这种情况极为罕见但又特别重要。所以当样本非常少、不满足训练条件、明显就有些强求时,就必须进行人工标记特征或作为特殊指标进行专家知识库的存储,甚至进行拟合性的训练。
许多特别事件和突发事件有必要进行人为的特征标定,有必要进行识别的干预,有必要自定义它的特征、内容和识别的标记。
3.明确目标的方法
教学当中有一个非常头疼的问题,就是这个教师讲课非常好,但是什么地方什么样的人群说好,哪些人群不喜欢他,在什么样的知识点讲得好,我们如何建立这种模型等,成为黑盒问题,经常是处于无解状态。像这种无解的问题,我们倒不妨用机器训练的方法进行批次的、人群分类型的、各个知识点的、有针对性的训练。同时训练的输入参数还应该包括教师类型、教师的即时状态、教师讲课风格等,找出相应的讲课模型。当然,我们并不指望训练出所有的讲课模型,但是我们能训练出有代表性的讲课模型,而模型的建立,将对判断测试教师讲课是否受到欢迎、什么样类型受众期待有很大的帮助,其模型的建立将会给出相应的模型参数,这是我们最期待的目标,即建立一组函数。
我们训练的目标其实是在找出内部的关系,可能是学生与教学资源的关系,可能是学生听课效果与教师讲课艺术的关系,也可能是讲课效果与知识点讲课技巧的关系,所以在机器训练当中一定要明确目标,知道测试的人是谁、训练的人是谁、我们期望的目标是什么、谁是输入参数、谁是输出参数等。
为了达到机器学习展现出强大的能力和极佳的性能表现,我们可以明确界定系统级的性能指标,为机器学习系统提供一个黄金标准,当训练数据按照这个黄金标准进行标记时,就可以训练出性能优秀的函数。比如:给出讲课效果最好的输入参数等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。