认知也可以被称为认识,是指人认识外界事物的过程,或者说是对作用于人的感觉器官的外界事物进行信息加工的过程,对认知进行研究的科学被称为认知科学。认知科学是20世纪世界科学标志性的新兴研究门类,其目的是探究人脑或心智的工作机制。认知科学是一门广泛交叉的学科,其分支领域有计算机科学、心理学、哲学、语言学等,而在计算机科学中,研究认知科学所采用的方式正是人工智能领域的一个重要的方法——模式识别(Pattern Recognition)。
人类智慧的一个重要方面是其认识外界事物的能力。这些能力可能从一个人的孩童时期就具备并且不断增强的,如果仔细分析我们日常所进行的很多活动就会发现,几乎每一项活动都离不开对外界事物的分类和识别。
例如,当我们看到图8-5时,我们很明确地得出“这是一只小猫”的结论,这一看似简单的认知过程实际上是由一系列对事物的识别构成的,因为在我们的头脑中已经形成了对“小猫”这一类事物所具有的特征的认识,因此,尽管并不是所有的“猫”我们都见过,但是我们仍然能够丝毫不困难地识别出图片中的“小猫”。
图8-5 小猫示例
模式识别一词的英文是Pattern Recognition。在中文里,“模”和“式”的意思相近。根据《说文》:模,法也;式,法也。因此模式就是一种规律。Pattern主要有两种含义:一是代表事物(个体或一组事物)的模板或原型,二是表征事物特点的特征或性状的组合。“识别”就是把对象分门别类地认出来。模式识别作为人工智能中一个分支学科,其目的就是通过一系列数学方法让机器(计算机)来实现类似人的分类识别能力。
1.模式识别的主要方法
模式识别从20世纪50年代兴起,主要被应用于图像分析与处理、语音识别、声音分类等问题,解决模式识别问题的方法可以归纳为基于知识的方法和基于数据的方法两大类。
(1)基于知识的方法
所谓基于知识的方法,主要是指以专家系统为代表的方法,其基本思想是,根据人们已知的(从专家那里收集整理的)关于研究对象的知识,整理出若干描述特征与类别间关系的准则,建立一定的计算机推理系统,对未知样本通过这些知识推理决策其类别。
(2)基于数据的方法
在确定了描述样本所采用的特征之后,通过收集一定数量的已知样本,用这些样本作为训练集来训练一定的模式识别机器,使之在训练后能够对未知样本进行分类。这种模式识别的方法可以看作是基于数据的机器学习。
2.模式识别系统举例(www.daowen.com)
(1)语音识别
语音识别的目的就是通过语音来确定说话者的身份,而不是识别说话的内容,在这里,每个需要区分的人就成为单独的一个类别。
语音识别与指纹识别、人脸识别等一样,是现代身份鉴别技术的一个重要方面,可用于远程说话人核对、语音命令系统权限管理、手机语音唤醒等。随着科技与时代的发展,语音识别技术也将在大规模多媒体信息检索中发挥关键作用,如图8-6所示。
图8-6 手机所有者语音唤醒
(2)字符与文字识别
各种形式的字符与文字识别是模式识别的另一个典型的应用,包括印刷体的光学字符识别(OCR)、手写体数字识别、手写体文字识别等。
光学字符识别是指通过扫描仪把印刷体或手写的文字稿件输入到计算机中,并且由计算机自动识别出其中的文字内容,OCR(Optical Character Recognition)的名字也是由早期强调光学输出手段而得名。
目前,文字识别已经发展成为许多手机和掌上计算机的基本配置,如图8-7所示,将图片中的文字识别并输出。
图8-7 OCR应用软件示例
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。