举一个用感知器解决现实世界问题的例子。想想如果去掉头发、首饰和第二性征,比如男性比女性更为突起的喉结,该如何区分男性和女性的面部。比阿特丽斯·哥伦布(Beatrice Golomb)是1990 年我实验室里的一名博士后研究员,她利用一个数据库中的大学生面部照片作为感知器的输入,经过训练的感知器能以81% 的准确度对面部的性别进行分类(见图3-6)。8而对于感知器难以分类的面部,人类也同样很难做出区分。我实验室的成员在同一组人的面部识别上达到了88% 的平均准确度。比阿特丽斯还训练了多层感知器(将在第8章中介绍),其准确度达到了92%,9 比我实验室的成员还要准确。她在1991 年的NIPS 大会上发表的演讲中总结道:“经验可以提高性能,这表明实验室的研究人员需要花更多时间来进行性别鉴定的工作。”她把她的多层感知器叫作“SEXNET”(性别网络)。在问答环节,有人问是否可以使用SEXNET 来检测异装癖者的面孔。“可以。”比阿特丽斯这样回答。而NIPS 大会的创始人爱德华·波斯纳(Edward Posner)辩驳道:“那就应该叫DRAGNET(法网)。”10
图3-6 这张脸属于男性还是女性?人们通过训练感知器来辨别男性和女性的面孔。来自面部图像(上图)的像素乘以相应的权重(下图),并将该乘积的总和与阈值进行比较。每个权重的大小被描绘为不同颜色像素的面积。正值的权重(白色)表现为男性,负值的权重(黑色)倾向于女性。鼻子宽度,鼻子和嘴之间区域的大小,以及眼睛区域周围的图像强度对于区分男性很重要,而嘴和颧骨周围的图像强度对于区分女性更重要。图片来源:M.S.Gray,D.T.Lawrence,B.A.Golomb and T.J.Sejnowski,“A Perceptron Reveals the Face of Sex,”NeuralComputation 7(1995):1160-1164,图1。(www.daowen.com)
区分男性与女性面部的工作有趣的一点是,虽然我们很擅长做这种区分,却无法确切地表述男女面部之间的差异。由于没有单一特征是决定性的,因此这种模式识别问题要依赖于将大量低级特征的证据结合起来。感知器的优点在于,权重提供了对性别区分最有帮助的面部的线索。令人惊讶的是,人中(即鼻子和嘴唇之间的部分)是最显著的特征,大多数男性人中的面积更大。眼睛周围的区域(男性较大)和上颊(女性较大)对于性别分类也有着很高的信息价值。感知器会权衡来自所有这些位置的证据来做出决定,我们也是这样来做判定的,尽管我们可能无法描述出到底是怎么做到的。
1957 年罗森布拉特对“感知器收敛定理”的证明是一个突破,他的演示令人印象深刻。在美国海军研究办公室(Office of Naval Research)的支持下,他搭建了一个以400 个光电单元作为输入的定制硬件模拟计算机,其权重是由电机调整的可变电阻电位器。模拟信号随着时间连续变化,就像黑胶唱片中的信号一样。用一组图片集(其中部分图片中有坦克,另外一部分则没有)进行训练,罗森布拉特的感知器即使在新图像中也能准确识别坦克。这一成果经《纽约时报》报道后引起了轰动(见图3-4)。11
感知器激发了对高维空间中模式分离的美妙的数学分析。当那些点存在于有数千个维度的空间中时,我们就无法依赖在生活的三维空间里对点和点之间距离的直觉。俄罗斯数学家弗拉基米尔·瓦普尼克(Vladimir Vapnik)在这种分析的基础上引入了一个分类器,称为“支持向量机”(Support Vector Machine),12它将感知器泛化,并被大量用于机器学习。他找到了一种自动寻找平面的方法,能够最大限度地将两个类别的点分开(见图3-5,线性)。这让泛化对空间中数据点的测量误差容忍度更大,再结合作为非线性扩充的“内核技巧”(kernel trick),支持向量机算法就成了机器学习中的重要支柱。13
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。