理论教育 现实环境下的物体识别难点:照明变化的挑战

现实环境下的物体识别难点:照明变化的挑战

时间:2023-06-28 理论教育 版权反馈
【摘要】:相比于照明的方向和位置都能固定的可控实验环境,在现实世界中,照明可能因地点和时间的不同而发生显著变化,这极大地增加了计算机物体识别任务的复杂性。MIT 档案中的一份文件证实了他的回答。2 这个看上去很容易解决的问题,最终被证明是个“陷阱”,吞噬了整整一代计算机视觉研究人员的青春。

现实环境下的物体识别难点:照明变化的挑战

积木世界(Blocks World)是MIT AI Lab 在20 世纪60 年代推出的一个项目典范。为了简化视觉问题,积木世界由矩形积木组成,可以堆叠起来组成新的结构(见图2-1)。该项目的目标是编写一个能够理解命令的程序,例如“找到一个大的黄色积木并将其放在红色积木上面”,并规划出让机器人手臂执行命令所需的步骤。这看起来像小孩子玩的游戏,但却需要编写一个庞大而复杂的程序来实现。这个程序后来变得十分冗长烦琐,以至于编写该程序的学生特里·维诺格拉德(Terry Winograd)离开该实验室之后,该程序因为错误百出,频频崩溃,最终被无奈地放弃了。这个看起来很简单的问题比任何人想象的都要难得多,即使成功了,也很难把积木世界同现实世界顺利地连接起来,毕竟在现实世界中物体有不同的形状、大小和重量,而且并非所有边角都是直角。相比于照明的方向和位置都能固定的可控实验环境,在现实世界中,照明可能因地点和时间的不同而发生显著变化,这极大地增加了计算机物体识别任务的复杂性。

(www.daowen.com)

图2-1 马文·明斯基在观察机器人堆积木(照片拍摄于1968年左右)。积木世界是我们如何与世界交互的简化版本,但它面对的问题比任何人想象的都要复杂得多,直到2016 年才通过深度学习解决。

20 世纪60 年代,MIT AI Lab 获得了来自一个军事研究机构的大笔资金,被要求用于打造一个可以打乒乓球的机器人。我曾经听过一个故事,那就是这个项目的负责人忘了在基金申请书中加上为机器人建立一个视觉系统的预算,于是他把这个问题分配给了一个研究生作为暑期研究项目。后来我问马文·明斯基这个故事是不是真的。他反驳道:“我们把那个问题分配给了本科生。”MIT 档案中的一份文件证实了他的回答。2 这个看上去很容易解决的问题,最终被证明是个“陷阱”,吞噬了整整一代计算机视觉研究人员的青春。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈