1)如何理解计算机视觉
计算机可以拥有类似眼睛的视觉能力吗?答案是肯定的。这并不意味着计算机也可以长一双眼睛,而是指计算机可以通过图像处理算法,对输入的图像或者视频进行提取和分析,就像人们的眼睛一样可以去判断和理解所观察到的事物和场景。总体来说,用计算机模拟人类视觉系统的科学被称为计算机视觉(Computational Vision, CV),它可以实现自动化、智能化和高效化地处理图像视频。
计算机视觉包括计算机成像学、图像理解、三维重建和动态视觉4大类。计算机成像学是对相机成像原理方面的研究。科研人员通过相关的图像处理算法,可以使受限条件下拍摄的图像变得更加完善。例如,遥感传感器拍摄的地面图像往往会有薄雾的遮挡,为了获取更加清晰的地物信息,计算机可以通过算法将这些薄雾去掉。又如,手机的拍照功能越来越强大,通过相关的图像处理算法,使得拍摄图像的色泽更加饱满、细节更加清晰等(图5-14)。图像理解,顾名思义就是去理解图像中的事物是什么及有什么意义。计算机是怎么理解图像的呢?以判断图像中的动物类别为例,人眼是根据图中动物的身型、色泽、耳朵、尾巴等特征来确定它到底是一只狗还是一匹马。计算机也采取了类似的做法,它通过一系列图像理解算法先抽取出一副图像的颜色和纹理特征,然后根据这种特征判断这幅图像中的事物是什么。三维重建是指构造平面图像对应的三维模型,它对文物保护、植物保护、临床医学等研究起辅助作用,例如,把二维图像中的树恢复成三维空间中的立体树,这样人们就可以从各个角度观察这棵树的生长情况。动态视觉是计算机对图像序列的理解,如视频就是一种具有时序的图像序列。近年来,无人驾驶是动态视觉中研究的热点,如图5-15所示展示了利用深度学习模型对视频图像进行识别和理解,图中不同颜色的区域代表不同类别的事物。具体来说,车子在行驶过程中可以对观察到的连续的路况图像进行识别,判断哪里是道路,是否有行人,是否是红绿灯等,从而决定车子是继续行驶还是停止等待。
图5-14 拍摄的图像通过图像处理算法得到效果增强(来源于网络)
图5-15 深度学习模型用于视频识别(www.daowen.com)
2)计算机视觉在智慧城市管理中的应用
①在智慧城市管理的城市执法建设中,可以通过计算机视觉技术对视频监控技术采集到的道路图像信息进行视频图像处理、检测与识别,智能化地判断出占道经营等违法现象,并作出相应的处理建议与决策。
②在智慧城市管理的智慧园林建设中,可以采用计算机视觉中的图像分割技术,对园林绿地的种类进行自动分割和识别,帮助实现绿地种类的智慧管理。
③在智慧城市管理的城市公园智慧化建设中,可以用深度学习模型对公园各区域活动的视频监控图像进行训练和学习,智能化地对异常行为如践踏草坪、车辆闯入、火灾等现象进行识别和预警,进一步增强城市公园的秩序性和安全性。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。