智能驾驶中的机器视觉技术是一项很复杂的技术,它需要进行更多更细致的研究。目前的难点和重点主要集中在快速有效的立体配对、道路环境的快速三维重建和机器视觉处理的实时性上。视频图像处理是智能驾驶领域中的研究热点。近年来在智能车研发、智能交通系统等方面的需求推动下,视频图像处理技术在智能驾驶领域的应用日益广泛。但由于环境因素、智能驾驶实时性等相关因素的存在,使得视频图像处理算法在智能驾驶中的应用受到很大限制,尤其在智能驾驶中的关键部分:车道线、标志牌、交通信号灯等方面表现得更为突出。
这主要由于各种天气晴、阴、雨、雪、雾等气候环境,路面环境如路面的宽度、颜色、纹理、弯道、坡度、坑洼、障碍与车流等,因此视频图像处理算法的普适性很难达到。目前,比较一致的观点认为,可以通过提取地图信息的高层语义特征,实现有语义辅助的视频图像处理。
本章的识别算法主要是基于SVM进行分类的,而当前多数分类、回归等学习方法(包括SVM)为浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约。
深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。在计算机视觉里经常使用的深度学习方法是卷积神经网络,即CNN,这是一种对人脑比较精准的模拟。在CNN中,如果卷积神经网络的深度太浅的话,识别能力往往不如一般的浅层模型,比如SVM或者boosting;但如果做得很深,就需要大量数据进行训练,否则机器学习中的过拟合将不可避免。即深层的卷积神经网络对计算机的运算要求比较高,需要进行大量重复可并行化的计算,在CPU运算能力不高的情况下,不可能进行很深的卷积神经网络的训练。但随着GPU计算能力的增长,卷积神经网络结合大数据的训练成为了可能。(www.daowen.com)
因此,“深度模型”是手段,“特征学习”是目的。区别于传统的浅层学习,深度学习的不同在于:①强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;②明确突出了特征学习的重要性,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。
智能驾驶中的视频图像处理是一个跨学科的、富有挑战性的研究课题。在这个领域中,与传统视频图像处理存在着很大差异,对环境的适应性以及算法实时性等要求,给众多研究者带来了巨大困难。本章针对智能驾驶中常用的几类视频图像处理算法进行了论述,各个算法还有待进一步优化,在机器学习方面,使用深度学习模型进行优化,特别是在智能驾驶中应用中,在后续的内容会讲述相关算法使用GPU进行优化的过程,也是未来智能驾驶中至关重要的部分。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。