【摘要】:动作识别是指从获取的视频中提取运动、表观、上下文等多种特征,在特征与动作类别之间建立关联,进而判断动作的所属类别。一种“理想”的特征表示能使后续估计器或分类器的工作变得简单轻松。因为完美的分类性能通常是不可能获得的,更一般的任务是确定每个可能动作类别的概率。在设计动作分类器时,我们总是希望建立一个“万能”的分类器,在特征向量不那么理想的情况下也能很好地完成识别任务。图6.1动作识别的基本过程
动作识别(action recognition)[1]是计算机视觉领域一个备受关注的研究方向,它使得计算机不仅能够观察外部世界,还能自动分析和理解场景中正在进行的人类活动,并做出相应的决策。拥有视觉功能的计算机具有更强的自主适应环境的能力,能够辅助人类完成许多重要的任务,如智能视频检索、智能视频监控、高级人机交互、智能环境构建等,这对于推动社会进步和生产力发展、保障公共和个人安全、丰富便捷人们的日常生活都具有重要的实际意义。
动作识别是指从获取的视频中提取运动、表观、上下文等多种特征,在特征与动作类别之间建立关联,进而判断动作的所属类别。动作识别的输入一般是视频,输出是动作类别标签,基本过程(图6.1)包括特征提取和分类器两个操作。特征提取的主要工作是从含有丰富、冗余信息的输入视频数据中抽取精练且有意义的信息来描述表示动作。一种“理想”的特征表示能使后续估计器或分类器的工作变得简单轻松。因此,特征提取在动作分析中扮演着十分重要的角色。对于动作识别和定位,动作的特征表示应该具有区分鉴别能力,即来自同一动作类别的不同样本的特征应该非常相近,而来自不同动作类别的样本的特征应该有很大的差异。分类器的作用是根据提取的特征向量来给被测视频或图像区域序列赋予一个动作类别标签。因为完美的分类性能通常是不可能获得的,更一般的任务是确定每个可能动作类别的概率。在设计动作分类器时,我们总是希望建立一个“万能”的分类器,在特征向量不那么理想的情况下也能很好地完成识别任务。(www.daowen.com)
图6.1 动作识别的基本过程
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关迁移学习基础及应用的文章