理论教育 距离度量学习:构建度量矩阵M,设定目标优化距离表达形式

距离度量学习:构建度量矩阵M,设定目标优化距离表达形式

时间:2023-07-01 理论教育 版权反馈
【摘要】:要对距离度量进行学习,要有一个便于学习的距离度量表达形式。再假定W的非对角元素是零,即坐标轴是正交的,属性之间无相关;当然现实中并不总是这样,于是将W替换为一个普通的半正定矩阵M,就得到马氏距离:其中,M为度量矩阵,度量学习就是对M进行学习。至此,已构建了学习的对象是M这个度量矩阵,接下来就是给学习设定一个目标从而求得M。

距离度量学习:构建度量矩阵M,设定目标优化距离表达形式

在机器学习中,对高维数据进行降维的主要目的是找到一个合适的低维空间,在该空间中能以比原始空间性能更好的方式进行学习。每个空间对应了在样本属性上定义的一个距离度量,而寻找合适的空间,本质上就是寻找一个合适的距离度量。度量学习的基本动机就是去学习一个合适的距离度量。

降维的核心在于寻找合适空间,而合适空间的定义就是距离度量,所以学习合适的距离度量就是度量学习的目的。要对距离度量进行学习,要有一个便于学习的距离度量表达形式。

对两个d维样本xi和xj,它们之间的平方欧式距离可写为

其中,img为xi与xj在第k维上的距离。

若假定不同属性的重要性不同,则可引入属性权重w,得到

其中,wi≥0,i=1,2,…d,W=diag(w)为一个对角矩阵,(W)ii=wi,W可通过学习确定。(www.daowen.com)

再假定W的非对角元素是零,即坐标轴是正交的,属性之间无相关;当然现实中并不总是这样,于是将W替换为一个普通的半正定矩阵M,就得到马氏距离(Mahalanobis distance):

其中,M为度量矩阵,度量学习就是对M进行学习。为保持距离非负且对称,M须是半正定对称矩阵,即必有正交基P使得M能写为M=PPT

至此,已构建了学习的对象是M这个度量矩阵,接下来就是给学习设定一个目标从而求得M。假定希望提高近邻分类器的性能,则可将M直接嵌入近邻分类器的评价指标中去,通过优化该性能指标相应地求得M。

一些研究人员通过使用学习度量来建立源域与目标域之间关系以解决迁移学习问题[20-21,71-73]:如通过使用从源域中预先习得的现有距离度量算法以习得一个适用于目标域的新的距离度量[72];基于信息论度量学习方法提出直接学习不同域之间的距离度量方法;在文献[20]的基础上加入非线性[21]进行扩展从而很容易地扩展以解决异构空间的知识迁移问题;Qi等[71]提出学习有效地发掘两个类别训练数据之间的共有信息的度量,这些度量进而通过其生成的跨类别集合结合在一起以习得目标分类器。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈