【摘要】:部分域适应假设目标域的类别集合是源域类别集合的子集,源域和目标域共享的类别称之为共享类别,仅源域存在而目标域没有的类别称之为外部类别。图5.1为部分域适应的设定。因此,部分域适应的难点在于如何避免由源域中的外部类别导致的负迁移问题。下面将介绍部分域适应的经典方法。
部分域适应假设目标域的类别集合是源域类别集合的子集,源域和目标域共享的类别称之为共享类别,仅源域存在而目标域没有的类别称之为外部类别。由于源域和目标域具有不同的类别集合,源域和目标域的边缘概率分布本质上是不同的。因此,采用常规的域适应方法来减少域偏移会引起属于外部类别的源域样本与目标域样本的错误对齐,导致目标域的性能下降,即负迁移现象[2]。图5.1为部分域适应的设定。从图5.1中可以看出,电视机是源域特有的物体类别(外部类别)。直接对齐源域和目标域的边缘概率分布会使得属于电视机这一类别的源域样本与属于椅子和杯子等共享类别的目标域样本对齐,导致电视机的类别特性迁移到不含有电视机的目标域,使得目标域的分类性能下降。因此,部分域适应的难点在于如何避免由源域中的外部类别导致的负迁移问题。
针对负迁移这一难点,大多数部分域适应方法采取的解决方案有:一是将源域中属于外部类别的样本挑选出来或者降低这类样本在迁移过程中的权重,减少外部类别导致的负迁移;二是减少源域和目标域属于共享类别的样本之间的特征分布差异,提高属于共享类别的跨域样本间的正迁移。
在部分域适应问题中,给定有标注的源域和无标注的目标域Dt=,目的是通过减少源域和目标域的域偏移,使得源域分类器能够适应于目标域任务,其中,是源域样本的类别标签,目标域类别空间Yt是源域类别空间Ys的子集,即Yt⊂Ys,ns和nt分别表示源域和目标域的样本数量。为了方便表述,下文中将采用xi表示源域样本或者目标域样本。下面将介绍部分域适应的经典方法。(www.daowen.com)
图5.1 部分域适应的设定[3]
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关迁移学习基础及应用的文章