1.常用数据集
为验证神经网络对抗迁移方法的有效性,通常在数字分类和图像分类任务上进行实验。对于数字分类,常用数字图像数据集有MNIST[53]、MNIST-M[40]、USPS[54]和SVHN[55]。对于图像分类,常用图像数据集有Office-31[35]、Office-Home[56]和ImageCLEF-DA[36]。
1)数字图像数据集
MNIST数据集是由LeCun等人在1998提出的手写体数字图像集合。该数据集源自NIST数据集,包含数字0~9的10个类别,共有60 000张训练图像和10 000张测试图像。图像为灰度图,大小为28×28像素。
MNIST-M数据集是由MNIST数据集与BSD500数据集[57]随机色块混合而成,即用不均匀彩色块填充MNIST数据集中数字图像的背景区域。
USPS数据集是由Hull在1984年提出的手写数字图像集合,共包括数字0~9的10个类别。训练集有7 291张图像,测试集有2 007张图像。图像为灰度图,大小为16×16像素。
SVHN数据集是从谷歌街景图像的门牌号中获得的真实数字图像集合,共包括73 257张训练图像和26 032张测试图像,涵盖了0~9的10个类别。图像为RGB彩色图,大小为32×32像素。图4.19为上述4个数字数据集的示例图像。
图4.19 4个数字数据集的示例图像[40]
2)图像数据集
图像数据集Office-31和ImageCIEF-DA已在4.3.3小节中介绍,不再赘述。(www.daowen.com)
Office-Home数据集是一个物品识别数据集。该数据集是一个非常具有挑战性的、用于验证域适应方法的数据集,它包含来自办公室和家庭场景中65类日常物品的15 500张图像。这些图像来自4个不同的域:Artistic域(Ar)、Clipart域(Cl)、Product域(Pr)和Real-World域(Rw)。
2.实验结果
在数字分类和图像分类任务上对4.4.2小节所述的四种对抗域适应方法进行验证。数字分类的具体任务有:①MNIST→MNIST-M:MNIST数据集为源域,MNIST-M数据集为目标域;②SVHN→MNIST:SVHN数据集为源域,MNIST数据集为目标域;③MNIST→USPS:MNIST数据集为源域,USPS数据集为目标域;④USPS→MNIST:USPS数据集为源域,MNIST数据集为目标域。
对抗域适应方法在数字分类任务上的性能如表4.9所示。“源域模型”指的是不进行域适应的方法,直接将源域上训练的模型用于目标域。从表4.9中可以看出,在4个迁移任务上,反向传播域适应、对抗判别域适应、生成对抗域适应这三种方法均取得了比源域模型好的性能,验证了对抗学习在域适应任务上的有效性。此外,对抗判别域适应分别学习源域特征提取器和目标域特征提取器,使得特征提取器能够学到更多域特定的信息,因此相比于反向传播域适应方法,能够取得更好的结果。生成对抗域适应进一步提升了对抗域适应在数字分类任务上的性能,尤其是域偏移更大的SVHN→MNIST迁移任务上,该方法将源域模型的性能从60.30%提升到了92.40%,获得了32.10%的提升,进一步验证了生成对抗学习有利于提高模型的迁移性能。
表4.9 对抗域适应方法在数字分类任务上的性能[40,44] 单位:%
对于图像分类任务,表4.10、表4.11和表4.12分别展示了源域模型(即无域适应方法)和对抗域适应方法在Office-31数据集、Office-Home数据集和ImageCLEF-DA数据集上的结果。所有方法都以ResNet50作为基础模型。从结果中可以看出,所有对抗域适应方法在所有数据集上的性能均明显优于源域模型。从Office-31数据集上结果可以看到,对抗判别域适应在A→W任务上表现低于反向传播域适应,其原因在于该迁移任务的域偏移较大,源域和目标域的域特定信息较多,所以当源域和目标域特征提取器独立的情况下,对抗判别域适应不容易学到域不变的特征表示。域对称对抗域适应方法在3个数据集上均取得了最优的结果,尤其是在具有挑战性的Office-Home数据集上,相比于源域模型,取得了21.5%的平均准确率提升,进一步表明对齐类别和特征联合分布对减少域偏移的重要性。
表4.10 对抗域适应方法在Office-31数据集上的性能[44,51] 单位:%
表4.11 对抗域适应方法在Office-Home数据集上的性能[51] 单位:%
表4.12 对抗域适应方法在ImageCLEF-DA数据集上的性能[51] 单位:%
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。