理论教育 GPU和CPU性能测试平台验证性能可移植性

GPU和CPU性能测试平台验证性能可移植性

时间:2023-06-23 理论教育 版权反馈
【摘要】:本书选取AMD HD7970和NVIDIA GTX680两个不同架构的GPU作为性能测试平台,选取IntelXeonX5550 Quad Core CPU作为CPU计算平台。选取两个不同计算平台的目的是验证性能可移植性。表7-2 GPU计算平台性能参数Viola-Jones人脸检测算法的CPU版本来自OpenCV2.4,该版本已深度优化,在CPU平台上具有较高的性能。在实际测试中,我们选择了50张图像,共包含427个人脸,来评估我们实现的人脸检测算法GPU版本的正确性和性能。图7-10列举了其中3幅不同大小、不同背景、不同人脸数目的图片。

GPU和CPU性能测试平台验证性能可移植性

本书选取AMD HD7970和NVIDIA GTX680两个不同架构的GPU作为性能测试平台,选取Intel(R)Xeon(R)X5550 Quad Core CPU(2.66GHz 8MB L3 cache)作为CPU计算平台。选取两个不同计算平台的目的是验证性能可移植性。两个GPU计算平台的主要性能参数如表7-2所示。

7-2 GPU计算平台性能参数

978-7-111-56928-2-Chapter07-37.jpg

Viola-Jones人脸检测算法的CPU版本来自OpenCV2.4,该版本已深度优化,在CPU平台上具有较高的性能。因此,选择该版本,可提高性能对比的可信性。值得注意的是CPU版本在编译时,添加“-o3”选项,以充分利用CPU的计算资源,提高CPU串行版本的性能。检测图片来源于CMU人脸检测项目所用的数据库[21],该数据库是CMU人脸检测项目的专用数据库,提供了用于大量评估算法准确性的人脸正面图片,非常具有代表性。(www.daowen.com)

在实际测试中,我们选择了50张图像,共包含427个人脸,来评估我们实现的人脸检测算法GPU版本的正确性和性能。图7-10列举了其中3幅不同大小、不同背景、不同人脸数目的图片。其中图片1的大小为256×337,包含人脸数目为1;图片2大小为696×510,包含人脸数目为12;图片3大小为1280×1024,包含人脸数目为56。

978-7-111-56928-2-Chapter07-38.jpg

图7-10 检测图像

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈