【摘要】:支持并行运算,能够进一步提高算法的效率。虽然TDA关联规则算法跟Apriori算法相比,在时间以及空间上进行了很大的优化,特别是TDA并行关联规则挖掘算法,理想的情况下效率能够提升数倍。TDA算法仍未考虑到数据的关注度。
6.3.4.1 TDA算法主要具优点
(1)能够对数据库进行删减,节约存储空间。
(2)算法效率高。
(3)支持并行运算,能够进一步提高算法的效率。
虽然TDA关联规则算法跟Apriori算法相比,在时间以及空间上进行了很大的优化,特别是TDA并行关联规则挖掘算法,理想的情况下效率能够提升数倍。(www.daowen.com)
6.3.4.2 TDA算法的缺点
(1)TDA需要一次预处理,对数据库进行转化,是一个较为耗时的工作。
(2)TDA算法仍未考虑到数据的关注度。
如超市数据中同时存在{“铂金钻戒”,“高级香水”}以及{“牛奶”,“面包”},很明显规则{“铂金钻戒”,“高级香水”}的支持度明显大大的低于{“牛奶”,“面包”},由于{“铂金钻戒”,“高级香水”}给用户带来的价值明显高于{“牛奶”,“面包”},为了挖掘出{“铂金钻戒”,“高级香水”},只能将最小支持阈值降的很低,这样就会出现两个问题:一个是由于小支持阂值很低,频繁项集的数量会以级数增长,对如此大数量的项集进行剪枝与计数是非常耗时的事情;一个是由于小支持阈值很低,频繁项集的数量会以级数增长,虽然用户需要的规则挖掘出来了,但同时也出现在更多的用户不需要的规则,且用户不需要的规则远远比用户需要的规则多得多。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
有关增量式自适应大数据挖掘算法的文章