知识发现是从数据集中抽取和精化新的模式。知识发现的数据来源范围非常广泛,可以是经济、工业、农业、军事、社会、商业、科学的数据或卫星观测得到的数据。数据的形态有数字、符号、图形、图像、声音等。其结果可以表示成各种形式,包括规则、法则、科学规律、方程或概念网等。
“知识”是人们日常生活及社会活动中常用的一个术语,涉及信息与数据。数据是事物、概念或指令的一种形式化的表示形式,以适合于用人工或自然方式进行通信、解释或处理。信息是数据所表达的客观事实。数据是信息的载体,与具体的介质和编码方法有关。信息经过加工和改造形成知识。知识是人类在实践的基础上产生又经过实践检验的对客观实际可靠的反映。一般可分为陈述性知识、过程性知识和控制性知识。
KDD(Knowledge Discovery in Database)——基于数据库的知识发现技术的研究非常活跃。KDD一词是在1989年于美国底特律市召开的KDD专题讨论会上正式提出的。1996年,Fayyad、Piatetsky-Shapiro和Smyth对KDD和数据挖掘的关系进行了研究和阐述。他们指出,KDD是识别出存在于数据库中有效、新颖、具有潜在效用、最终可理解的模式的非平凡过程,而数据挖掘则是该过程中的一个特定步骤。但是,随着该领域研究的发展,研究者们目前趋向于认为KDD和数据挖掘具有相同的含义,即认为数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识。(www.daowen.com)
知识发现(KDD)与数据挖掘DM(Data Mining)是人工智能、机器学习与数据库技术相结合的产物。
知识发现的范围非常广泛,可以是从数据库中、文本中、Web信息中、空间数据中、图像和视频数据中提取知识。数据的结构也可以是多样的,如层次的、网状的、关系的和面向对象的数据。可应用于金融、医疗保健、市场业、零售业、制造业、司法、工程与科学及经纪业和安全交易、计算机硬件和软件、政府和防卫、电信、公司经营管理等众多领域。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。