建设手机网

专业资料
工艺工法
水利水电

水利水电专业知识:水利工程管理数据挖掘的实施步骤

2016-06-14 11:34    来源于网络

(1)信息收集。信息收集要在对项目目标和需求的充分理解的基础上进行。也就是先根据数据分析的目标和需求,确定所需要的特征信息,选择合适的信息收集方法,然后再将收集到的信息存人数据库。

(2)数据集成。数据集成既为数据共享,对不同来源、不同格式、不同性质特点的数据进行逻辑上或物理上整理。

(3)数据规约。数据规约是为提高数据挖掘效率而对数据源所进行的预处理。如果不对数据源进行规约,那么即使在少量数据上执行多个数据挖掘算法,也需要很长的时间。而在大量数据上执行多个数据挖掘算法时。几乎就无效率可言。采用数据规约可以得到数据源的规约表示。数据源规约表示与数据源相比,容量虽然小了得多,数据的完整性却保持接近。正因如此,数据规约后数据挖掘的结果几乎相同,但数据挖掘的效率却有了较大提高。

(4)数据整理。数据库中有一些数据的属性值不完整、表示方式不一致。因此,需要对数据进行再加工,用科学方法,填补丢失的数据。处理噪音数据。使数据完整、一致。

(5)数据变换。利用数学、统计学手段,将参与分析的数据,转换成为适合数据挖掘的数据形式。

(6)数据挖掘。选择合适的数据分析工具,应用规则推理、统计方法、决策树、事例推理、模糊集、遗传算法、神经网络等方法,对数据仓库中的数据信息进行处理,得出数据处理成果。

(7)模式评估。为了取得更为有效的知识,请专家数据挖掘结果。在评估的基础上反复提取,进而取得更有效的知识。

(8)成果表示。以专业的方式保存、传递、输出、共享数据挖掘成果。

分享到:

相关资讯

返回顶部