数据挖掘流程 - DMX库

1、分类：找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类，其目的是通过分类模型，将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等。

2、回归分析：反映的是事务数据库中属性值在时间上的特征，产生一个将数据项映射到一个实值预测变量的函数，发现变量或属性间的依赖关系，其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。

3、聚类分析：把一组数据按照相似性和差异性分为几个类别，其目的是使得属于同一类别的数据间的相似性尽可能大，不同类别中的数据间的相似性尽可能的小。

4、关联规则：描述数据库中数据项之间所存在的关系的规则，即根据一个事务中某些项的出现可到处另一些项在同一事物中也出现，即隐藏在数据间的关联或相互关系。

5、特征分析：从数据库中的一组数据中提取出关于这些数据的特征式，这些特征式表达了该数据集的总体特征。

6、变化和偏差分析：偏差包括很大一类潜在有趣的知识，如分类中的反常实例，模式的例外，观察结果对期望的偏差等，其目的是寻找观察结果与参照量之间有意义的差别。

7、Web页挖掘：随着Internet的迅速发展及Web的全球普及，使得Web上的信息量无比丰富，通过对Web的挖掘，可以利用Web的海量数据进行分析，收集有关的信息。

大家还看了

也许喜欢

更多栏目