1. 决策树
根据一些 feature 进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,再投入新数据的时候,就可以根据这棵树上的问题,将数据划分到合适的叶子上。
2. 随机森林
在源数据中随机选取数据,组成几个子集;
S 矩阵是源数据,有 1-N 条数据,A B C 是feature,最后一列C是类别;
由 S 随机生成 M 个子矩阵。
3. 马尔可夫
Markov Chains 由 state 和 transitions 组成;
例如,根据这一句话 ‘the quick brown fox jumps over the lazy dog’,要得到 markov chain;
步骤,先给每一个单词设定成一个状态,然后计算状态间转换的概率;
这是一句话计算出来的概率,当你用大量文本去做统计的时候,会得到更大的状态转移矩阵,例如 the 后面可以连接的单词,及相应的概率;
生活中,键盘输入法的备选结果也是一样的原理,模型会更高级