0%

Sklearn是python用于数据挖掘以及机器学习的利器,但是其功能庞杂,初学者很难理清脉络,快速学习其应用精髓。而CRISP-DM(跨行业数据挖掘标准流程)是一套受业界普遍认可、使用范围广的数据挖掘最佳实践方法论,有助于帮助理解Sklearn在数据挖掘/机器学习各个环节的功能实现。

Sklearn是利用python进行机器学习常用的第三方库,这个库对一些常用的机器学习方法进行了封装,这样在进行机器学习时只需调用Sklearn里的模块就可以完成大多数机器学习任务。

决策树算法在机器学习中算是很经典的一个算法系列了,被认为是监督学习方法中最好的并且是最常用的方法之一。

朴素贝叶斯的最大的特点就是特征的条件独立假设,但在现实情况下,条件独立这个假设通常过于严格,在实际中很难成立。特征之间的相关性限制了朴素贝叶斯的性能,所以本节我们介绍一种放宽了条件独立假设的贝叶斯算法,即贝叶斯网络(bayesian network)。

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。

支持向量机的思想和逻辑回归一样,都是找个超平面然后一刀切,但它之所以更为有效,是因为在超平面的基础上多引入了间隔和支持向量的概念。