0%

Boosting(分步法)是指个体学习器之间存在强依赖关系,必须串行序列化生成的集成学习方法。

每个算法有不同的适用范围,例如有处理线性可分问题的,有处理线性不可分问题。在现实世界的生活中,常常会因为'集体智慧'使得问题被很容易解决,那么问题来了,在机器学习问题中,对于一个复杂的任务来说,能否将很多的机器学习算法组合在一起,这样计算出来的结果会不会比使用单一的算法性能更好?这样的思路就是集成学习方法。

sklearn有好多模型可供使用,现在对常用的基础模型进行梳理。

指定一个程序的输出为另一个程序的输入,即将一个程序的标准输出与另一个程序的标准输入相连,这种机制就称为管道。管道机制在sklearn中对应的模块是sklearn.pipeline。

特征工程在机器学习中具有重要意义,但是通过手动创造特征是一个缓慢且艰巨的过程。Python的特征工程库featuretools可以帮助我们简化这一过程。Featuretools是执行自动化特征工程的框架,有两类特征构造的操作:聚合(aggregation)和 转换(transform)。

很多数据问题中都会出现时间戳形式的特征,对其不同的处理操作有时会影响整个问题的建模效果,而本文我们就对其展开介绍所有可能的时间戳特征构建技巧。