ByteCat

每个算法有不同的适用范围，例如有处理线性可分问题的，有处理线性不可分问题。在现实世界的生活中，常常会因为'集体智慧'使得问题被很容易解决，那么问题来了，在机器学习问题中，对于一个复杂的任务来说，能否将很多的机器学习算法组合在一起，这样计算出来的结果会不会比使用单一的算法性能更好？这样的思路就是集成学习方法。

Sklearn中的基础模型

发表于 2019-06-15 更新于 2021-11-23

sklearn有好多模型可供使用，现在对常用的基础模型进行梳理。

特征存储的几种方法

发表于 2019-06-15 更新于 2022-03-30

介绍特征持久化存储的几种方法。

在管道中用sklearn-pandas实现变换映射

发表于 2019-06-15 更新于 2022-03-30

sklearn_pandas库可以通过其自创的DataFrameMapper类简洁高效地实现大部分特征变换。

用管道机制处理数据

发表于 2019-06-15 更新于 2022-03-30

指定一个程序的输出为另一个程序的输入，即将一个程序的标准输出与另一个程序的标准输入相连，这种机制就称为管道。管道机制在sklearn中对应的模块是sklearn.pipeline。