预处理
预处理的一些通用方法:
get_params([deep])
:返回模型的参数。deep
: 如果为True
,则可以返回模型参数的子对象。
set_params(**params)
:设置模型的参数。params
:待设置的关键字参数。
fit(X[, y])
:获取预处理需要的参数(如:特征的最大值、最小值等),不同的预处理方法需要的参数不同。X
:训练集样本集合。通常是一个numpy array
,每行代表一个样本,每列代表一个特征。y
:训练样本的标签集合。它与X
的每一行相对应。
transform(X[, copy])
:执行预处理,返回处理后的样本集。X
:训练集样本集合。通常是一个numpy array
,每行代表一个样本,每列代表一个特征。copy
:一个布尔值,指定是否拷贝数据。
fit_transform(X[, y])
:获取预处理需要的参数并执行预处理,返回处理后的样本集。X
:训练集样本集合。通常是一个numpy array
,每行代表一个样本,每列代表一个特征。y
:训练样本的标签集合。它与X
的每一行相对应。
预处理的一些通用参数:
copy
: 一个布尔值,指定是否拷贝数据。如果为
False
则执行原地修改。此时节省空间,但修改了原始数据。