预处理

  1. 预处理的一些通用方法:

    • get_params([deep]):返回模型的参数。

      • deep: 如果为True,则可以返回模型参数的子对象。
    • set_params(**params):设置模型的参数。

      • params:待设置的关键字参数。
    • fit(X[, y]) :获取预处理需要的参数(如:特征的最大值、最小值等),不同的预处理方法需要的参数不同。

      • X :训练集样本集合。通常是一个numpy array,每行代表一个样本,每列代表一个特征。
      • y :训练样本的标签集合。它与X 的每一行相对应。
    • transform(X[, copy]):执行预处理,返回处理后的样本集。

      • X :训练集样本集合。通常是一个numpy array,每行代表一个样本,每列代表一个特征。
      • copy :一个布尔值,指定是否拷贝数据。
    • fit_transform(X[, y]) :获取预处理需要的参数并执行预处理,返回处理后的样本集。

      • X :训练集样本集合。通常是一个numpy array,每行代表一个样本,每列代表一个特征。
      • y :训练样本的标签集合。它与X 的每一行相对应。
  2. 预处理的一些通用参数:

    • copy: 一个布尔值,指定是否拷贝数据。

      如果为False则执行原地修改。此时节省空间,但修改了原始数据。