6.2. 玩具数据集
scikit-learn 内置有一些小型标准数据集,不需要从某个外部网站下载任何文件。
调用 | 描述 |
---|---|
load_boston ([return_X_y]) | Load and return the boston house-prices dataset (regression). |
load_iris ([return_X_y]) | Load and return the iris dataset (classification). |
load_diabetes ([return_X_y]) | Load and return the diabetes dataset (regression). |
load_digits ([n_class, return_X_y]) | Load and return the digits dataset (classification). |
load_linnerud ([return_X_y]) | Load and return the linnerud dataset (multivariate regression). |
load_wine ([return_X_y]) | Load and return the wine dataset (classification). |
load_breast_cancer ([return_X_y]) | Load and return the breast cancer wisconsin dataset (classification). |
这些数据集有助于快速说明在 scikit 中实现的各种算法的行为。然而,它们数据规模往往太小,无法代表真实世界的机器学习任务。
译者注:各个玩具数据集的具体描述此处不翻译,若需查询请点击链接查看英文描述