练习
本章中,我们学习了一些机器学习中最为重要的概念。下一章,我们会更加深入,并写一些代码。开始下章之前,确保你能回答下面的问题:
- 如何定义机器学习?
- 机器学习可以解决的四类问题?
- 什么是带标签的训练集?
- 最常见的两个监督任务是什么?
- 指出四个常见的非监督任务?
- 要让一个机器人能在各种未知地形行走,你会采用什么机器学习算法?
- 要对你的顾客进行分组,你会采用哪类算法?
- 垃圾邮件检测是监督学习问题,还是非监督学习问题?
- 什么是在线学习系统?
- 什么是核外学习?
- 什么学习算法是用相似度做预测?
- 模型参数和学习算法的超参数的区别是什么?
- 基于模型学习的算法搜寻的是什么?最成功的策略是什么?基于模型学习如何做预测?
- 机器学习的四个主要挑战是什么?
- 如果模型在训练集上表现好,但推广到新实例表现差,问题是什么?给出三个可能的解决方案。
- 什么是测试集,为什么要使用它?
- 验证集的目的是什么?
- 如果用测试集调节超参数,会发生什么?
- 什么是交叉验证,为什么它比验证集好?
练习答案见附录 A。