五、度量学习

  1. 在机器学习中对高维数据进行降维的主要目的是:希望找出一个合适的低维空间,在这个低维空间中进行学习能比原始空间性能更好。

    每个空间对应了在样本属性上定义的一个距离度量。寻找合适的空间,本质上就是在寻找一个合适的距离度量。

  2. 度量学习metric learning的思想就是:尝试直接学习出一个合适的距离度量。

  3. 推广欧氏距离:对于两个 五、度量学习 - 图1 维样本 五、度量学习 - 图2 ,假定不同的属性的重要性不同,因此引入了权重:

    五、度量学习 - 图3

    其中 五、度量学习 - 图4 表示 五、度量学习 - 图5 在第 五、度量学习 - 图6 维上的距离, 五、度量学习 - 图7五、度量学习 - 图8 维距离的权重。

    定义对角矩阵 五、度量学习 - 图9 为:

    五、度量学习 - 图10

    五、度量学习 - 图11

    上式中的权重矩阵 五、度量学习 - 图12 可以通过学习确定。

  4. 前述假设权重矩阵 五、度量学习 - 图13 是对角矩阵,这意味着坐标轴是正交的,即属性之间无关。

    现实任务中可能会发生属性相关的情况,此时对应的坐标轴不再正交。于是可以将 五、度量学习 - 图14 替换成一个普通的半正定对称矩阵 五、度量学习 - 图15,此时就得到了马氏距离 Mahalanobis distance

    五、度量学习 - 图16

    其中的矩阵 五、度量学习 - 图17 也称作度量矩阵,度量学习就是对 五、度量学习 - 图18 进行学习。

    为了保持距离非负而且对称,则 五、度量学习 - 图19 必须是半正定对称矩阵。即必有正交基 五、度量学习 - 图20 ,使得 五、度量学习 - 图21

  5. 五、度量学习 - 图22 学习的目标是:将 五、度量学习 - 图23 嵌入到学习器的评价指标中去,通过优化学习器的评价指标来求得 五、度量学习 - 图24

    即:对 五、度量学习 - 图25 的学习无法直接提出优化目标,而是将 五、度量学习 - 图26 的学习与学习器的学习作为一个整体,然后优化学习器的优化目标。

  6. 如果学习得的 五、度量学习 - 图27 是一个低秩矩阵(假设秩为 五、度量学习 - 图28), 可以找到一组正交基,其中正交基的数量为 五、度量学习 - 图29 ,该组正交基构成矩阵 五、度量学习 - 图30

    于是度量学习的结果可以衍生出一个降维矩阵 五、度量学习 - 图31 ,能用于降维。降维后的低维空间就是该组正交基张成的空间。