三、核化线性降维 KPCA

  1. PCA方法假设从高维空间到低维空间的映射是线性的,但是在不少现实任务中可能需要非线性映射才能找到合适的低维空间来降维。

    非线性降维的一种常用方法是基于核技巧对线性降维方法进行核化kernelized, 如核主成分分析Kernelized PCA:KPCA ,它是对PCA的一种推广。

  2. 假定原始特征空间中的样本点 三、核化线性降维 KPCA - 图1 通过映射 三、核化线性降维 KPCA - 图2 映射到高维特征空间的坐标为 三、核化线性降维 KPCA - 图3,即 三、核化线性降维 KPCA - 图4。且假

    设高维特征空间为 三、核化线性降维 KPCA - 图5 维的,即: 三、核化线性降维 KPCA - 图6 。假定要将高维特征空间中的数据投影到低维空间中,投影矩阵为 三、核化线性降维 KPCA - 图7三、核化线性降维 KPCA - 图8 维矩阵。

    根据 PCA 推导的结果,求解方程:三、核化线性降维 KPCA - 图9 。其中 三、核化线性降维 KPCA - 图10三、核化线性降维 KPCA - 图11 维矩阵。

    于是有:三、核化线性降维 KPCA - 图12

  3. 通常并不清楚 三、核化线性降维 KPCA - 图13 的解析表达式,因此并不会直接得到 三、核化线性降维 KPCA - 图14 ,所以无法直接求解方程:三、核化线性降维 KPCA - 图15

    于是引入核函数:三、核化线性降维 KPCA - 图16

    • 定义核矩阵 :

      三、核化线性降维 KPCA - 图17

      则有: 三、核化线性降维 KPCA - 图18

    • 定义 三、核化线性降维 KPCA - 图19 ,则 三、核化线性降维 KPCA - 图20三、核化线性降维 KPCA - 图21 维行向量 。定义:三、核化线性降维 KPCA - 图22三、核化线性降维 KPCA - 图23 维矩阵

      则有:

    三、核化线性降维 KPCA - 图24

  4. 三、核化线性降维 KPCA - 图25 代入 三、核化线性降维 KPCA - 图26 ,有:三、核化线性降维 KPCA - 图27

    • 两边同时左乘以 三、核化线性降维 KPCA - 图28,再代入 三、核化线性降维 KPCA - 图29 有:三、核化线性降维 KPCA - 图30

    • 通常会要求核矩阵可逆,上式两边同时左乘以 三、核化线性降维 KPCA - 图31 ,则有:三、核化线性降维 KPCA - 图32

      同样该问题也是一个特征值分解问题,取 三、核化线性降维 KPCA - 图33 最大的 三、核化线性降维 KPCA - 图34 个特征值对应的特征向量组成 三、核化线性降维 KPCA - 图35 即可。

  5. 对于新样本 三、核化线性降维 KPCA - 图36, 其投影后第 三、核化线性降维 KPCA - 图37 维的坐标为:

    三、核化线性降维 KPCA - 图38

    其中 三、核化线性降维 KPCA - 图39 为行向量 三、核化线性降维 KPCA - 图40 的第 三、核化线性降维 KPCA - 图41 个分量。

    可以看到:为了获取投影后的坐标, KPCA需要对所有样本求和,因此它的计算开销较大。