三、EM算法与高斯混合模型

3.1 高斯混合模型

  1. 高斯混合模型(Gaussian mixture model,GMM):指的是具有下列形式的概率分布模型:

    三、EM算法与高斯混合模型 - 图1

    其中 三、EM算法与高斯混合模型 - 图2 是系数,满足 :

    • 三、EM算法与高斯混合模型 - 图3
    • 三、EM算法与高斯混合模型 - 图4 是高斯分布密度函数,称作第 三、EM算法与高斯混合模型 - 图5 个分模型, 三、EM算法与高斯混合模型 - 图6

    三、EM算法与高斯混合模型 - 图7

  2. 如果用其他的概率分布密度函数代替上式中的高斯分布密度函数,则称为一般混合模型。

3.2 参数估计

  1. 假设观察数据 三、EM算法与高斯混合模型 - 图8 由高斯混合模型 三、EM算法与高斯混合模型 - 图9 生成,其中 三、EM算法与高斯混合模型 - 图10

    可以通过EM算法估计高斯混合模型的参数 三、EM算法与高斯混合模型 - 图11

  2. 可以设想观察数据 三、EM算法与高斯混合模型 - 图12 是这样产生的:

    • 首先以概率 三、EM算法与高斯混合模型 - 图13 选择第 三、EM算法与高斯混合模型 - 图14 个分模型 三、EM算法与高斯混合模型 - 图15
    • 然后以第 三、EM算法与高斯混合模型 - 图16 个分模型的概率分布 三、EM算法与高斯混合模型 - 图17 生成观察数据 三、EM算法与高斯混合模型 - 图18

    这样,观察数据 三、EM算法与高斯混合模型 - 图19 是已知的,观测数据 三、EM算法与高斯混合模型 - 图20 来自哪个分模型是未知的。

    对观察变量 三、EM算法与高斯混合模型 - 图21 ,定义隐变量 三、EM算法与高斯混合模型 - 图22 ,其中 三、EM算法与高斯混合模型 - 图23

  3. 完全数据的对数似然函数为:

    三、EM算法与高斯混合模型 - 图24

    其对数为:

    三、EM算法与高斯混合模型 - 图25

    后验概率为:

    三、EM算法与高斯混合模型 - 图26

    即:三、EM算法与高斯混合模型 - 图27

    三、EM算法与高斯混合模型 - 图28 函数为:

    三、EM算法与高斯混合模型 - 图29

    求极大值:三、EM算法与高斯混合模型 - 图30

    根据偏导数为 0,以及 三、EM算法与高斯混合模型 - 图31 得到:

    • 三、EM算法与高斯混合模型 - 图32

      三、EM算法与高斯混合模型 - 图33

      其中: 三、EM算法与高斯混合模型 - 图34 ,其物理意义为:所有的观测数据 三、EM算法与高斯混合模型 - 图35 中,产生自第 三、EM算法与高斯混合模型 - 图36 个分模型的观测数据的数量。

    • 三、EM算法与高斯混合模型 - 图37

      三、EM算法与高斯混合模型 - 图38

      其中:三、EM算法与高斯混合模型 - 图39 ,其物理意义为:所有的观测数据 三、EM算法与高斯混合模型 - 图40 中,产生自第 三、EM算法与高斯混合模型 - 图41 个分模型的观测数据的总和。

    • 三、EM算法与高斯混合模型 - 图42

      三、EM算法与高斯混合模型 - 图43

      其中:三、EM算法与高斯混合模型 - 图44 ,其物理意义为:所有的观测数据 三、EM算法与高斯混合模型 - 图45 中,产生自第 三、EM算法与高斯混合模型 - 图46 个分模型的观测数据,偏离第 三、EM算法与高斯混合模型 - 图47 个模型的均值(三、EM算法与高斯混合模型 - 图48 )的平方和。

  4. 高斯混合模型参数估计的EM算法:

    • 输入:

      • 观察数据 三、EM算法与高斯混合模型 - 图49
      • 高斯混合模型的分量数 三、EM算法与高斯混合模型 - 图50
    • 输出:高斯混合模型参数 三、EM算法与高斯混合模型 - 图51

    • 算法步骤:

      • 随机初始化参数 三、EM算法与高斯混合模型 - 图52

      • 根据 三、EM算法与高斯混合模型 - 图53 迭代求解 三、EM算法与高斯混合模型 - 图54 ,停止条件为:对数似然函数值或者参数估计值收敛。

        三、EM算法与高斯混合模型 - 图55

        其中:

        • 三、EM算法与高斯混合模型 - 图56

          其物理意义为:所有的观测数据 三、EM算法与高斯混合模型 - 图57 中,产生自第 三、EM算法与高斯混合模型 - 图58 个分模型的观测数据的数量。

        • 三、EM算法与高斯混合模型 - 图59

          其物理意义为:所有的观测数据 三、EM算法与高斯混合模型 - 图60 中,产生自第 三、EM算法与高斯混合模型 - 图61 个分模型的观测数据的总和。

        • 三、EM算法与高斯混合模型 - 图62

          其物理意义为:所有的观测数据 三、EM算法与高斯混合模型 - 图63 中,产生自第 三、EM算法与高斯混合模型 - 图64 个分模型的观测数据,偏离第 三、EM算法与高斯混合模型 - 图65 个模型的均值(三、EM算法与高斯混合模型 - 图66 )的平方和。