六、 约束优化

  1. 在有的最优化问题中,希望输入 六、 约束优化 - 图1 位于特定的集合 六、 约束优化 - 图2 中,这称作约束优化问题。

    集合六、 约束优化 - 图3 内的点 六、 约束优化 - 图4 称作可行解。集合 六、 约束优化 - 图5 也称作可行域。

  2. 约束优化的一个简单方法是:对梯度下降法进行修改,每次迭代后,将得到的新的 六、 约束优化 - 图6 映射到集合 六、 约束优化 - 图7 中。

    如果使用线性搜索:则每次只搜索那些使得新的 六、 约束优化 - 图8 位于集合 六、 约束优化 - 图9 中的那些 六、 约束优化 - 图10

    • 另一个做法:将线性搜索得到的新的 六、 约束优化 - 图11 映射到集合 六、 约束优化 - 图12 中。
    • 或者:在线性搜索之前,将梯度投影到可行域的切空间内。
  3. 在约束最优化问题中,常常利用拉格朗日对偶性将原始问题转换为对偶问题,通过求解对偶问题而得到原始问题的解。

  4. 约束最优化问题的原始问题:假设 六、 约束优化 - 图13 是定义在 六、 约束优化 - 图14 上的连续可微函数。考虑约束最优化问题:

    六、 约束优化 - 图15

    可行域由等式和不等式确定:六、 约束优化 - 图16

6.1 原始问题

  1. 引入拉格朗日函数:

    六、 约束优化 - 图17

    这里 六、 约束优化 - 图18 是拉格朗日乘子, 六、 约束优化 - 图19

    六、 约束优化 - 图20六、 约束优化 - 图21 的多元非线性函数。

  2. 定义函数:

    六、 约束优化 - 图22

    其中下标 六、 约束优化 - 图23 表示原始问题。则有:

    六、 约束优化 - 图24

    • 六、 约束优化 - 图25 满足原问题的约束,则很容易证明 六、 约束优化 - 图26 ,等号在 六、 约束优化 - 图27 时取到。

    • 六、 约束优化 - 图28 不满足原问题的约束:

      • 若不满足 六、 约束优化 - 图29 :设违反的为 六、 约束优化 - 图30,则令 六、 约束优化 - 图31,有:六、 约束优化 - 图32
      • 若不满足 六、 约束优化 - 图33 : 设违反的为 六、 约束优化 - 图34,则令 六、 约束优化 - 图35,有:六、 约束优化 - 图36
  3. 考虑极小化问题:

    六、 约束优化 - 图37

    则该问题是与原始最优化问题是等价的,即他们有相同的问题。

    • 六、 约束优化 - 图38 称为广义拉格朗日函数的极大极小问题。
    • 为了方便讨论,定义原始问题的最优值为:六、 约束优化 - 图39

6.2 对偶问题

  1. 定义 六、 约束优化 - 图40,考虑极大化 六、 约束优化 - 图41,即:

    六、 约束优化 - 图42

    问题 六、 约束优化 - 图43 称为广义拉格朗日函数的极大极小问题。它可以表示为约束最优化问题:

    六、 约束优化 - 图44

    称为原始问题的对偶问题。

    为了方便讨论,定义对偶问题的最优值为:六、 约束优化 - 图45

  2. 定理一:若原问题和对偶问题具有最优值,则:

    六、 约束优化 - 图46

    • 推论一:设 六、 约束优化 - 图47 为原始问题的可行解,且 六、 约束优化 - 图48 的值为 六、 约束优化 - 图49六、 约束优化 - 图50 为对偶问题的可行解, 六、 约束优化 - 图51 值为 六、 约束优化 - 图52

      如果有 六、 约束优化 - 图53,则 六、 约束优化 - 图54 分别为原始问题和对偶问题的最优解。

  3. 定理二:假设函数 六、 约束优化 - 图55六、 约束优化 - 图56 为凸函数, 六、 约束优化 - 图57 是仿射函数;并且假设不等式约束 六、 约束优化 - 图58 是严格可行的,即存在六、 约束优化 - 图59 ,对于所有 六、 约束优化 - 图60六、 约束优化 - 图61。则存在 六、 约束优化 - 图62 ,使得: 六、 约束优化 - 图63 是原始问题 六、 约束优化 - 图64 的解,六、 约束优化 - 图65 是对偶问题 六、 约束优化 - 图66 的解,并且 六、 约束优化 - 图67

  4. 定理三:假设函数 六、 约束优化 - 图68六、 约束优化 - 图69 为凸函数, 六、 约束优化 - 图70 是仿射函数;并且假设不等式约束 六、 约束优化 - 图71 是严格可行的,即存在六、 约束优化 - 图72 ,对于所有 六、 约束优化 - 图73六、 约束优化 - 图74。则存在 六、 约束优化 - 图75 ,使得 六、 约束优化 - 图76 是原始问题 六、 约束优化 - 图77 的解,六、 约束优化 - 图78 是对偶问题 六、 约束优化 - 图79 的解的充要条件是:六、 约束优化 - 图80 满足下面的 Karush-kuhn-Tucker(KKT) 条件:

    六、 约束优化 - 图81

  5. 仿射函数:仿射函数即由1阶多项式构成的函数。

    一般形式为 六、 约束优化 - 图82。这里:六、 约束优化 - 图83 是一个 六、 约束优化 - 图84 矩阵,六、 约束优化 - 图85 是一个 六、 约束优化 - 图86 维列向量,六、 约束优化 - 图87 是一个 六、 约束优化 - 图88 维列向量。

    它实际上反映了一种从 六、 约束优化 - 图89 维到 六、 约束优化 - 图90 维的空间线性映射关系。

  6. 凸函数:设 六、 约束优化 - 图91 为定义在区间 六、 约束优化 - 图92 上的函数,若对 六、 约束优化 - 图93 上的任意两点 六、 约束优化 - 图94 和任意的实数 六、 约束优化 - 图95,总有 六、 约束优化 - 图96 ,则 六、 约束优化 - 图97 称为 六、 约束优化 - 图98 上的凸函数 。