当前位置: 首页 > news >正文

拉格朗日对偶法—入门版

主包又又又来补充数学知识点了,最近读论文总用到拉格朗日对偶,所以简单总结下一些基础知识点。

目录

一、拉格朗日对偶法解决的问题

二、拉格朗日函数

2.1 基本思想

2.2 拉格朗日函数的定义

2.3 简单例子

三、原始问题的等价形式

3.1 最大最小表示

四、对偶问题

4.1 交换最大最小的顺序

4.2 对偶函数

4.3 弱对偶性

五、强对偶性

5.1 什么是强对偶?

5.2 什么时候强对偶成立?

六、KKT条件

6.1 最优性的必要条件

6.2 互补松弛条件的直观理解

七、完整例子

八、对偶法的优势

九、总结

一、拉格朗日对偶法解决的问题

求解一个优化问题:

原始问题(Primal Problem)

  • 最小化:f(x)(目标函数)
  • 约束条件:
    • g_i(x)\leq 0(不等式约束)
    • h_j(x)=0(等式约束)

拉格朗日对偶法是一种将 约束优化问题 转化为 无约束优化问题 的方法。通过引入拉格朗日乘数,将约束条件融入目标函数中。

二、拉格朗日函数

2.1 基本思想

拉格朗日的核心思想是:把约束条件融入到目标函数中,构造一个新的函数。

2.2 拉格朗日函数的定义

L(x, \alpha, \beta) = f(x) + \sum_{i=1}^{m} \alpha_i g_i(x) + \sum_{j=1}^{p} \beta_j h_j(x)

其中:

  • x:原始变量
  • a_i\geq 0:不等式约束的拉格朗日乘子(也叫对偶变量)
  • \beta _j​:等式约束的拉格朗日乘子(可正可负)

2.3 简单例子

假设我们要最小化 f(x) = x^2,约束条件是 x \geq 1(即 g(x) = 1 - x \leq 0

拉格朗日函数为:L(x, \alpha) = x^2 + \alpha(1 - x)

三、原始问题的等价形式

3.1 最大最小表示

原始问题可以等价地写成:\min_x \max_{\alpha \geq 0, \beta} L(x, \alpha, \beta)

为什么等价?

1. 当 x 满足约束时

  • g_i(x) \leq 0,所以 \max_{\alpha \geq 0} \alpha_i g_i(x) = 0(在 \alpha_i = 0 时取得)
  • h_j(x) = 0,所以 \beta_j h_j(x) = 0
  • 因此 \max_{\alpha, \beta} L(x, \alpha, \beta) = f(x)

2. 当 x 不满足约束时

  • 如果某个 g_i(x) > 0,则 \max_{\alpha_i \geq 0} \alpha_i g_i(x) = +\infty
  • 如果某个 h_j(x) \neq 0,则 \max_{\beta} \beta_j h_j(x) = +\infty
  • 因此 \max_{\alpha, \beta} L(x, \alpha, \beta) = +\infty

所以,这个最大最小问题自动"惩罚"了不满足约束的 x。

四、对偶问题

4.1 交换最大最小的顺序

如果我们交换最大和最小的顺序,得到:

\max_{\alpha \geq 0, \beta} \min_x L(x, \alpha, \beta)

这就是对偶问题(Dual Problem)

4.2 对偶函数

定义对偶函数: g(\alpha, \beta) = \min_x L(x, \alpha, \beta)

对偶问题就是: \max_{\alpha \geq 0, \beta} g(\alpha, \beta)

4.3 弱对偶性

重要性质:对偶问题的最优值 d* 总是 ≤ 原始问题的最优值 p*

d^* \leq p^*

这个差距称为对偶间隙(Duality Gap)

为什么? 因为对于任意的 x,α,β: \min_x L(x, \alpha, \beta) \leq L(x, \alpha, \beta) \leq \max_{\alpha, \beta} L(x, \alpha, \beta)

值得一提的是,g(\alpha, \beta)总是凹函数,无论原问题是否是凸优化问题,所以可以使用凸优化问题经典解决算法搞定 ~

五、强对偶性

5.1 什么是强对偶?

d^* = p^* 时,我们说强对偶性成立,即对偶间隙为0。

5.2 什么时候强对偶成立?

Slater条件(一个常用的充分条件):

  • 原始问题是凸优化问题(f 和 g_i​ 是凸函数,h_j​ 是仿射函数)
  • 存在严格可行点(即存在 xx,使得所有不等式约束严格成立:g_i(x) < 0

六、KKT条件

6.1 最优性的必要条件

当强对偶性成立时,x∗,α∗,β∗ 是最优解的充要条件是满足KKT条件:

  • 原始可行性

g_i(x^*) \leq 0

h_j(x^*) = 0

  • 对偶可行性

\alpha_i^* \geq 0

  • 互补松弛条件

\alpha_i^* g_i(x^*) = 0(非常重要!)

  • 梯度条件

\nabla_x L(x^*, \alpha^*, \beta^*) = 0

6.2 互补松弛条件的直观理解

互补松弛条件\alpha_i^* g_i(x^*) = 0 意味着:

  • 要么 \alpha_i^* = 0(约束不起作用,在最优点附近稍微违反此约束不会影响最优值)
  • 要么 g_i(x^*) = 0(约束紧致,最优解恰好在约束边界上)

KKT条件的几何意义是:在最优点处,目标函数的负梯度方向可以表示为起作用约束梯度的非负线性组合,这意味着无法在可行域内找到使目标函数进一步减小的方向。

七、完整例子

让我们用一个具体例子把所有内容串起来:

问题:最小化f(x) = x_1^2 + x_2^2​,约束 x_1 + x_2 \geq 2

步骤1:改写约束为标准形式

g(x) = 2 - x_1 - x_2 \leq 0

步骤2:写出拉格朗日函数

L(x_1, x_2, \alpha) = x_1^2 + x_2^2 + \alpha(2 - x_1 - x_2)

步骤3:求对偶函数(对 x 最小化)

\frac{\partial L}{\partial x_1} = 2x_1 - \alpha = 0 \Rightarrow x_1 = \frac{\alpha}{2}

\frac{\partial L}{\partial x_2} = 2x_2 - \alpha = 0 \Rightarrow x_2 = \frac{\alpha}{2}

代入得:

g(\alpha) = \frac{\alpha^2}{4} + \frac{\alpha^2}{4} + \alpha(2 - \frac{\alpha}{2} - \frac{\alpha}{2}) = 2\alpha - \frac{\alpha^2}{2}

步骤4:求对偶问题最优解

\max_{\alpha \geq 0}(2\alpha - \frac{\alpha^2}{2})

\frac{dg}{d\alpha} = 2 - \alpha = 0 \Rightarrow \alpha^* = 2

步骤5:求原始最优解:

x_1^* = x_2^* = \frac{\alpha^*}{2} = 1

验证

x_1^* + x_2^* = 2

约束紧致:

f(x^*) = 2

八、对偶法的优势

  • 降维:有时对偶问题的变量更少,更容易求解
  • 理论分析:提供了最优值的下界
  • 算法设计:许多算法基于对偶问题(如SVM)
  • 灵敏度分析:对偶变量反映了约束的"价值"

九、总结

拉格朗日对偶法的核心流程:

原始问题 → 拉格朗日函数 → 对偶函数 → 对偶问题↓检查强对偶性(凸性+Slater条件)↓KKT条件求解

http://www.dtcms.com/a/515741.html

相关文章:

  • Docker连接超时的解决方法
  • 显示网站建设精美页面天津外贸公司网站制作
  • JDK 8 到 JDK 24 主要特性对比
  • 数据结构初阶:包装类
  • 4.5数组排序算法
  • 【科普】Edge出问题后如何恢复出厂设置
  • 盲盒一番赏小程序系统开发:重构潮玩消费的沉浸式革命
  • Win10/11 Edge 浏览器收藏夹位置
  • 国外客户的网站电话备案注销网站还有吗
  • 贝叶斯统计结合机器学习在术后院内感染危险因素分析中的应用
  • Spring IOC与DI核心解析
  • 百度网站优化 件阿里云可以做网站
  • [人工智能-大模型-45]:模型层技术 - 大模型的种类、比较、发展趋势
  • Electron 实战|Vue 桌面端开发从入门到上线
  • 【北京迅为】iTOP-4412精英版使用手册-第五十二章 注册字符类设备
  • 计算机组成原理实验
  • ChatGPT 技术解析与应用:从原理到实践的全景视角
  • 2026版基于python的协同过滤音乐推荐系统
  • 塔防游戏Python开发核心状态与算法实现:植物大战僵尸类游戏技术解析
  • python+vue共享自习室预约系统设计(源码+文档+调试+基础修改+答疑)
  • 漳州网站建设到博大赞wordpress文章不显示自定义字段
  • 新企业如何在国税网站上做套餐wordpress 安装 乱码
  • 函数装饰器
  • 正则表达式入门到精通教程(Linux实操版)
  • 逆向开发在逆向加密狗中的作用
  • 网站模板 古典大学生app开发创业计划书
  • Linux 信号控制
  • Android Studio模拟器无法联网(能打开IP网页,但不能打开域名,DNS解析错误)问题2025年10月22日
  • php如何做局域网的网站网站设计与网页制作代码大全
  • 在没有网络的环境下安装包pymysql