非线性规划【复习笔记】

发布时间 2023-07-28 16:11:30作者: SxtoxA

一、基本概念

(一)、非线性规划数学模型

非线性规划数学模型的一般形式是:

\( \begin{cases} minf(\bold X) \\ \quad h_i(\bold X)=0(i=1,2,\dots,m) \\ \quad g_j(\bold X)\geq 0(j=1,2,\dots,l) \end{cases} \)

其中,\(X=(x_1,x_2,\dots,x_n)^T\)\(n\)维欧氏空间\(E_n\)中的点。

(二)定义

\(f(\bold X)\)为定义在\(n\)维欧氏空间\(E_n\)的某一区域\(R\)上的\(n\)元实函数。

1.局部极小点与严格局部极小点

对于\(\bold X^*\in R\),如果存在某个\(\epsilon>0\),使所有与\(\bold X^*\)的距离小于\(\epsilon\)\(\bold X \in R\)都有\(f(\bold X)\geq f(\bold X^*)\),则称\(X^*\)\(f(\bold X)\)\(R\)上的局部极小点。

取不等号则为严格局部极小点。

2.全局极小值与严格全局极小值

若存在\(\bold X^* \in R\),对所有\(X\in R\)都有\(f(\bold X)\geq f(\bold X^*)\),则称\(X^*\)\(f(\bold X)\)\(R\)上的全局极小点。

取不等号则为严格全局极小值。

(三)多元函数极值点存在的条件

1.必要条件

定理1 \(f(\bold X)\)\(R\)上有连续一阶偏导数,且在点\(\bold X^* \in R\)去的局部极值,则必有:

\[\nabla f(\bold X^*)=(\frac{\partial f(\bold x^*)}{\partial x_1},\frac{\partial f(\bold x^*)}{\partial x_2},\dots,\frac{\partial f(\bold x^*)}{\partial x_n})^T=0 \]

梯度\(\nabla f(\bold X)\)的两个重要性质:

(1)\(f(\bold X)\)在某点的梯度必与函数过该点的等值面(等值线)正交
(2)梯度向量的方向是函数值增加最快的方向。

2.二次项

对于\(\bold X=(x_1,x_2,\dots,x_n)^T\)的二次型\(f(\bold X)=X^TAX\)

(1)判断实二次型正定的充要条件:各阶主子式都大于\(0\)

(2)多元函数的泰勒公式

\[f(X^{(0)}+P)=f(X^{(0)})+\nabla f(X^{(0)})^TP+\frac{1}{2}P^T\nabla^2 f(X^{(0)}+\theta P) \]

(3)极小点的充分条件

定理2 若\(\nabla f(\bold X^*)=0\),且\(\nabla^2 f(\bold X^*)\)正定,则该点为严格局部极小点。

黑塞矩阵\(\nabla^2 f(\bold X^*)\)=image

此处黑塞矩阵正定->负定,严格局部极小点->严格局部极大点。

(四)凸函数和凹函数

1.定义

凸函数:

\(f(X)\)为定义在\(n\)维欧氏空间\(E_n\)中某个凸集\(R_c\)上的函数,若对任何实数\(\alpha(0< \alpha <1)\)以及\(R_c\)中的任意两点\(X^{(1)}\)\(X^{(2)}\),恒有

\[f(\alpha X^{(1)}+(1-\alpha) X^{(2)}) \leq \alpha f(X^{(1)})+(1-\alpha)f(X^{(2)}) \]

则称\(f(X)\)\(R_c\)上的凸函数。

取不等号为严格凸函数。

2.凸函数性质(省略)

性质1 有限个凸函数的非负线性组合\(\beta_1f_1(X)+\beta_2f_2(X)+\dots+\beta_mf_m(X)\)仍为凸函数
性质2 设f(X)为定义在凸集\(R_c\)上的凸函数,则集合\(S_{\beta}=\{X|X \in R_c,f(X)\leq \beta\}\)是凸集

3.凸函数判定

(1)一阶条件

严格凸函数充要条件:

\[f(X^{(2)})\geq f(X^{(1)})+\nabla f(X^{(1)})^T(X^{(2)}-X^{(1)}) \]

(2)二阶条件

\(R_c\)\(E_n\)上的开凸集,\(f(X)\)\(R_c\)上二阶可微,则凸函数的充要条件是:对所有\(X \in R\),其黑塞矩阵半正定

4.凸函数的极值

定义在凸集上的凸函数,其任一极小值就等于其最小值。他的极小点形成一个凸集。

在这种情况下,\(\nabla f(X)=0\)不仅是极值点存在的必要条件,更是充分条件(充要)。

(五)凸规划

对于一非线性规划式,若\(f(X)\)为凸函数,\(g_j(X)\)均为凹函数(\(-g_j(X)\)为凸函数),则称这种规划为凸规划。

1.凸规划的性质

(1)可行解集为凸集
(2)最优解集为凸集(假设存在)
(3)任何局部最优解也是其全局最优解
(4)若目标函数为严格凸函数,且最优解存在,则最优解唯一。

(六)下降迭代算法

1.定义

对于极小化问题,我们要求由选取的解序列\({X^{(k)}}\)其对应的目标函数值是逐步见效的,即满足:

\[f(X^{(0)})>f(X^{(1)})>\dots>f(X^{(k)})>\dots \]

2.下降迭代算法的一般迭代格式

(1)选取某一初始点\(X^{(0)}\),令\(k:=0\)
(2)确定搜索方向,从\(X^{(k)}\)出发确定搜索方向\(P^{(k)}\),并检查是否是可行点(约束极值问题)
(3)确定步长,找到

\[X=X^{(k)}+\lambda P^{(k)},\lambda\geq 0 \]

满足

\[f(X^{(k+1)})=f(X^{(k)}+\lambda_k P^{(k)})<f(X^{(k)}) \]

其中\(\lambda_k\)为步长因子。
(4)检验新得到的点是否为要求的极小点或近似极小点,否则令\(k:=k+1\)

3.一维搜索的性质

若迭代算法是求以\(\lambda\)为变量的一元函数的极小点\(\lambda_k\),则称这一过程为(最优)一维搜索/线搜索。

一维搜索在搜索方向上的最优点处满足:该点梯度与该搜索方向正交,即

\[\nabla f(X^{(k+1)})^T P^{(k)}=0 \]

二、一维搜索