НОУ ИНТУИТ | Введение в математическое программирование. Лекция 13: Решение задач нелинейного программирования с ограничениями. Геометрическая интерпретация задач нелинейного программирования

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 09.07.2007 | Уровень: специалист | Доступ: платный | ВУЗ: Донецкий национальный технический университет

|

Вам нравится? Нравится 52 студентам

| Поделиться |

Поддержать программу

Аннотация: Данная лекция рассматривает методы решения задач нелинейного программирования при наличии различного рода ограничений, в частности, метод штрафных функций, метод SUMT Фиакко и Маккормика, метод барьерных поверхностей (метод Кэрролла); выявляются их преимущества и недостатки. Кроме того, дается геометрическая интерпретация задач нелинейного программирования.

Ключевые слова: нелинейное программирование, условная оптимизация, оптимизация, метод штрафных функций, целевая функция, допустимая область, гессиан, оптимальное решение задачи, метод SUMT Фиакко и Маккормика, sequential, метод минимизации, градиент функции, квадрат нормы вектора, метод Ньютона, метод барьерных поверхностей, ограничения в виде равенств, барьерная функция, линии уровня целевой функции, минимальное значение целевой функции

В области нелинейного программирования с ограничениями ( условная оптимизация ) методы решения задач менее разработаны по сравнению с областью нелинейного программирования без ограничений (безусловная оптимизация). Здесь встречаются большие трудности по той же причине, что искомое решение должно подчиняться дополнительным требованиям, выраженных в виде ограничений.

1. Метод штрафных функций

Имеются несколько подходов при разработке методов решения задач нелинейного программирования с ограничениями. Для учета ограничений большое распространение получил метод штрафных функций.

Основная идея метода штрафной функции состоит в преобразовании задачи минимизации функции

z=f(x)

с соответствующими ограничениями, наложенными на x, в задачу поиска минимума без ограничений функции

Z=f(x)+P(x).

Функция Р(х) является штрафной. Необходимо, чтобы при нарушении ограничений она "штрафовала" функцию Z, т.е. увеличивала ее значение. В этом случае минимум Z будет находиться внутри области ограничений. Функция Р(х), удовлетворяющая этому условию, может быть не единственной. Задачу минимизации можно сформулировать следующим образом:

$\text{минимизировать функцию } z=f(x)$

( 1.1)

$\text{при ограничениях } c_j(x) > 0, \; j=1,2,\ldots,m.$

( 1.2)

Замечание. Ограничение вида "меньше или равно", $h(х) \le 0$ , всегда может быть записано как $-h(x) \ge 0$ , поэтому в приведенной выше формулировке нет потери общности.

Функцию Р(х) удобно записать следующим образом:

$P(x) = r \sum_{j=1}^m \frac{1}{c_j(x)} .$

( 1.3)

где r - положительная величина. Тогда функция $Z = \varphi(х,r)$ принимает вид

$Z = \varphi (x, r) = f(x) + \sum_{j=1}^m \frac{1}{c_j(x)} .$

( 1.4)

Если x принимает допустимые значения, т.е. значения, для которых $c_j(х) \ge 0$ , то Z принимает значения, которые больше соответствующих значений f(х) (истинной целевой функции данной задачи), и разность можно уменьшить за счет того, что r может быть очень малой величиной. Но если x принимает значения, которые хотя и являются допустимыми, но близки к границе области ограничений, и по крайней мере одна из функций c_j(x) близка к нулю, тогда значения функции Р(х) и, следовательно, значения функции Z станут очень велики. Таким образом, влияние функции Р(х) состоит в создании "гребня с крутыми краями" вдоль каждой границы области ограничений. Следовательно, если поиск начинается из допустимой точки и осуществляется поиск минимума функции $\varphi(х,r)$ без ограничений, то минимум, конечно, будет достигаться внутри допустимой области для задачи с ограничениями. Полагая r достаточно малой величиной, для того чтобы влияние Р(х) было малым в точке минимума, мы можем сделать точку минимума функции $\varphi(х,r)$ без ограничений совпадающей с точкой минимума функции f(х) с ограничениями.

В общем случае невозможно аналитически определить положение минимума функции $\varphi (x,r)$ , рассматривая ее как обычную функцию от r. Для его определения необходимо обратиться к численным методам.

Следует отметить, что если целевая функция f(х) выпукла, а функция с_j(х) вогнута, то функция $\varphi (х, r)$ , заданная уравнением (1.4), также является выпуклой функцией в области ограничений, которая сама является выпуклой. Следовательно, $\varphi (х, r)$ имеет для данного значения r единственный минимум.

Если x₁ и x₂ - точки, принадлежащие допустимой области, т.е. $с_j(х_1) \ge 0$ и $c_j(х_2) \ge 0$ для j = 1,2,...,m, то при $0 < \Theta < 1$ справедливо неравенство

$c_j (\Theta x_2 + (1 - \Theta)x) \ge \Theta c_j (x_2) + (1 - \Theta) c_j (x_1) \ge 0 ,$

так как функция с_j(х) выпукла. Следовательно, допустимая область является выпуклой.

Таким образом, точка $х_2 + (1 - \Theta) x_1$ при $0 < \Theta < 1$ также является допустимой. Кроме того, функция 1/с_j(х) является выпуклой для всех x, которые удовлетворяют неравенству $c_j(х) \ge 0$ . Если h(х) = 1/с_j(х), то

$\nabla h (x) = \frac{-\nabla c_j (x)}{[c_j(x)]^2} .$

где $c(х)_{ik} = \partial^2 с_j(x)/\partial x_i \partial x_k$ есть гессиан функции с_j(х). Тогда, если p - произвольный вектор, то справедливо равенство

$p^T \mathbf{H} (x) p = -\frac{p^T C(x)p}{[c_j (x)]^2} + \frac{2[p^T \nabla c_j (x)]^2}{[c_j (x)]^3} ,$

где всегда р^TН(х)р > 0, так как С(х) - отрицательно определенная матрица ввиду того, что с_j(х) - выпуклая функция и $c_j(х) \ge 0$ . Тогда матрица Н(х) положительно определена и 1/с_j(х) выпукла во вcей области. Eсли r > 0, то функция Р(х), заданная уравнением (1.3), и функция $\varphi (х, r)$ , заданная уравнением (1.4), также выпуклы.

Предположим, что $x^*_1, х^*_2, \ldots , х^*_k$ - минимальные точки функции $\varphi (х, r)$ для убывающей последовательности значений r₁, r₂, ..., r_k, ..., стремящейся к нулю. Тогда последовательность точек $x^*_1, х^*_2, \ldots , х^*_k$ , сходится к оптимальному решению задачи с ограничениями (см. уравнения (1.1) и (1.2)) при $r_k \rightarrow 0$ . Следовательно,

$\lim x_k^* = x^*$

( 1.5)

и

$\lim_{r_k \rightarrow 0} [\min \varphi (x, r_k)] = f(x^*)$

( 1.6)

Полученный результат можно доказать следующим образом. Поскольку f(х) непрерывная функция и $f(х^*) \le f(х)$ для всех допустимых точек, то, задав произвольное достаточно малое значение $\varepsilon$ , можно найти допустимую точку х', такую, что

$f(x') < f(x^*) + \varepsilon / 2 .$

( 1.7)

Поскольку r_k - убывающая последовательность, стремящаяся к нулю, можно найти такое значение K, что для $k \ge K$ справедливо неравенство

$r_k \leqslant \left\{ \frac{\varepsilon}{2m} \min_j \left[ \frac{1}{c_j (x')} \right] \right\}.$

( 1.8)

Поскольку P(x) > 0 из определения функции $\varphi(x, r)$ , имеем

$f(x^*) \leqslant \min \varphi (x, r_k) = \varphi (x_k^*, r_k) .$

( 1.9)

где

- минимальная точка функции $\varphi(х, r_k)$ для задачи без ограничений. Кроме того, если k > К, то r_k < r_K и справедливо неравенство

$\varphi(x_k^*, r_k) \leqslant \varphi(x_K^*, r_k).$

( 1.10)

Это следует из того, что, поскольку х^*_k минимизирует функцию $\varphi(х, r_k)$ в любой другой точке области x, в частности в точке х^*_k , функция будет принимать значение, большее чем $\varphi(х_k^*, r_k)$ . Поэтому

$\begin{aligned} \varphi(x_K^*, r_K) & = f(x_K^*) + r_K \sum_{j=1}^m \frac{1}{c_j(x_K^*)} > \\ & > f(x_K^*) + r_k \sum_{j=1}^m \frac{c_j}{x_K^*} , \end{aligned}$

поскольку r_k<r_K.

Следовательно,

$\varphi(x_K^*,r_K) > \varphi(x_K^*,r_k)$

Тогда

$f(x^*) \leqslant \varphi(x_k^*,r_k) \leqslant \varphi(x_K^*,r_k) < \varphi(x_K^*,r_K).$

( 1.11)

Но так как значение x^*_K минимизирует функцию $\varphi(x, r_K)$ , то

$\varphi(x_K^*,r_K) \leqslant \varphi(x',r_K) = f(x') + r_K \sum_{j=1}^m \frac{1}{c_j(x')} .$

( 1.12)

Следовательно, из уравнений (1.11) и (1.12) получим

$f(x^*) \leqslant \varphi (x_k^*,r_k) \leqslant f(x') +r_K \sum_{j=1}^m \frac{1}{c_j(x')}$

( 1.13)

Из уравнения (1.8) следует, что

$f(x') + r_K \sum_{j=1}^m \frac{1}{c_j(x')} \leqslant f(x') + \frac{\varepsilon}{2} .$

( 1.14)

Тогда из уравнения (1.7) следует, что

$f(x^*) \leqslant \varphi (x_k^*, r_k) < f(x^*) + \frac{\varepsilon}{2} + \frac{\varepsilon}{2} .$

и

$\varphi (x_k^*, t_k) - f(x^*) < \varepsilon .$

( 1.15)

Поскольку $\varepsilon$ может быть выбрано произвольно малым, всегда можно найти такое значение k, при котором

$f(x^*) < \varphi (x_k^*,r_k) < f(x^*) + \varepsilon$

Таким образом, при $k \rightarrow \infty \; (r_k \rightarrow 0)$

$\lim_{r_k \rightarrow 0} \varphi(x_k^*,r_k)=f(x^*).$

( 1.16)

Из приведенного выше доказательства следует, что при $r_k \rightarrow 0$

$f(x_k^*) \rightarrow f(x^*) \quad \text{и} \quad r_k \sum_{j=1}^m \frac{1}{c_j(x_k^*)} \rightarrow 0.$

( 1.17)

В качестве упражнения оставлено доказательство того, что $f(х^*_1), f(х^*_2), \ldots, f(x^*_3)$ образуют убывающую последовательность, такую, что

$f(x_{k+1}^*) < f(x_k^*).$

( 1.18)

Очевидно, что если функция f(х) выпукла, а функция c_j(х) при j = 1,...,n вогнута, то функция f(х) при наличии ограничении имеет единственный минимум.

Дальше >>

Введение в математическое программирование

Введение в математическое программирование

Лекция 13: Решение задач нелинейного программирования с ограничениями. Геометрическая интерпретация задач нелинейного программирования

1. Метод штрафных функций

Вопросы и ответы

Студенты

Авторизоваться

Введение в математическое программирование

Введение в математическое программирование

Лекция 13: Решение задач нелинейного программирования с ограничениями. Геометрическая интерпретация задач нелинейного программирования

1. Метод штрафных функций

Вопросы и ответы

Студенты