Опубликован: 22.12.2006 | Уровень: специалист | Доступ: платный
Лекция 7:

Параллельное программирование — аппарат исследования операций

< Лекция 6 || Лекция 7: 123456 || Лекция 8 >

Определение 7. Функцию

\begin{align*}
F(\tau_1,\tau_2 \dts \tau_m,t) = \sum_{j=1}^m f(\tau_j,t),
\end{align*}
где
\begin{align*}
f(\tau_j,t)=
\left\{
 \begin{array}{rcl}
 1 &\text{ при } t \in \lfloor \tau_j - t_j,\tau_j\rfloor \\
 0 &\text{ в противном случае },
 \end{array}
 \right.
\end{align*}
назовём плотностью загрузки, найденной для значений \tau _{1} , \dots  ,\tau _{m}.

Для заданных \tau _{1} , \dots  , \tau _{m} значение функции F в каждый момент времени t совпадает с числом одновременно (параллельно) выполняющихся в этот момент работ.

Например, по диаграмме на 7.11, т.е. для \tau _{1} = \tau _{11}, \tau _{2} = \tau _{12}, \dots  , \tau _{8} = \tau _{18}, функция F(2, 3, 3, 4, 7, 8, 6, 9, t) имеет вид, представленный на рис. 7.13а. Для допустимого расписания, определяемого набором значений \tau _{1} = 2,\tau _{2} = 4, \tau _{3} = 3, \tau _{4} = 4, \tau _{5} = 8, \tau _{6} = 9, \tau _{7} = 7, \tau _{8} = 10, функция F(2, 4, 3, 4, 8, 9, 7, 10, t) имеет вид, представленный на рис. 7.13б.

Графики функции: а — для ранних сроков окончания работ,,б — для некоторого допустимого расписания

Рис. 7.13. Графики функции: а — для ранних сроков окончания работ,,б — для некоторого допустимого расписания

Для графического представления функции F удобно пользоваться временной диаграммой, которая для второго случая, например, имеет вид, представленный на рисунке 7.14..

Временная диаграмма функции F

Рис. 7.14. Временная диаграмма функции F

Пусть данный граф G, в котором учтены транзитивные связи, образует l полных множеств взаимно независимых работ (ПМВНР). (Каждая пара таких множеств может иметь непустое пересечение.) Обозначим ri, i = 1 , ... , l, число работ, образующих i -е полное множество и найдём

R = max {r1 , ... , rl}.

Тогда

\begin{align*}
R = \max\limits_{\tau_1,\tau_2 \dts \tau_m}  F(\tau_1,\ldots \tau_m, t),
\end{align*}
т.к. возможно и такое распределение выполняемых работ во времени, задаваемое набором \tau _{1} , \dots  , \tau _{m}, (т.е. допустимое расписание), когда на каком-то отрезке времени выполняются все работы, составляющие ПМВНР с числом R работ.

Например, для графа на рис. 7.1 мы нашли ПМВНР {3,5,6,7}, включающее четыре работы. Тогда существует допустимое расписание, например, \tau _{1} = 2, \tau _{2} = 3, \tau _{3} = 5, \tau _{4} = 4, \tau _{5} = 8, \tau _{6} = 8, \tau _{7} = 6, \tau _{8} = 9 такое, при котором максимальное значение плотности загрузки F равно четырём (рис. 7.15).

Максимальное значение плотности загрузки

Рис. 7.15. Максимальное значение плотности загрузки

Таким образом, справедливо утверждение

Лемма. Минимальное число n процессоров одинаковой специализации и производительности (т.е. в однородной ВС), способных выполнить данный алгоритм за время T >= Tкр, не превышает R = max {r1 , ... , rl }, где ri , i = 1 , ... , l, — число работ, входящих в i -е ПМВНР, которое составлено по взвешенному графу G, соответствующему этому алгоритму.

Определение 8. Функцию

\begin{align*}
\text{Ф} (\tau_1 \dts \tau_m, \theta_1, \theta_2)= \int_{\theta_1}^{\theta_2}
F(\tau_1 \dts \tau_m,t)dt
\end{align*}
назовём загрузкой отрезка [\theta _{1}, \theta _{2}] \subset  [0,T] для заданного допустимого расписания \tau _{1}, \dots  ,\tau _{m}.

Функция Ф определяет объём работ (суммарное время их выполнения) на фиксированном отрезке их выполнения при заданном допустимом расписании.

Так, для отрезка времени [0, 4] \subset  [0, 10] на рис. 7.13а Ф = 10 ; для отрезка времени [1, 3] на ррис. 7.13б Ф= 4 ; для отрезка времени [2, 5] на рис. 7.15 Ф = 10 и т.д.

Определение 9. Функцию

\begin{align*}
\varphi^{(T)} (\theta_1, \theta_2)= \min_{\tau_1 \dts \tau_m}\text{Ф}
(\tau_1 \dts \tau_m, \theta_1, \theta_2) \notag
\end{align*}
назовём минимальной загрузкой отрезка [\theta _{1}, \theta _{2}] \subset  [0,T].

Функция определяет минимально возможный объём работ, который при данном T и при различных допустимых значениях (расписаниях) \tau _{1} , \dots  , \tau _{m} должен быть выполнен на отрезке времени [\theta _{1}, \theta _{2}]\subset  [0, T]. Это означает, что как бы мы не планировали вычислительный процесс, который должен быть закончен к моменту времени T, т.е. какой бы набор значений \tau _{1} , \dots  , \tau _{m} мы не выбрали, объём работ, выполняемых на отрезке времени [\theta _{1}, \theta _{2}], не может быть меньше значения \varphi ^{(T)} = (\theta _{1},\theta _{2}).

Теорема 1. Для того чтобы T было наименьшим временем выполнения данного алгоритма однородной вычислительной системой, состоящей из n процессоров, либо чтобы n процессоров было достаточно для выполнения данного алгоритма за время T, необходимо, чтобы для данного отрезка времени [\theta _{1}, \theta _{2}] \subset  [0, T] выполнялось соотношение

\begin{align*}
  \varphi^{(T)}(\theta_1, \theta_2) \le n ( \theta_2 - \theta_1) \notag
\end{align*} ( 7.1)

Доказательство. Нетрудно видеть, что если при данном наборе \tau _{1} , \dots  , \tau _{m} — сроках окончания выполнения работ, в том числе и при таком наборе, при котором обеспечивается минимальное или заданное T = max \{ \tau _{1}, \dots  , \tau _{m}\}, для реализации алгоритма достаточно n процессоров, то

\begin{align*}
\max_{t\in[0,T]}F(\tau_1 \dts \tau_m\,t)\le n.
\end{align*}

Отсюда, для любого отрезка времени [\theta _{1}, \theta _{2}] \subset  [0,T]

\begin{align*}
\varphi^{(T)}(\theta_1, \theta_2)\le \text{Ф} (\tau_1 \dts \tau_m,
\theta_1, \theta_2)
\int_{\theta_1}^{\theta_2}
F(\tau_1 \dts \tau_m,t)dt \le n ( \theta_2 - \theta_1)
\end{align*}
что и требовалось доказать.

Необходимость, но не достаточность условия (7.1) покажем на примере. Пусть алгоритму соответствует граф G на рис. 7.16а. Пусть T=3, и одна из возможных диаграмм выполнения алгоритма — на рис. 7.16б.

Пример: минимальная плотность загрузки не соответствует действительной: а — информационный граф, б — временная диаграмма загрузки

Рис. 7.16. Пример: минимальная плотность загрузки не соответствует действительной: а — информационный граф, б — временная диаграмма загрузки

Оценим на основе (7.1) число n процессоров, достаточное для выполнения алгоритма в указанное время. Из (7.1) имеем общее соотношение

\begin{align*}
n\ge \frac{\varphi^{(T)}(\theta_1, \theta_2)}{\theta_2 - \theta_1} \notag
\end{align*} ( 7.2)

Для получения полной оценки надо перебрать все отрезки [\theta _{1},\theta _{2}] \subset  [0, T] т.е.

\begin{align*}
n\ge \max_{[\theta_1, \theta_2] \subset [0,
T]}\frac{\varphi^{(T)}(\theta_1, \theta_2)}{\theta_2 - \theta_1} \notag
\end{align*} ( 7.3)

Проанализируем все возможные отрезки [\theta _{1}, \theta _{2}] \subset  [0,3]  : \varphi ^{(3)}(0, 1) =  \varphi ^{(3)}(1, 2)  \varphi ^{(3)}(2, 3) = 0,  \varphi ^{(3)}(0, 2) =  \varphi ^{(3)}(1, 3)= 3,  \varphi ^{(3)}(0, 3) = 6. Находим минимальное n = 2, удовлетворяющие (7.3). Однако из рисунка видно, что не существует плана выполнения работ на двух процессорах за время T=3. Минимально достаточное число процессоров здесь n = 3.

Функция \varphi ^{(T)}(\theta _{1}, \theta _{2}) минимальной загрузки отрезка времени является одним из основных средств оценки предпринимаемых действий при решении задач распараллеливания. Поэтому ниже будет дан алгоритм нахождения её значения.

Предварительно определим функцию

\begin{align*}
\xi (x) =
\left\{
 \begin{array}{rcl}
 x &\text { при } x\ge 0 \\
 0 &\text { при } x< 0.
 \end{array}
 \right.
\end{align*}

Тогда значение \xi (\tau _{1j} - \theta _{1}) характеризует условный объём части работы j на отрезке времени [\theta _{1}, \theta _{2}] при условии \tau _{1j} - t_{j} \le  \theta _{1} и при максимальном смещении времени выполнения работы j влево (рис. 7.17а).

Значение \xi  (\theta _{2} - \tau _{2j}(T) + t_{j}) характеризует аналогичный объём работы j при максимальном смещении времени выполнения работы j вправо. Это соответствует, например, ситуации, изображённой на рис. 7.17б.

Нахождение минимальной плотности загрузки отрезка: все различные случаи соотношения времени выполнения работ и сроков

Рис. 7.17. Нахождение минимальной плотности загрузки отрезка: все различные случаи соотношения времени выполнения работ и сроков

Если для работы j оба указанных выше значения функции \xi отличны от нуля, но не превышают значение tj и \theta _{2} - \theta _{1}, то максимально разгрузить отрезок [\theta _{1}, \theta _{2}] от работы j можно смещением времени его выполнения в сторону, обеспечивающую меньшее из двух указанных выше значений \xi (рис. 7.17в).

Существуют два случая, когда работа j не может быть хотя бы частично смещена с отрезка [\theta _{1}, \theta _{2}]:

а) \theta _{1} \le  \tau _{1j} - t_{j}  < \tau _{2j} (T) \le \theta _{2}, в этом случае очевидно, что t_{j} \le   \theta _{2} - \theta _{1} (рис. 7.17г), и объём работы j, выполняемой на отрезке, совпадает с объёмом tj всей этой работы;

б) \tau _{1j} \ge   \theta _{2} \Lambda  \tau _{2j}(T) - t_{j} \le  \theta _{1}, в этом случае очевидно, что t_{j} \ge   \theta _{2} - \theta _{1} (рис. 7.17д), и объём части работы j, выполняемой на отрезке [\theta _{1}, \theta _{2}] совпадает со значением \theta _{2} - \theta _{1}.

Приведённый ниже алгоритм объединяет все возможные указанные выше случаи.

Алгоритм 4 нахождения значения функции \varphi ^{(T)}(\theta _{1}, \theta _{2}).

1. Предполагаем, что для каждой работы j = 1, ... , m, известны значения t_{j},\tau _{1j}, \tau _{2j}(T). Полагаем равным нулю значение переменной \phi.

2. Организуем последовательный анализ работ j = 1, ... , m.

3. Для каждой работы j полагаем

\varphi  := \varphi  + min \{ \xi  (\tau _{1j}  - \theta _{1}), \xi (\theta _{2} -\tau _{2j}(T) + t_{j}), t_{j} , \theta _{2} - \theta _{1}\}.

После перебора всех работ \varphi  = \varphi ^{(T)}(\theta _{1},\theta _{2}).

Конец алгоритма.

Выше было получено соотношение (7.2) , которое можно использовать для нижней оценки количества n процессоров, необходимых для выполнения данного алгоритма за время, не превышающее T.

Приведём аналогичное соотношение для нижней оценки минимального времени Т.

Теорема 2. Пусть заданный алгоритм выполняется на ВС, состоящей из n процессоров, и T* — текущее значение оценки снизу времени выполнения алгоритма. Пусть на отрезке времени [\theta _{1}, \theta _{2}] \subset  [0, T^{*}] выполняется соотношение

\varphi ^{(T*)}(\theta _{1},\theta _{2}) - n(\theta _{2} - \theta _{1}) = d > 0.

Тогда минимальное время T выполнения алгоритма удовлетворяет соотношению

\begin{align*}
 T \ge T^* + \frac{d}{n}.
\end{align*} ( 7.4)

Теоремы 1 и 2 на основе анализа такой локальной характеристики параллельного алгоритма, как значение функции \phi минимальной загрузки отрезка, предлагают способы оценки снизу ресурсов, необходимых для реализации каждого заданного алгоритма:

  • числа n процессоров при заданном ограничении на длительность T процесса;
  • минимального времени T, необходимого для реализации данного алгоритма при заданном числе n процессоров.

К примеру нахождения нижней оценки числа исполнителей

Рис. 7.18. К примеру нахождения нижней оценки числа исполнителей

< Лекция 6 || Лекция 7: 123456 || Лекция 8 >
Mardon Madrahimov
Mardon Madrahimov
Узбекистан, nukus, qmu, 2013
Mardon Madraximov
Mardon Madraximov
Узбекистан, ellikqala