Опубликован: 15.09.2004 | Доступ: свободный | Студентов: 3953 / 1492 | Оценка: 4.31 / 4.05 | Длительность: 09:26:00
ISBN: 978-5-9556-0018-5
Специальности: Разработчик аппаратуры

Лекция 16: Кластеры и массивно-параллельные системы различных производителей. Современные суперкомпьютеры: Hitachi SR8000, Серия Fujitsu VPP5000, Cray T3E-1200, ASCI White

< Лекция 15 || Лекция 16: 123

Современные суперкомпьютеры - Cray T3E-1200

Системы Cray T3E - это масштабируемые параллельные системы, которые используют DECchip 21164 (DEC Alpha EV5) RISС-процессоры с пиковой производительностью 600 Мфлоп и 21164А для машин Cray T3E-900 и Cray T3E-1200. Каждый процессорный элемент (ПЭ) Cray T3E имеет свою собственную DRAM-память объемом от 64 Мбайт до 2 Гбайт. В отличие от системы CRAY T3D, в которой исполняемая задача запрашивает фиксированное количество процессоров на все время выполнения, в CRAY T3E свободные процессоры могут использоваться другими задачами. Модели T3E, T3E-900, T3E-1200, Т3Е-1350.

Cray T3E

Рис. 16.3. Cray T3E

Каждый узел в системе содержит один процессорный элемент (ПЭ), включающий процессор, память и средство коммутации, которое осуществляет связь между ПЭ. Система конфигурируется до 2048 процессоров. Пиковая производительность составляет 2,4 Тфлоп. Разделяемая, высокопроизводительная, глобально адресуемая подсистема памяти делает возможным обращение к локальной памяти каждого ПЭ в Cray T3E. Процессорные элементы в системе Cray T3E связаны в трехмерный тор двунаправленной высокоскоростной сетью с малым временем задержки, которая в шесть раз превосходит по скорости аналогичную сеть в Cray T3D. Также добавлена адаптивная маршрутизация, при которой возможен обход участков с высокой эффективностью передачи.

Системы Cray T3E выполняют операции ввода/вывода через многочисленные порты на один или более каналов GigaRing. Каналы ввода/вывода интегрированы в трехмерную межузловую сеть и пропорциональны размеру системы. При этом при добавлении ПЭ пропускная способность каналов ввода/вывода увеличивается, и масштабируемые приложения могут выполняться на системах с большим числом процессоров так же эффективно, как на системах с меньшим числом процессоров.

Для Cray T3E была создана масштабируемая версия операционной системы ОС UNICOS - ОС UNICOS/mk. Операционная система UNICOS/mk разделена на программы-серверы, распределенные среди процессоров Cray T3E. Это позволяет управлять набором ресурсов системы как единым целым. Локальные серверы обрабатывают запросы ОС, специфичные для каждого ПЭ. Глобальные серверы обеспечивают общесистемные возможности, такие как управление процессами и файловые операции.

В добавлении к пользовательским ПЭ, которые выполняют приложения и команды, системы Cray T3E включают специальные системные ПЭ, которые выполняют глобальные серверы UNICOS/mk. Так как глобальные серверы расположены на системных ПЭ и не дублируются по всей системе, UNICOS/mk эффективно масштабируема, полнофункциональна и обслуживает от десятков до тысячи ПЭ с минимальной перегрузкой.

UNICOS/mk обеспечивает следующие программные функции:

  • распределение серверов управления файлами. Функции файлового сервера распределяются, используя локальные файловые программы-сервера, для обеспечения максимальной производительности и эффективности;
  • ПЭ может генерировать не только последовательную, но и параллельную передачу данных, используя некоторые или даже все ПЭ данной программы;
  • множество глобальных файловых серверов: система управления файлами распределена на множество системных ПЭ, которые позволяют полностью использовать параллельные дисковые каналы, поддерживаемые на Cray T3E.

Система T3E-1200

Быстродействие серии Cray T3E-1200 в два раза превышает производительность систем Cray T3E при уменьшенной вдвое стоимости за Мфлоп. Конфигурации в воздушно-жидкостном охлаждении имеют от 6 процессоров, а в жидкостном - от 32 процессоров. Каждый процессор имеет производительность в 1,2 Гфлоп; для всей системы пиковая производительность меняется от 7,2 Гфлоп до 2,5 Тфлоп. Масштабируется до тысяч процессоров. Серия выпущена в 1997 г.

Система предназначена для наиболее важных научных и технических задач в аэрокосмической, автомобильной, финансовой, химико-фармацевтической, нефтяной и т.д. отраслях промышленности, а также в широких областях прикладных исследований, включая химию, гидродинамику, предсказание погоды и сейсмические процессы.

Для поддержки масштабируемости используется операционная система UNICOS/mk -масштабируемая версия UNICOSR. Системы T3E-1200 поддерживают как явное распараллеливание распределенной памяти посредством CF90 и C/C++ с передачей сообщений (MPI, MPI-2 и PVM) и передачу данных, так и неявное распараллеливание посредством возможностей HPF и Cray CRAFT.

На системах Т3Е каждый интерфейс GigaRing имеет максимальную пропускную способность в 500 Мбайт/с.

В дополнение к высокой производительности и пропускной способности процессорных элементов и высокой масштабируемости, системы Cray T3E-1200 имеют две уникальные особенности: STREAMS и E-Регистры. STREAMS доводят до максимума пропускную способность локальной памяти, позволяя микропроцессору запускать при полной скорости для ссылки на вектороподобные данные. Е-Регистры предоставляют операции gather/scatter (соединение/вразброс) для ссылок на локальную и удаленную память и используют полную пропускную способность внутреннего соединения для удаленного чтения и записи отдельного слова.

Оценка производительности вычислительной системы производилась при решении плотной линейной системы уравнений порядка 148800 на машине Т3Е-1200 с 1200 процессорами. Была достигнута скорость в 1,127 Тфлоп/с, что составляет 63% эффективности.

Таблица 16.3. Оценка производительности
Число процессоров 6 - 128 32 - 2048
Тактовая частота процессора, МГц 600
Пиковая производительность, Тфлоп 2,4+
Размер памяти на процессор, Гбайт 0,256 - 2
Топология внутреннего соединения 3D двухнаправленный тор
Максимальная двоичная пропускная способность, Гбайт/с 122
Максимальное число каналов GIGARING 128
Пиковая пропускная способность ввода/вывода, Гбайт 128
< Лекция 15 || Лекция 16: 123