Опубликован: 12.07.2010 | Уровень: специалист | Доступ: платный | ВУЗ: Алтайский государственный университет
Лекция 14:

Состояние отечественных разработок в области высокопроизводительных вычислений

< Лекция 13 || Лекция 14: 12345 || Лекция 15 >
Аннотация: Лекция посвящена обзору состояния работ в области многоядерных процессоров, выполняемых в России.
Ключевые слова: ПО, ядро, arm, MIPS, структурная схема, l2 cache, DDR SDRAM, RS-232, LVD, MSI, очередь, технические характеристики, пропускная способность шины, внутренняя схема, FCBGA, intellectual property, DSP, PLL, информация, MIMD, пиковая производительность, central processing unit, акселератор, digital signal processing, архитектура, DMA, SDRAM, SRAM, I2C, I2S, USB, Ethernet, PCI, UART, JTAG, serial, rapidio, ADI, ACSE, FFT, DCT, команда, VLIW, very, long, instruction word, инструкция, регистр, память, длина конвейера, процессор, SISD, поток, распараллеливание, SOC, CPU, кэш, запрос прерывания, немаскируемое прерывание, NMI, производительность, вектор, устройство управления памятью, TLB, translation, look, fixed, интерфейс, IEEE, Data, память программ, PRAM, RAM, IEEE 754, поддержка, порт, flash rom, ADSP-0, внешняя память, GPIO, интервальный таймер, RTT, сторожевой таймер, WDT, мощность, центральный процессор, cramming, контроллер, таймер реального времени, CDB, шина, DDB, AGU, адресный генератор, EDB, коммутатор, генератор, PDC, дешифратор, файл, ALU, PAB, доступ, обмен данными, load, store, пошаговое исполнение программы, Instruction, процессорное ядро, макрокоманда, Slave, программная совместимость, controller, local bus, specification, rev, разрядность, приоритет запроса, входной, ECL, QNX, модуль, адаптивного алгоритма, принятия решений, DVB, свертка, Графический ускоритель, цифровое телевидение, AVC, CIFS, I-MPEG, AMR, WMA, AAC, микропроцессор, A-GPS, TETRA, DRM, ATLAS, поле памяти, SPI, search engine, sip, пороговый анализ, терминал, работ, системы реального времени

Рассматривая положение и перспективы России в данной области, можно привести выдержку из доклада заместителя руководителя Федерального агентства по промышленности РФ Ю.И. Борисова на конференции "Перспективы развития высокопроизводительных архитектур. История, современность и будущее отечественного компьютеростроения" [82]:

"Страна в данный момент не имеет средств для формирования "с чистого листа" новой инфраструктуры отрасли. Разработки компьютерной техники, связанные с масштабными программами обеспечения национальной безопасности, должны при всемерной поддержке государства вестись в действующей системе проектных центров. Соответственно, необходимо выделить зоны ответственности этой системы, в которых достигнутые к настоящему времени результаты дают основания рассчитывать на дальнейший прогресс.

  1. Важнейшим направлением работ является снабжение Вооруженных сил компьютерной техникой для применения в мобильных системах управления и обработки информации, где особое значение имеют встроенные и носимые исполнения. На данный момент задача решается путем разделения труда, ориентации определенных российских проектных центров на выполнение работы, наиболее соответствующей их многолетнему опыту. Следуя этому принципу, заслуженные специалисты, традиционно связанные с обеспечением информационной безопасности, успешно совершенствуют отечественную аппаратно-программную платформу на базе микропроцессоров российского производства с топологическими нормами 350 нм. В то же время разработчики, ориентированные на высокие показатели производительности, реализуют свои проекты, используя ресурсы зарубежных компаний, производящих микропроцессоры. Это хороший пример надежного технологического партнерства, на перспективность которого указывается и в федеральной целевой программе. Нашими специалистами разра ботана серия SPARC-совместимых микропроцессоров, снабженных эффективным программным обеспечением, выпущена заводская документация и обеспечена контрактная поставка микропроцессоров с топологическими нормами 130нм. На их базе отечественная промышленность производит вычислительные комплексы высокого быстродействия, которыми оснащаются Вооруженные силы. Интенсивно ведется работа по дальнейшему увеличению производительности за счет перехода на передовые топологические нормы, созданию многоядерньх структур и систем на кристалле. Очень важно, что при вводе в эксплуатацию современных фабрик по производству микропроцессоров выполнение этих проектов будет полностью сосредоточено в нашей стране.

    Рассматриваемая область проектирования включает и создание специализированных процессоров, предназначенных для обработки интенсивных потоков данных небольшой разрядности в реальном масштабе времени. Они необходимы в ряде применений, среди которых можно выделить радиолокационные и мультимедийные задачи. Здесь налицо перспектива сотрудничества наших проектных центров для создания высокопроизводительных микропроцессорных структур, интегрирующих специализированные процессоры сигнальной обработки с универсальными процессорными ядрами

  2. Традиционно велика роль высокопроизводительных информационно-вычислительных и управляющих систем, используемых при решении сложных вычислительных задач в сфере военных и общих применений. Безусловным достижением отрасли в этом направлении является создание микропроцессора "Эльбрус" с топологическими нормами 130 нм, разработанного под руководством Б.А. Бабаяна, и двухпроцессорного вычислительного комплекса "Эльбрус-3М1" на его основе.

    При выполнении проекта создан первый высокопроизводительный универсальный микропроцессор с отечественной архитектурой и оптимизирующий компилятор, обеспечивающие автоматическое распараллеливание программ и рекордное для микропроцессоров данной категории отношение производительности к мощности. С сохранением лицензионной независимости достигнута эффективная программная совместимость с платформой Intel х86, которая позволяет выполнять произвольные коды для архитектуры Intel, включая коды операционной системы. Аппаратными и программными средствами поддерживаются защищенные вычисления и объектно-ориентированное программирование, что позволяет использовать вычислительный комплекс в масштабных проектах с участием больших коллективов разработчиков и сжатыми сроками создания надежного программного обеспечения

    Очень важно, что этот проект стал отправной точкой для восстановления отечественной школы проектирования универсальных высокопроизводительных вычислительных средств. В настоящее время поставлена и планируется работа по усовершенствованию конструктивно-технологических параметров микропроцессора "Эльбрус", созданию на его основе многоядерной системы на кристалле, разработке многопроцессорных вычислительных комплексов [83]. Интенсивно развивается программная составляющая проекта.

  3. Следует отметить явную активность в решении проблем высшей сложности, которые требуют применения суперкомпьютеров.

    Сейчас в отрасли ведутся два комплекса работ, в конечном счете ориентированных на создание отечественного суперкомпьютера стратегического назначения:

    • дальнейшее наращивание производительности микропроцессоров, вычислительных комплексов и кластерных систем в рамках отечественной школы проектирования;
    • поиск принципиально новых решений в области электронно-компонентной базы, архитектуры и программного обеспечения, позволяющих достичь предельно высокой скорости вычислений.

    Реализация первого варианта предполагается в развитии работ, связанных с созданием микропроцессоров и вычислительных систем серии "Эльбрус". Несмотря на большую сложность научно-технических проблем, определяющим фактором здесь является выделение ресурсов, достаточных для завершения перспективной ОКР.

    В рамках комплекса исследований, ведущихся по второму варианту, на данный момент получены следующие результаты:

    • систематизированы признаки суперкомпьютерных технологий, предлагаемых или используемых за рубежом для реализации предельных показателей производительности — в дальнейшем предстоит найти оптимальное сочетание этих признаков;
    • рассматривается возможное решение в виде систем с большим (порядка десятков и сотен тысяч) простых отечественных процессоров, связанных в сеть;
    • выдвигается концепция программирования архитектуры многопроцессорных вычислительных комплексов на базе ПЛИС соответственно классам решаемых задач;
    • сформулированы новые архитектурные принципы реализации не фон-неймановской модели, позволяющие обобщить требования к структуре и механизмам перспективного многоядерного процессора на кристалле".

Если рассматривать тенденции отечественных процессоров, можно сказать следующее. В основном идет уклон на асимметричные процессорные системы — как правило, это ядро процессора общего назначения (на базе ARM- или MIPS-ядер) и специализированное ядро цифрового сигнального процессора. Позиционируются такие процессоры на рынке как процессоры для мультимедийных приложений, навигационные процессоры. О тенденциях в процессорах общего назначения говорить сложно. Работы над процессорами на базе архитектуры OpenSPARC или не афишируются, или не имеют сколько-нибудь заметных результатов примерно с 2004-2005 годов.

Микропроцессор 1891ВМ3

Микросхема 1891ВМ3 [84, 85] представляет собой двухпроцессорную систему на кристалле с общим для обоих процессоров внутренним кэшем второго уровня, контроллером оперативной памяти и набором периферийных контроллеров для доступа к внутренним узлам компьютера и внешним каналам и линиям связи.

Структурная схема 1891ВМ3, представленная на рис. 14.1, содержит:

  • два универсальных процессора CPU0 и CPU1 с тактовой частотой 500 МГц;
  • общую кэш-память второго уровня L2 cache объемом 512 Кбайт;
  • системный коммутатор SCOM;
  • контроллер МС оперативной памяти DDR SDRAM;
  • контроллер MPI внешней периферийной шины PCI;
  • контроллер внешней периферийной шины SCSI для доступа к магнитным и оптическим дискам;
  • контроллер канала Ethernet 10/100;
  • контроллер канала PS/2 для связи с клавиатурой и графическим манипулятором;
  • контроллер последовательных каналов RS-232;
  • контроллер каналов удаленного доступа RDMA c выходом на LVDS links;
  • контроллер сопряжения системного и периферийного интерфейсов MSI;
  • контроллер внутренней периферийной шины EBus для доступа к ПЗУ, таймерам, системе прерываний и ГМД.
Структурная схема системы на кристалле 1891ВМ3

Рис. 14.1. Структурная схема системы на кристалле 1891ВМ3

Структура 1891ВМ3 представляет собой почти полную схему современной ЭВМ (без оперативной памяти и внешних устройств). Номенклатура контроллеров была выбрана исходя из стремления реализовать в первую очередь контроллеры с высокой пропускной способностью, контроллеры для внутренних узлов ЭВМ и ограничивалась лимитом внешних выводов микросхемы.

Основные технические характеристики системы на кристалле 1891ВМ3 сведены в ( таблица 14.1)

Таблица 14.1. Тестовая таблица
Наименование параметра Значение
Процессор Тип процессора — МЦСТ^500 Количество процессоров — 2 Тактовая частота — 500 МГц
Производительность 1000 MIPS/400 Мфлопс
Внутренняя кэш-память Кэш первого уровня: команд — 16 Кбайт1данные одного процессора данных — 32 Кбайт2данные одного процессора Кэш второго уровня — 512 Кбайт
Оперативная память Емкость до 2 Гбайт Пропускная способность канала — 2,664 Гбайт/с
Периферийная шина PCI Пропускная способность шины — 264 Мбайт/с
Канал удаленного доступа RDMA Количество каналов — 2 Тип канала — дуплексный Пропускная способность канала в одном направлении — 667 Мбайт/с
Ethernet 100 Пропускная способность канала — 100 Мбит/с
SCSI-2 Пропускная способность шины — 10 Мбайт/с
RS-232 Количество каналов — 2 Пропускная способность канала — 115 Кбит/с
Потребляемая мощность, Вт 5
Количество транзисторов,млн шт. 45
Напряжение питания, В 1,0 для внутренних схем 2,5 и 3,3 для периферии
Корпус 900 FCBGA
Технология КМОП 0,13 мкм, 8 слоев металла
Площадь кристалла, мм2 9.9
< Лекция 13 || Лекция 14: 12345 || Лекция 15 >
Сергей Горбунов
Сергей Горбунов

 

прошел курс и сдал экзамен   Многоядерные процессоры   

система сертификат не выдала. почему?

Зарина Каримова
Зарина Каримова
Казахстан, Алматы, Гимназия им. Ахмета Байтурсынова №139, 2008
Филипп Шишкин
Филипп Шишкин
Россия, Пенза, Пензенский Государственный Университет, 2015