Модуль №1. Архитектура и принципы функционирования современных ЭВМ.
Цель занятия: Сформировать представление о совре-менных высокопроизводительных вычислительных системах (суперкомпьютерах).
3
Классификация высокопроизводительных вычислитель-ных систем (по признакам наличия параллелизма в потоках команд и данных).
Классификация высокопроизводительных вычислитель-ных систем (по разделению вычислительных ресурсов).
ТОР 500 суперкомпьютеров: тенденции развития.
4
Вводная часть
SISD – (Single Instructions Single Data) –один поток инструкций, один поток данных (ОКОД)
SIMD – (Single Instructions Multiple Data) – один поток инструкций, много потоков данных (ОКМД)
MISD – (Multiple Instructions Single Data) –много потоков инструкций, один поток данных (МКОД)
1. Классификация высокопроизводительных вычислительных систем
6
SIMD архитектура подходит только для специализированных задач, характеризующихся высокой степенью регулярности, например, обработка изображения и некоторые числовые моделирования.
Каждый процессор обладает собственной лока-льной памятью. Процессоры интерпретируют адреса данных либо как локальные адреса собственной памяти, либо как глобальные адреса.
Процессоры получают команды от одного центра-льного контроллера команд и работают синхронно, то есть на каждом шаге все процессоры выпол-няют одну и ту же команду над данными из собственной локальной памяти.
Недостаток SIMD?
1. Классификация высокопроизводительных вычислительных систем
8
MISD архитектура реализована в конвейерных вычислительных машинах.
1. Классификация высокопроизводительных вычислительных систем
9
В любой момент, различные процессоры могут выполнять различные команды над различными частями данных.
Методология MIMD:
Общая задача разбивается на подзадачи.
Для каждой подзадачи составляется программа.
Программа подзадачи выполняется на отдельном процессорном элементе.
ПЭ должны обмениваться информацией о результатах выполнения подзадач.
Условие для достижения
максимального быстродействия?
1. Классификация высокопроизводительных вычислительных систем
10
NUMA-системы - системы, построенные по технологии неоднородного доступа к памяти (Non-Uniform Memory Access).
Кластерные системы.
12
2. Распараллеливание вычисле-ний обеспечивается операцион-ной системой (ОС), установлен-ной на одном из процессоров.
Вся SMP-система работает под управлением единой ОС. ОС рас-пределяет процессы по процес-орным элементам, оптимизируя использование ресурсов.
Недостаток: Зависимость производительности от
пропускной способности магистрали (системной шины).
13
2. Классификация высокопроизводительных вычислительных систем
В системах MPP адресное пространство состоит из отдельных адресных пространств, которые логически не связаны между собой. Для обмена данными используется механизм передачи сообщений между процессорами. Поэтому эти машины часто называют машинами с передачей сообщений.
2 вариант – полноценная ОС на всех процессорах.
1 вариант – на одном процес-соре полноцен-ная ОС, а на остальных -урезанная.
Развертывание программной среды:
«+» Масшта-бируемость
«-» Низкое время МП обмена.
2. Классификация высокопроизводительных вычислительных систем
15
Узел - это автономная система с отдельным экземпляром ОС и своими, принадлежащими только ему системными ресурсами: набором заведенных пользователей.
2. Классификация высокопроизводительных вычислительных систем
Кластер как параллельная система формируется на прикладном уровне, а не на уровне операционной системы.
16
3. ТОР 500 суперкомпьютеров: тенденции развития
Россия (по данным на июнь 2011 года) занимает 7 место по числу установленных систем (12 суперкомпьютеров в списке). США — 255 систем. Европа – 126. Азия — 103. Обе Америки — 265 суперкомпьютеров из списка.
Проект был запущен в 1993 году и публикует обновлённый список суперкомпьютеров дважды в год (в июне и ноябре).
Россия (по данным на ноябрь 2012 года) занимает 9 место по количеству эксплуатируемых компьютерных систем (8 суперкомпьютеров в списке) . США — 250 систем. Европа – 105. Азия — 124. Обе Америки — 264 суперкомпьютеров из списка.
Россия (по данным на ноябрь 2013 года) занимает 9 место по количеству эксплуатируемых компьютерных систем (5 суперкомпьютеров в списке). США-265 систем. Европа–102.
Азия — 116. Обе Америки — 277 суперкомпьютеров из списка.
18
Intel планирует к 2020 году создать суперкомпьютер производительностью 4 Эфлопс
БЭСМ-6 (1968) — 1 Мфлопс.
Cray-1 (1974) — 160 Мфлопс.
Эльбрус-2 (1984) — 125 Мфлопс.
Cray Y-MP (1988) — 2,3 Гфлопс.
Электроника (1991) — 500 Мфлопс.
ASCI Red (1993) — 1 Тфлопс.
Blue Gene/L (2006) — 478,2 Тфлопс.
Jaguar (2008) — 1,059 Пфлопс.
Jaguar Cray (2009) — 1,7 Пфлопс.
Тяньхэ-1А (2010) — 2,507 Пфлопс.
K computer (2011) — 8,162 Пфлопс.
IBM Sequoia (2012) — 20 Пфлопс.
Cray Titan (ноябрь 2012) – 27 Пфлопс.
Tianhe-2 (MilkyWay-2)(июнь 2013) – 33,9 Пфлопс.
Tianhe-2 (MilkyWay-2)(ноябрь 2013) – 33,9 Пфлопс.
FLOPS (также flops, flop/s, флопс или флоп/с) (акроним от англ. Floating point OPerations per Second, произносится как флопс) — внесистемная единица, используемая для измерения производительности компьютеров, показывающая, сколько операций с плавающей запятой в секунду выполняет данная вычислительная система.
19
Tinahe-2 (Национальный суперкомпьютерный центр в Гуанчжоу)
21
3. ТОР 500 суперкомпьютеров: тенденции развития
27
Быстродействие 6,27 PFLOPS в тесте Linpack.
Лидер Top500 по уровню энергоэффективности,
Швейцарская машина потребляет в среднем 2,33 МВт,
выполняя 2,7 GFLOPS на каждый израсходованный ватт.
Piz Daint - Швейцарский национальный суперкомпьютерный центр
29
Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:
Email: Нажмите что бы посмотреть