Разделы презентаций


АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ Параллельные вычисления

Содержание

Уровни параллелизмаВ процессоре КонвейризацияСуперскалярностьУдлинение длины командДополнительные специализированные процессорыМногоядерностьМногопроцессорность (Сильносвязанный параллелизм)Кластеры (Слабосвязанный параллелизм)

Слайды и текст этой презентации

Слайд 1АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ Параллельные вычисления

АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ   Параллельные вычисления

Слайд 2Уровни параллелизма
В процессоре
Конвейризация
Суперскалярность
Удлинение длины команд
Дополнительные специализированные процессоры
Многоядерность
Многопроцессорность (Сильносвязанный параллелизм)
Кластеры

(Слабосвязанный параллелизм)

Уровни параллелизмаВ процессоре КонвейризацияСуперскалярностьУдлинение длины командДополнительные специализированные процессорыМногоядерностьМногопроцессорность (Сильносвязанный параллелизм)Кластеры (Слабосвязанный параллелизм)

Слайд 3Архитектуры параллельных компьютеров
(a) На чипе (b) Сопроцессор (c)Мультипроцессор
(d) Мультикомпьютер (e)

Грид

Архитектуры параллельных компьютеров(a) На чипе (b) Сопроцессор (c)Мультипроцессор(d) Мультикомпьютер (e) Грид

Слайд 4Параллелизм на уровне команд
(a) Конвейер (b) Посл-ть VLIW инструкций
(c) Поток

команд с отмеченными связками

Параллелизм на уровне команд(a) Конвейер (b) Посл-ть VLIW инструкций(c) Поток команд с отмеченными связками

Слайд 5TriMedia VLIW команда
Типичная команда TriMedia.

TriMedia VLIW командаТипичная команда TriMedia.

Слайд 6Функциональные блоки
Операции с константами (5)
АЛУ целочисленных операций (5)
Сдвиги (2)
Загрузка и

сохранение из памяти (2)
Умножение целых и вещественных чисел (2)
АЛУ операций

с плавающей точкой (2)
Сравнение чисел с плавающей точкой (1)
Извлечение квадратного корня (1)
Ветвления (3)
АЛУ ЦОС (2)
Умножитель для ЦОС (2)

Функциональные блокиОперации с константами (5)АЛУ целочисленных операций (5)Сдвиги (2)Загрузка и сохранение из памяти (2)Умножение целых и вещественных

Слайд 7Внутрипроцессорная многопоточность (1)
(a) – (c) Три потока. Пустые квадраты означают

простой в ожидании данных из памяти (d) Мелкомодульная многопоточность
(e)

Крупномодульная многопоточность
Внутрипроцессорная многопоточность (1)(a) – (c) Три потока. Пустые квадраты означают простой в ожидании данных из памяти (d)

Слайд 8Внутрипроцессорная многопоточность (2)
Многопоточность в сдвоенном процессоре
(a) Мелкомодульная многопоточность
(b) Крупномодульная многопоточность
(c)

Синхронная многопоточность

Внутрипроцессорная многопоточность (2)Многопоточность в сдвоенном процессоре(a) Мелкомодульная многопоточность(b) Крупномодульная многопоточность(c) Синхронная многопоточность

Слайд 9Варианты повышения производительности
Повышение тактовой частоты
Размещение на одной микросхеме двух процессоров
Введение

новых функциональных блоков
Удлинение конвейера
Использование многопоточности

Варианты повышения производительностиПовышение тактовой частотыРазмещение на одной микросхеме двух процессоровВведение новых функциональных блоковУдлинение конвейераИспользование многопоточности

Слайд 10Гомогенные однокристальные микропроцессоры
Однокристальные мультипроцессоры.
(a) Два конвейера (b) Два

ядра

Гомогенные однокристальные микропроцессорыОднокристальные мультипроцессоры. (a) Два конвейера  (b) Два ядра

Слайд 11Гетерогенные однокристальные мультипроцессоры

Гетерогенные однокристальные мультипроцессоры

Слайд 12Архитектура CoreConnect
An example of the IBM CoreConnect architecture.

Архитектура CoreConnectAn example of the IBM CoreConnect architecture.

Слайд 13Мультипроцессоры
(a) Мультипроцессор с 16 ЦПУ, разделяющих общую память
(b) Изображение, разбивается

на 16 частей, каждое обрабатывается своим ЦПУ

Мультипроцессоры(a) Мультипроцессор с 16 ЦПУ, разделяющих общую память(b) Изображение, разбивается на 16 частей, каждое обрабатывается своим ЦПУ

Слайд 14Мультикомпьютеры (1)

Мультикомпьютеры (1)

Слайд 15Мультикомпьютеры (2)

Мультикомпьютеры (2)

Слайд 16Систематика Флинна (Flynn)
Классификация по способам взаимодействия последовательностей (потоков) выполняемых

команд и обрабатываемых данных:
SISD (Single Instruction, Single Data)
SIMD (Single

Instruction, Multiple Data)
MISD (Multiple Instruction, Single Data)
MIMD (Multiple Instruction, Multiple Data)

Классификация вычислительных систем

Практически все виды параллельных систем, несмотря на их существенную разнородность, относятся к одной группе MIMD

Систематика Флинна (Flynn) Классификация по способам взаимодействия последовательностей (потоков) выполняемых команд и обрабатываемых данных:SISD (Single Instruction, Single

Слайд 17Детализация систематики Флинна…
Дальнейшее разделение типов многопроцессорных систем основывается на

используемых способах организации оперативной памяти,
Позволяет различать два важных типа многопроцессорных

систем:
multiprocessors (мультипроцессоры или системы с общей разделяемой памятью),
multicomputers (мультикомпьютеры или системы с распределенной памятью).

Классификация вычислительных систем

Детализация систематики Флинна… Дальнейшее разделение типов многопроцессорных систем основывается на используемых способах организации оперативной памяти,Позволяет различать два

Слайд 18Классификация вычислительных систем

Классификация вычислительных систем

Слайд 19Мультипроцессоры с использованием единой общей памяти (shared memory)…
Обеспечивается однородный

доступ к памяти (uniform memory access or UMA),
Являются основой

для построения:
векторных параллельных процессоров (parallel vector processor or PVP). Примеры: Cray T90,
симметричных мультипроцессоров (symmetric multiprocessor or SMP). Примеры: IBM eServer, Sun StarFire, HP Superdome, SGI Origin.

Классификация вычислительных систем

Мультипроцессоры с использованием единой общей памяти (shared memory)… Обеспечивается однородный доступ к памяти (uniform memory access or

Слайд 20Мультипроцессоры с использованием единой общей памяти…
Классификация вычислительных систем

Мультипроцессоры с использованием единой общей памяти…Классификация вычислительных систем

Слайд 21Мультипроцессоры с использованием физически распределенной памяти (distributed shared memory or

DSM):
Неоднородный доступ к памяти (non-uniform memory access or NUMA),
Среди

систем такого типа выделяют:
cache-only memory architecture or COMA (системы KSR-1 и DDM),
cache-coherent NUMA or CC-NUMA (системы SGI Origin 2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000),
non-cache coherent NUMA or NCC-NUMA (система Cray T3E).

Классификация вычислительных систем

Мультипроцессоры с использованием физически распределенной памяти (distributed shared memory or DSM):Неоднородный доступ к памяти (non-uniform memory access

Слайд 22Мультипроцессоры с использованием физически распределенной памяти…
Классификация вычислительных систем

Мультипроцессоры с использованием физически распределенной памяти…Классификация вычислительных систем

Слайд 23Мультикомпьютеры…
Не обеспечивают общий доступ ко всей имеющейся в системах памяти

(no-remote memory access or NORMA),
Каждый процессор системы может использовать только

свою локальную память

Классификация вычислительных систем

Мультикомпьютеры…Не обеспечивают общий доступ ко всей имеющейся в системах памяти (no-remote memory access or NORMA),Каждый процессор системы

Слайд 24Преимущества:
Могут быть образованы на базе уже существующих у потребителей отдельных

компьютеров, либо же сконструированы из типовых компьютерных элементов;
Повышение вычислительной

мощности отдельных процессоров позволяет строить кластеры из сравнительно небольшого количества отдельных компьютеров (lowly parallel processing),
Для параллельного выполнения в алгоритмах достаточно выделять только крупные независимые части расчетов (coarse granularity).

Кластеры

Преимущества:Могут быть образованы на базе уже существующих у потребителей отдельных компьютеров, либо же сконструированы из типовых компьютерных

Слайд 25Недостатки:
Организация взаимодействия вычислительных узлов кластера при помощи передачи сообщений обычно

приводит к значительным временным задержкам
Дополнительные ограничения на тип разрабатываемых параллельных

алгоритмов и программ (низкая интенсивность потоков передачи данных)

Кластеры

Недостатки:Организация взаимодействия вычислительных узлов кластера при помощи передачи сообщений обычно приводит к значительным временным задержкамДополнительные ограничения на

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика