Разделы презентаций


Перспективные разработки 64- и 128-разрядных компьютеров.pptx

Содержание

Процессоры Intel

Слайды и текст этой презентации

Слайд 1Перспективные разработки 64- и 128-разрядных компьютеров

Перспективные разработки 64- и 128-разрядных компьютеров

Слайд 2Процессоры Intel

Процессоры Intel

Слайд 3Развитие процессоров Intel

Развитие процессоров Intel

Слайд 4Технологии изготовления и года запуска в производство поцессоров

Технологии изготовления и года запуска в производство поцессоров

Слайд 5Penryn
В Penryn реализована поддержка нового режима пониженного энергопотребления - C6

("глубокое понижение энергопитания"). Это режим минимального энергопотребления, когда в процессоре

отключено максимальное количество функциональных блоков.
Penryn поддерживает технологию Dynamic Acceleration. Она заключается в том, что когда одно из ядер не задействовано, оно может отключаться, в то время, как второе может работать даже на повышенной от номинала частоте до тех пор, пока тепловыделение процессора находится в рамках установленного производителем TDP.
Тактовые частоты некоторых настольных и серверных процессоров с микроархитектурой Penryn превышают 3 ГГц.

Двухъядерные Penryn оснащаются кэшем L2 объёмом до 6 Мб, четырёхъядерные - до 12 Мб.
Процессоры Penryn включают около 820 млн. транзисторов, которые размещаются на двух кристаллах площадью 107 мм2

PenrynВ Penryn реализована поддержка нового режима пониженного энергопотребления - C6 (

Слайд 6Расширение системы SIMD-команд:
В новом поколении своих CPU Intel ввёл

поддержку набора SSE4.1, состоящего из 47 новых инструкций. Тем не

менее, новые команды, несмотря на достаточно большое их количество, не представляют собой связанного множества, набор SSE4 включает разнородные дополнения к уже существующим SIMD-инструкциям. Новые команды, должны помочь в увеличении скорости работы новых процессоров с трёхмерной графикой, с потоковым видео и в целом ряде научных вычислительных задач.
На сегодняшний же день новые SIMD-команды используются лишь в двух приложениях (кодеках) для перекодирования видео: в DivX 6.7 и в TMPEG Xpress 4.4.
Вместе с внедрением дополнительных SIMD-команд инженеры Intel переработали в новых процессорах и некоторые функциональные блоки. Благодаря этому было достигнуто существенное ускорение выполнения операций деления целых и вещественных чисел, а также увеличение темпа обработки SSE-инструкций, связанных с битовой перестановкой.

За быстрое деление в Penryn отвечает блок, получивший название Fast Radix-16 Divider. В то время как применяемый в 65-нм процессорах с микроархитектурой Core блок Radix-4 мог вычислять только 2 бита частного за один проход итерационного алгоритма, новый блок способен подсчитывать уже 4 бита за такт. Благодаря этому процессоры Penryn примерно в два раза быстрее предшественников выполняют операции целочисленного и вещественночисленного деления, а также обеспечивают существенное ускорение при вычислении квадратных корней.

Расширение системы SIMD-команд: В новом поколении своих CPU Intel ввёл поддержку набора SSE4.1, состоящего из 47 новых

Слайд 7Микроархитектура Nehalem
Первоначальные процессоры Nehalem используют тот же 45-нм производственные методы,

что и Penryn.
Процессоры Nehalem содержат не менее 731 млн. транзисторов,

что на 10% меньше, чем у процессоров Yorkfield. Но площадь кристалла значительно увеличилась по сравнению с предшественником - с 214 до 263 мм².
Добавлен кэш 3-его уровня
Новая шина QPI работает на максимальной скорости 6,4 миллиона передач данных в секунду (GT/s) и имеет, соответственно, пропускную способность 12,8 Гбайт/с в каждую сторону или 25,6 Гбайт/с суммарно.

Добавлена поддержка SMТ (технология
«одновременной мультипоточности») - которая эмулирует несколько логических ядер на одном физическом для более полной загрузки вычислительных блоков. , вследствие чего процессоры с микроархитектурой Nehalem способны отправлять на выполнение до шести микроопераций одновременно

Микроархитектура NehalemПервоначальные процессоры Nehalem используют тот же 45-нм производственные методы, что и Penryn.Процессоры Nehalem содержат не менее

Слайд 8Важные усовершенствования:
Повышением продуктивности начальной части исполнительного конвейера, связанное с блоком

Loop Stream Detector. Этот блок появился впервые в процессорах с

микроархитектурой Core и предназначался для ускорения обработки циклов. Определяя в программе циклы небольшой длины, Loop Stream Detector сохранял их в специальном буфере, что давало возможность процессору обходиться без их многократной выборки из кэша и предсказания переходов внутри этих циклов. В процессорах Nehalem блок Loop Stream Detector стал ещё более эффективен благодаря его переносу за стадию декодирования инструкций. Иными словами, теперь в буфере Loop Stream Detector сохраняются циклы в декодированном виде. Он имеет очень небольшой размер, всего 28 микроопераций, и в нём сохраняются исключительно циклы.
Улучшение результативности механизма предсказания переходов было сделано переделкой блока Return Stack Buffer. На этот блок возлагается задача правильного предсказания адресов возврата из функций. Однако процессоры прошлого поколения могли неверно предсказывать адреса возвратов из функций, например, при работе рекурсивных алгоритмов и переполнении соответствующего буфера. Новый же Return Stack Buffer, реализованный в Nehalem, эту проблему успешно устранил.
Появилась поддержка нескольких новых инструкций — набора AESNI. Этот набор команд включает шесть новых команд, ускоряющих работу криптографического алгоритма AES — одного из самых распространенных алгоритмов блочного шифрования, активно используемого разнообразным программным обеспечением.

Важные усовершенствования:Повышением продуктивности начальной части исполнительного конвейера, связанное с блоком Loop Stream Detector. Этот блок появился впервые

Слайд 9Arrandale
Дата выпуска: 7 января 2010 года.
Используются двухъядерные интегральные схемы на

основе 32 нм микроархитектуры Nehalem.
Arrandale является преемником 45-нм микроархитектуры

Penryn. Пакет Arrandale процессор можно разделить на две части, собственно 32 нм процессор с вводом и выводом и 45-нм графический контроллер с интерфейсом памяти.
Кэш-память третьего уровня 4 MB

Clarksfield

2 Дата выпуска: 3 сентября 2009 года
Clarksfield –процессоры Intel, изначально продавался для процессоров Intel Core i7 для ноутбуков. В нем используется четырехъядерные процессоров, также, как и Arrandale, использует PCI Express и DMI ссылки, и производится на основе 45 нм микроархитектуры Nehalem. На момент его выпуска на форуме Intel для разработчиков, Clarksfield процессоры был значительно быстрее, чем любые другие процессоры ноутбуков, включая Core 2 Extreme QX9300.

ArrandaleДата выпуска: 7 января 2010 года.Используются двухъядерные интегральные схемы на основе 32 нм микроархитектуры Nehalem. Arrandale является

Слайд 11Sandy Bridge
32-нм технологический процесс
Несёт поддержку новых SIMD (инструкций для

работы с векторными вычислениями Advanced Vector Extensions (AVX)), которые дополнят

расширения SSE(интеловский набор SIMD). Новый набор, оставаясь обратно совместимым с SSE, увеличивает разрядность рeгистров в два раза — до 256 бит, а также даёт в распоряжение программистов дополнительные трёх- и четырёхоперандные команды. При этом Intel обещает, что использование AVX будет способно поднять скорость работы некоторых алгоритмов на величину, достигающую 90 %.
Добавлен кэш инструкций нулевого уровня (L0), содержащий до 1500 декодированных микро-операций для экономии энергии и улучшения пропускной способности инструкций. Блок предварительной выборки может отключать декодер инструкций, если он обнаруживает уже декодированную инструкцию в кэше.
Каждое ядро имеет по 256 КБ кеша второго уровня и до 8 МБ объединенного кеша третьего уровня. Процессор находится на одной кремниевой подложке площадью 216 мм². Энергопотребление данного дизайна не выходит за пределы 95 Вт для топовых моделей.
Sandy Bridge 32-нм технологический процессНесёт поддержку новых SIMD (инструкций для работы с векторными вычислениями Advanced Vector Extensions

Слайд 12Структуру Sandy Bridge можно условно разделить на следующие основные элементы:
процессорные

ядра;
графическое ядро;
кеш-память L3
Все перечисленные элементы объединены с помощью 256-битной межкомпонентной

кольцевой шины, выполненной на основе новой версии технологии QPI.
Шина состоит из четырёх 32-байтных колец:
шины данных (Data Ring);
шины запросов (Request Ring);
шины мониторинга состояния (Snoop Ring);
шины подтверждения (Acknowledge Ring).
Основные преимущества кольцевой топологии шины:
высокая масштабируемость (до 20 ядер на кристалл);
снижение задержки кэша 3-го уровня, и перевод его на частоту процессора;
использование графическим ядром кэша 3-го уровня.
Производительность кольцевой шины достигает 96 Гбайт в секунду на соединение при тактовой частоте 3 ГГц, что фактически в четыре раза превышает показатели процессоров Intel предыдущего поколения.

Структуру Sandy Bridge можно условно разделить на следующие основные элементы:процессорные ядра;графическое ядро;кеш-память L3Все перечисленные элементы объединены с

Слайд 13 Микроархитектуры Ivy Bridge, Haswell , Skylake
Выпуск планируется в 2012 году
22-нм техпроцесс,
поддержка

MS Direct X 11,
улучшенные технологии энергосбережения
встроенная поддержка USB 3.0,
поддержка нового

поколения технологии Intel QuickSync (ускорение декодирования видео средствам интегрированного GPU),
чипсет Panther Point получит новый интерфейс, рассчитанный на одновременное подключение до трех дисплеев.
Планируется 20 % превосходство Ivy Bridge над Sandy Bridge в плане производительности.


Выпуск планируется в 2013 году
22-нм техпроцесс
Базовое количество ядер — 8
Полностью новый дизайн кэша
Возможен интегрированный векторный сопроцессор
Будет реализована возможность работы сразу с четырьмя операндами, за одну инструкцию совершать сразу две операции умножения и сложения/вычитания.

Ivy Bridge:

Haswell

Skylake

14-нм техпроцесс

Микроархитектуры Ivy Bridge, Haswell , Skylake  Выпуск планируется в 2012 году22-нм техпроцесс,поддержка MS Direct

Слайд 14Процессоры AMD

Процессоры AMD

Слайд 15AMD Fusion
Выпуск – 2009 го
Суть «AMD Fusion» заключается в объединении

центрального многозадачного универсального процессора с графическим параллельным многоядерным процессором в

одном кристалле. Процессоры, создаваемые по такой микроархитектуре, называются APU — Accelerated Processing Unit (ускоренный процессорный элемент).
Многоядерная микропроцессорная архитектура, которая комбинирует процессорные ядра общего назначения с последовательной обработкой данных и многопоточные графические ядра с параллельной обработкой данных в одном процессорном кристалле.
В процессорах серии Fusion будет использоваться новый модульный дизайн, который называется «M-SPACE». В этой многоядерной микропроцессорной архитектуре имеется широкий диапазон комбинаций, а также улучшенная гибкость, что приводит к минимизации архитектурных изменений между различными комбинациями компонентов. Встроенное графическое ядро может быть изменено без необходимости редизайна целого процессорного кристалла.

AMD FusionВыпуск – 2009 гоСуть «AMD Fusion» заключается в объединении центрального многозадачного универсального процессора с графическим параллельным

Слайд 16Bobcat
Выпуск –2011
32 нм техпроцесс
Кэш-память второго уровня до 1 Мб
Предназначенны для

малопотребляющих ноутбуков и компактных настольных ПК.
Имеют возможность работать при потребляемой

мощности менее 1 Вт. Оптимизация микроархитектуры и управления питанием позволяет снизить энергопотребление.
Ядро Bobcat, в отличии от Intel Atom, обладает внеочередным исполнением команд и является основой для Ontario (TDP 9 Вт) и Zacate (TDP 18 Вт) APU, которые будут доступны в одно- и двухъядерных вариантах.
Процессорные и графические ядра находятся на одной подложке.
Включают ядро графического процессора, полностью совместимого с DirectX 11.
BobcatВыпуск –201132 нм техпроцессКэш-память второго уровня до 1 МбПредназначенны для малопотребляющих ноутбуков и компактных настольных ПК.Имеют возможность

Слайд 17Процессоры Zacate,Ontario, Llano в серии Fusion
Выпуск – июнь 2011
32 нм

техпроцесс
Потребляемая мощность 35 - 45 Вт
Кэш-память второго уровня до 1

Мб

Llano

Zacate,Ontario

Выпуск – июнь 2011
40 нм техпроцесс
Потребляемая мощность 9,18 Вт
Кэш-память второго уровня до 512 Кб

Процессоры Zacate,Ontario, Llano в серии Fusion Выпуск – июнь 201132 нм техпроцессПотребляемая мощность 35 - 45 ВтКэш-память

Слайд 18Bulldozer
Выпуск – 7 сентября 2011
Новый компоновочный блок называемый модулем.

Модуль – это нечто среднее между многоядерным процессором (в котором

каждое ядро независимо) и одноядерного процессора с двумя синхронными многопоточными режимами(Simultaneous multithreading - SMT) (в которых каждый поток пользуется большей частью аппаратное обеспечение с другим потоком).
Впервые для AMD её процессоры будут поддерживать одновременную обработку нескольких потоков
Процессоры Bulldozer впервые будут поддерживать новые инструкции x86
Bulldozer будет содержать до 8 ядер для настольного сегмента, до 16 ядер — для серверного, и обладать совместимостью с модульной процессорной архитектурой M-SPACE.
Новые процессоры получат поддержку технологии Turbo Core 2, которая позволяет увеличить номинальную частоту процессора с 3,5 до 4 ГГц и заметно повысить производительность аналогично технологии Intel Turbo Boost.
Потребляемая мощность от 10 до 125 Вт
Bulldozer  Выпуск – 7 сентября 2011Новый компоновочный блок называемый модулем. Модуль – это нечто среднее между

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика