Слайд 2План лекции
Пример архитектуры современного ПК
Недостатки последовательной архитектуры
Многоядерные процессоры
Концепция многопоточности
(Hyper-Threading)
Современные 4-ядерные
процессоры Intel Core i7
Примеры архитектур ПК с многоядерными процессорами
Хабовая архитектура
Intel Pentium
4 3,00 ГГц и чипсет 875P (Canterwood) для двухканальной памяти DDR400 (2003г)
Слайд 4Особенности архитектуры
Поддержка двух независимых каналов обращения к памяти DDR400(модулей
PC3200)
Поддержка более быстрой системной шины с частотой передачи данных
800 МГц и пропускной способностью 6,4Гбайт/сек
Наличие у северного моста(системный контроллер) отдельной шины Communication Streaming Architecture для связи с контроллером Gigabit Ethernet, имеющую пропускную способность 266 Мбайт/с
Разгрузка Hub-Link (266 Мбайт/с) для связи между мостами чипсета
Наличие у южного моста (периферийный контроллер) 8 портов USB 2.0 и 2 порта интерфейса Serial ATA с поддержкой режима RAID
Слайд 5
Классическая одноядерная (однопроцессорная) схема
Многозада́чность (англ. multitasking) — свойство операционной системы
обеспечивать возможность параллельной
обработки нескольких
процессов.
В памяти находится код
нескольких программ
(«кирпичики»
разного цвета),
но в один момент
времени процессор
выполняет код
только одной из них
Слайд 6Недостатки последовательной архитектуры
Ограничение производительности МП, вследствие наличия фундаментальных физических барьеров.
Дальнейшее повышение тактовой частоты (при тактовой частоте более 3,8 ГГц
чипы попросту перегреваются!) упирается в ряд фундаментальных физических барьеров (поскольку технологический процесс почти вплотную приблизился к размерам атома: сегодня процессоры выпускаются по 45-нм технологии, а размеры атома кремния – приблизительно 0,543 нм).
Несоответствие производительности процессора и памяти, так как время доступа к памяти не соответствует возрастающим тактовым частотам.
Ограничение производительности в результате последовательного потока вычислений.
Усложнение программ за счет использования разного адресного пространства в режиме мультизадачности.
Слайд 7Вывод, определяющий тенденцию развития архитектур ПК
В современной архитектуре ПК ставка
должна делаться не на повышение тактовой частоты процессора, а на
улучшение параметров процессора – кэш, эффективность и количество ядер
Слайд 8многоядерные микропроцессоры
Слайд 9Что такое ядро процессора
В микропроцессоре находится ядро (core) – кристалл
кремния площадью примерно один квадратный сантиметр, на котором посредством микроскопических
логических элементов реализована принципиальная схема процессора.
Ядро расположено на текстолитовой основе, по которой проходят контактные дорожки к «ножкам» (контактным площадкам), залито термическим интерфейсом и закрыто защитной металлической крышкой.
Многоядерный процессор – это микропроцессор, содержащий 2 и более вычислительных ядра на одном процессорном кристалле или в одном корпусе.
Слайд 10Что явилось предпосылкой появления многоядерных микропроцессоров?
Слайд 11Концепция многопоточности
(Hyper-Threading)
Hyper-Threading Technology (HTT) – технология позволяющая выполнять в одноядерном
процессоре параллельно несколько программных потоков команд одновременно и тем самым
повысить производительность микропроцессоров.
Слайд 12Процессор с поддержкой Hyper-Threading
На одном физическом ядре одновременно выполняется
параллельная
обработка нескольких потоков команд.
Слайд 13Суть концепции многопоточности в одноядерном МП
Процессор Pentium 4 с включенным
Hyper-threading имеет одно физическое ядро, которое разделено на два логических,
поэтому операционная система определяет его, как два разных процессора (вместо одного).
Слайд 14Hyper-threading - трамплин к созданию процессоров с двумя физическими ядрами
на одном кристалле
В 2-ядерном чипе параллельно работают два ядра (два
процессора!), которые при меньшей тактовой частоте обеспечивают большую производительность, поскольку параллельно (одновременно!) выполняются два независимых потока команд.
Слайд 15
Многоядерная (многопроцессорная) система
Благодаря наличию двух ядер (процессоров),
можно одновременно исполнять
коды двух программ
Слайд 16Причины увеличения быстродействия ПК за счёт увеличения количества ядер
При полностью
распараллеливаемой задаче все ядра могут задействоваться одновременно на всё время.
На частично распараллеливаемой задаче не все ядра могут задействоваться одновременно всё время. А значит, некоторые из них как минимум иногда будут простаивать.
Слайд 17Практический прирост производительности многоядерных процессоров
Двухъядерный процессор на программах обычного пользователя
в среднем получает ускорение примерно раза в полтора.
4-ядерный — примерно
в два по сравнению с одноядерным.
При запуске «профессиональных» программ кратность ускорения часто почти равна числу ядер.
Слайд 18Вывод
Количество ядер актуально в задачах 3D-графики и кодирования видео, а
также в программах, код которых оптимизирован под многопоточность нескольких ядер.
В остальных случаях (например, в офисных и интернет-задачах) они бесполезны.
Слайд 19Об эволюции развития многоядерной архитектуры ПК
Декабрь 2002 г. – вышли
первые десктопные Intel Pentium 4, поддерживающие «виртуальную» 2-ядерность – технологию
Hyper-Threading.
2002 г. – о перспективах использования двух ядер в своих процессорах архитектуры K8 заявила компания AMD. Практически одновременно с аналогичным заявлением выступила Intel.
Слайд 20Современные 4-ядерные процессоры Intel Core i7
17 ноября 2008 г. –
Intel представила линейку 4-ядерных процессоров Intel Core i7, в основу
которых положена микроархитектура нового поколения Nehalem.
Процессоры работают на тактовой частоте 2,6 – 3,2 ГГц. Выполнены по 45-нм техпроцессу.
Слайд 21Особенности кристалла Core i7
Контроллер памяти стал составной частью
процессора. Это позволило увеличить скорость работы чипа с модулями оперативной
памяти и сделало ненужной фронтальную системную шину FSB.
Динамическое увеличение частоты процессора, зависящей от числа активных ядер и текущей загрузки, от его температуры, чтобы не допустить перегрева ( Технология Intel Turbo Boost)
Появление QPI(QuickPath Interconnect), действующей в двунаправленном режиме для связи процессора и чипсета. 20 линий данных в одну сторону и 20 линий данных - в другую. Каждая линия представляет собой дифференциальную пару проводников (lane), аналогичную используемым в PCI Express и SATA.
Один блок QPI поддерживает 20 линий передачи данных в обоих направлениях со скоростью 6,4 ГТ/с. Суммарная пропускная способность шины – 25,6 гигабайт информации в секунду.
Динамическое изменение напряжения питания ядра.
Слайд 23Архитектура Intel X58 Express (Tylersburg) для Core i7
С материнской
платы ушел контроллер памяти и исчезла шина памяти
Слайд 24Платформа Intel LGA2011 для high-end систем (2011г)
Слайд 25Особенности архитектуры Intel LGA2011
Отсутствие северного моста (полностью интегрирован в
процессор и связан с ядрами по внутренней шине QPI).
Высокопроизводительный
8 ядерный процессор Sandy Bridge
Массивы из нескольких видеокарт с шинами PCI Express
Четырехканальный доступ к памяти.
Слайд 27Особенности архитектуры AMD FM1
В процессор добавлен контроллер шины PCI Express,
что позволило избавиться от северного моста и использовать в роли
чипсета один только южный мост.
Встроенная поддержка интерфейса SerialATA 6 Gb/s.
Встроенная поддержка последовательной шины USB 3.0 (четыре порта)
Слайд 28Главные аппаратные факторы, влияющие на рост производительности ПК
число физических ядер
(логических больше, если у процессора есть технология типа Hyper-Threading);
частота физических ядер (при наличии технологии Turbo Boost);
полный объём всех кэшей;
число контроллеров и шин памяти;
Частоты шин чипсета;
Технологический процесс(45, 32, 22нм)
Слайд 30Определения
Ситуация, когда микропроцессору требуется ответная реакция на различные события,
называется прерыванием
Необходимые реакции на различные события обеспечивает в ПК
система прерываний. Это комплекс аппаратных и программных средств, обеспечивающих выявление и обработку прерываний
Обработка прерываний сводится к приостановке исполнения текущей программы, вместо которой начинает действовать другая программа, соответствующая данному типу прерываний
Слайд 31Типы прерываний
Внешние аппаратные
Внутренние аппаратные
Программные прерывания
Слайд 33Стековая память
Это регистровая память в МП для организации прерываний
Слайд 34Механизм стека
Стек свободен (15)=0, если (УС)=15=1111→ вершина стека
(последняя свободная
ячейка стека)
Слайд 35Работа стековой памяти
Задача 1 – послать А и В в
стек
1. А→15 (15) =А
(УС) -1 =(УС) =1110
=14→ новая вершина стека
2. В→14 (14) =В
(УС) -1 = (УС) = 1101 =13→ новая вершина стека
Заполнение стека происходит с вершины
Слайд 36Работа стековой памяти
Задача 2 Считать А и В
из стека
1. (УС) +1 = (УС) = 1110 =14
(14) →В (14) = 0
2. (УС) +1 = (УС) = 1111 =15
(15) →А (15) = 0
Освобождение стека происходит в обратной последовательности
Слайд 37Организация обмена между ПУ и ОЗУ
Слайд 38Способы организации обмена данными между памятью и периферийными устройствами
программно управляемая
передача- PIO. Осуществляется при непосредственном участии и под управлением процессора.
прямой доступ к памяти - ПДП ( Direct Memory Access - DMA ). Происходит под управлением отдельного устройства - контроллера прямого доступа к памяти (КПДП).
Слайд 39Недостаток программно управляемой передачи
Нерациональное использование производительности МП, который вынужден выполнять
большое количество относительно простых операций, приостанавливая работу над основной программой.
Слайд 40Прямой доступ к памяти -DMA
Способ быстродействующего подключения ПУ, при котором
оно обращается к оперативной памяти, не прерывая работы процессора.