Алгоритм Томасуло

Содержание

1. Алгоритм Томасуло
2. Алгоритм ТамасулоРазрешение конфликтов RAW происходит за счет
3. Схема процессора для реализации алгоритма Тамасуло
4. Состав процессораОчередь планирования (Instruction queue)[ОП]Регистровый файл (FP
5. Схема процессора для реализации алгоритма Тамасуло
6. Этапы исполнения инструкцииКлассический конвейерВыборка инструкцииВыборка операндовИсполнение Сохранение результатаАлгоритм ТамасулоВыборка инструкцииПланирование инструкцииОжидание готовности операндовИсполнение Сохранение результата
7. Устройство СРСостоит из двух дескрипторов операндов.Дескриптор операнда
8. Планирование инструкцийВыборка с вершины ОП. Выборка происходит
9. Ожидание готовности операндов, исполнение, сохранение результатовИнструкция ожидает
10. Обработка инструкций загрузки и сохранения. Инструкция загрузки:
11. Порядок исполнения инструкций загрузки и сохранения. Определяется
12. Файл переименованияНаходиться в РФ.Содержит имена переименованных регистров.Состоит
13. Пример 11. L.D F6,34(R2)2. L.D F2,45(R3)3. MUL.D
14. Обозначения Op — операция, которая будет выполняться Vj, Vk—
15. Такт 0
16. Такт 1
17. Такт 2
18. Такт 3
19. Такт 4
20. Такт 5
21. Такт 6
22. Такт 7
23. Такт 8
24. Такт 9
25. Такт 10
26. Такт 11
27. Такт 12
28. Такт 15
29. Такт 16
30. Такт 56
31. Такт 57
32. Пример 21. L.D F6,34(R2)2. L.D F2,45(R3)3. MUL.D
33. Такт 0
34. Такт 4
35. Такт 5
36. Такт 6
37. Такт 7
38. Такт 8
39. Такт 9
40. Такт 15
41. Такт 16
42. Такт 17
43. Такт 18
44. Такт 19
45. Такт 20
46. Такт 21
47. Такт 57
48. Такт 58
49. Общее описание алгоритма
50. Достоинства и недостатки алгоритма.Достоинства:Повышение пропускной способности Уменьшение времени простоя процессораНедостаткиБольшие аппаратные затраты на реализацию дополнительных устройств.
51. Пример задачиДано: C = 3A + 4
52. Скачать презентанцию

Алгоритм ТамасулоРазрешение конфликтов RAW происходит за счет запуска инструкции, только когда готовы ее операнды.Устранение WAR и WAW конфликтов происходит за счет переименования регистров с использованием станций резервирования (Reserve Station).RS используются для

Слайды и текст этой презентации

Слайд 1Алгоритм Тамасуло
Разработан в компании IBM в начале 80-ых годов.
Первоначально использовался

в вещественном сопроцессоре IBM 360/92.
Это алгоритм динамического планирования инструкций, позволяет

исполнять инструкции в порядке отличном от программного.
При одновременном исполнении двух и более инструкций позволяет разрешить RAW, и устранить WAR и WAW конфликты

Алгоритм ТамасулоРазработан в компании IBM в начале 80-ых годов.Первоначально использовался в вещественном сопроцессоре IBM 360/92.Это алгоритм динамического

Слайд 2Алгоритм Тамасуло
Разрешение конфликтов RAW происходит за счет запуска инструкции, только

когда готовы ее операнды.
Устранение WAR и WAW конфликтов происходит за

счет переименования регистров с использованием станций резервирования (Reserve Station).
RS используются для хранения операндов инструкции и воссоздания графа зависимостей по данным между инструкциями, которые находятся в исполнении.

Алгоритм ТамасулоРазрешение конфликтов RAW происходит за счет запуска инструкции, только когда готовы ее операнды.Устранение WAR и WAW

Слайд 3Схема процессора для реализации алгоритма Тамасуло

Слайд 4Состав процессора
Очередь планирования (Instruction queue)[ОП]
Регистровый файл (FP Registers) [РФ]
Станции резервирования

(Reserve Station) [СР]
Простое вещественное устройство (FP adder)
Сложное вещественное устройство (FP

Muliplier)
Общая шина данных (Common Data Bus)[ОШД]
Устройство вычисление адреса (Address Unit)
Буфера загрузки (Load buffer)
Буфера сохранения (Store buffer)
Устройство работы с памятью (Memory Unit).

Состав процессораОчередь планирования (Instruction queue)[ОП]Регистровый файл (FP Registers) [РФ]Станции резервирования (Reserve Station) [СР]Простое вещественное устройство (FP adder)Сложное

Слайд 5Схема процессора для реализации алгоритма Тамасуло

Слайд 6Этапы исполнения инструкции
Классический конвейер
Выборка инструкции
Выборка операндов
Исполнение
Сохранение результата
Алгоритм Тамасуло
Выборка инструкции
Планирование

инструкции
Ожидание готовности операндов
Исполнение
Сохранение результата

Этапы исполнения инструкцииКлассический конвейерВыборка инструкцииВыборка операндовИсполнение Сохранение результатаАлгоритм ТамасулоВыборка инструкцииПланирование инструкцииОжидание готовности операндовИсполнение Сохранение результата

Слайд 7Устройство СР
Состоит из двух дескрипторов операндов.
Дескриптор операнда содержит значение операнда

или ссылку, если значение операнда на момент планирования еще не

вычислено.
Ссылка - это номер СР, который содержит инструкцию вычисляющую данный операнд.

Устройство СРСостоит из двух дескрипторов операндов.Дескриптор операнда содержит значение операнда или ссылку, если значение операнда на момент

Слайд 8Планирование инструкций
Выборка с вершины ОП.
Выборка происходит по 1 инструкции

за такт.
Выборка осуществляется в программном порядке, так как очередь FIFO
Декодирование.
Назначение

на исполнительное устройство.
Если все СР устройства заняты, то инструкция возвращается в ОП и ожидает освобождения RS.
Выборка операндов.
Если операнды вычислены, то они выбираются из РФ, если нет то в дескрипторах СР устанавливается ссылки на другие СР.

Планирование инструкцийВыборка с вершины ОП. Выборка происходит по 1 инструкции за такт.Выборка осуществляется в программном порядке, так

Слайд 9Ожидание готовности операндов, исполнение, сохранение результатов
Инструкция ожидает в СР до

тех пор, пока не будут вычислены все ее операнды и

записаны в соответствующие дескрипторы.
Передача вычисленного операнда происходит по ОШД вместе с номером СР, который его содержал.
Каждая СР слушает ОШД и сравнивает значение номер передаваемого по ней СР с ожидаемым. Если номера совпадает то она забирает значение операнда с ОШД.
Передаваемые по ОШД данные сохраняются в РФ.
Если все операнды находятся СР, то инструкция отправляется на исполнение.

Ожидание готовности операндов, исполнение, сохранение результатовИнструкция ожидает в СР до тех пор, пока не будут вычислены все

Слайд 10Обработка инструкций загрузки и сохранения.
Инструкция загрузки:
Вычисление адреса
Выполнение загрузки

по адресу
Инструкция сохранения:
Вычисление адреса
Ожидания готовности операнда.
Выполнение сохранения по адресу.
Буфер загрузки:

поле адреса.
Буфер сохранения: поле адреса, СР для операнда.

Обработка инструкций загрузки и сохранения. Инструкция загрузки: Вычисление адресаВыполнение загрузки по адресуИнструкция сохранения:Вычисление адресаОжидания готовности операнда.Выполнение сохранения

Слайд 11Порядок исполнения инструкций загрузки и сохранения.
Определяется наличием зависимостей между

инструкциями по ячейкам памяти.
Адреса ячеек вычисляются на первом этапе.
Инструкция

загрузки ожидает завершения всех предшествующих инструкций сохранения по данному адресу.
Инструкция сохранения ожидает завершения всех предшествующих инструкций загрузки и сохранения по данному адресу.

Порядок исполнения инструкций загрузки и сохранения. Определяется наличием зависимостей между инструкциями по ячейкам памяти. Адреса ячеек вычисляются

Слайд 12Файл переименования
Находиться в РФ.
Содержит имена переименованных регистров.
Состоит из двух полей:
Если

значение находиться в регистре, то ссылка равна нулю, если нет

то ссылка указывает на СР, которая его вычислит.

Файл переименованияНаходиться в РФ.Содержит имена переименованных регистров.Состоит из двух полей:Если значение находиться в регистре, то ссылка равна

Слайд 13Пример 1
1. L.D F6,34(R2)
2. L.D F2,45(R3)
3. MUL.D F0,F2,F4
4. SUB.D F8,F2,F6
5.

DIV.D F10,F0,F6
6. ADD.D F6,F8,F2

Допущения
Латентность загрузки/сохранения : 2
Латентность сложения/вычитания :

2
Латентность умножения : 10
Латентность деления: 40
СР для загрузки/сохранения: 3
СР для простых арифм. орпер. : 3
СР для сложных арифм. орпер. : 2
Планирование инструкций происходит отдельно от процесса исполнения.

Пример 11. L.D F6,34(R2)2. L.D F2,45(R3)3. MUL.D F0,F2,F44. SUB.D F8,F2,F65. DIV.D F10,F0,F66. ADD.D F6,F8,F2 ДопущенияЛатентность загрузки/сохранения :

Слайд 14Обозначения
Op — операция, которая будет выполняться
Vj, Vk— готовые значения операндов.
Qj,

Qk— ссылка на СР, на которой будет рассчитан соответствующий операнд.

Значение «0» – данные записаны в Vj или Vk соответственно.
Busy — флаг занятости.

Issue — стадия планирования инструкции.
Complete — стадия выполнения и завершения выполнения.
Result — стадия сохранения результата

Обозначения Op — операция, которая будет выполняться Vj, Vk— готовые значения операндов. Qj, Qk— ссылка на СР, на которой будет

Слайд 15Такт 0

Слайд 16Такт 1

Слайд 17Такт 2

Слайд 18Такт 3

Слайд 19Такт 4

Слайд 20Такт 5

Слайд 21Такт 6

Слайд 22Такт 7

Слайд 23Такт 8

Слайд 24Такт 9

Слайд 25Такт 10

Слайд 26Такт 11

Слайд 27Такт 12

Слайд 28Такт 15

Слайд 29Такт 16

Слайд 30Такт 56

Слайд 31Такт 57

Слайд 32Пример 2
1. L.D F6,34(R2)
2. L.D F2,45(R3)
3. MUL.D F0,F2,F4
4. SUB.D F8,F2,F6
5.

DIV.D F10,F0,F6
6. ADD.D F6,F8,F2

Допущения
Латентность загрузки/сохранения : 2
Латентность сложения/вычитания :

2
Латентность умножения : 10
Латентность деления: 40
СР для загрузки/сохранения: 3
СР для простых арифм. орпер. : 3
СР для сложных арифм. орпер. : 1
Планирование инструкций происходит отдельно от процесса исполнения.

Пример 21. L.D F6,34(R2)2. L.D F2,45(R3)3. MUL.D F0,F2,F44. SUB.D F8,F2,F65. DIV.D F10,F0,F66. ADD.D F6,F8,F2 ДопущенияЛатентность загрузки/сохранения :

Слайд 33Такт 0

Слайд 34Такт 4

Слайд 35Такт 5

Слайд 36Такт 6

Слайд 37Такт 7

Слайд 38Такт 8

Слайд 39Такт 9

Слайд 40Такт 15

Слайд 41Такт 16

Слайд 42Такт 17

Слайд 43Такт 18

Слайд 44Такт 19

Слайд 45Такт 20

Слайд 46Такт 21

Слайд 47Такт 57

Слайд 48Такт 58

Слайд 49Общее описание алгоритма

Слайд 50Достоинства и недостатки алгоритма.
Достоинства:
Повышение пропускной способности
Уменьшение времени простоя процессора
Недостатки
Большие

аппаратные затраты на реализацию дополнительных устройств.

Достоинства и недостатки алгоритма.Достоинства:Повышение пропускной способности Уменьшение времени простоя процессораНедостаткиБольшие аппаратные затраты на реализацию дополнительных устройств.

Слайд 51Пример задачи
Дано: C = 3A + 4 + B
Р-р R1

соответствует A
Р-р R2 соответствует B
Р-р R3 соответствует C
Ассемблерный код
ld R4,

[R1]
mul R4, R4, 3
ld R5, [R2]
ADD R4, R4, 4
ADD R4, R5, R4
st [R3], R4
ADD R1, R1, 1
ADD R2, R2, 1
ADD R3, R3, 1
BNE R10, R1, loop

Пример задачиДано: C = 3A + 4 + BР-р R1 соответствует AР-р R2 соответствует BР-р R3 соответствует

Скачать презентацию

Разделы презентаций

Алгоритм Томасуло

Содержание

Слайды и текст этой презентации

Слайд 1Алгоритм ТамасулоРазработан в компании IBM в начале 80-ых годов.Первоначально использовался

в вещественном сопроцессоре IBM 360/92.Это алгоритм динамического планирования инструкций, позволяет

Слайд 2Алгоритм ТамасулоРазрешение конфликтов RAW происходит за счет запуска инструкции, только

когда готовы ее операнды.Устранение WAR и WAW конфликтов происходит за

Слайд 3Схема процессора для реализации алгоритма Тамасуло

Слайд 4Состав процессораОчередь планирования (Instruction queue)[ОП]Регистровый файл (FP Registers) [РФ]Станции резервирования

(Reserve Station) [СР]Простое вещественное устройство (FP adder)Сложное вещественное устройство (FP

Слайд 5Схема процессора для реализации алгоритма Тамасуло

инструкцииОжидание готовности операндовИсполнение Сохранение результата

Слайд 7Устройство СРСостоит из двух дескрипторов операндов.Дескриптор операнда содержит значение операнда

или ссылку, если значение операнда на момент планирования еще не

Слайд 8Планирование инструкцийВыборка с вершины ОП. Выборка происходит по 1 инструкции

за такт.Выборка осуществляется в программном порядке, так как очередь FIFOДекодирование.Назначение

Слайд 9Ожидание готовности операндов, исполнение, сохранение результатовИнструкция ожидает в СР до

тех пор, пока не будут вычислены все ее операнды и

Слайд 10Обработка инструкций загрузки и сохранения. Инструкция загрузки: Вычисление адресаВыполнение загрузки

по адресуИнструкция сохранения:Вычисление адресаОжидания готовности операнда.Выполнение сохранения по адресу.Буфер загрузки:

Слайд 11Порядок исполнения инструкций загрузки и сохранения. Определяется наличием зависимостей между

инструкциями по ячейкам памяти. Адреса ячеек вычисляются на первом этапе.Инструкция

Слайд 12Файл переименованияНаходиться в РФ.Содержит имена переименованных регистров.Состоит из двух полей:Если

значение находиться в регистре, то ссылка равна нулю, если нет

Слайд 13Пример 11. L.D F6,34(R2)2. L.D F2,45(R3)3. MUL.D F0,F2,F44. SUB.D F8,F2,F65.

DIV.D F10,F0,F66. ADD.D F6,F8,F2 ДопущенияЛатентность загрузки/сохранения : 2Латентность сложения/вычитания :

Слайд 14Обозначения Op — операция, которая будет выполняться Vj, Vk— готовые значения операндов. Qj,

Qk— ссылка на СР, на которой будет рассчитан соответствующий операнд.

Слайд 15Такт 0

Слайд 16Такт 1

Слайд 17Такт 2

Слайд 18Такт 3

Слайд 19Такт 4

Слайд 20Такт 5

Слайд 21Такт 6

Слайд 22Такт 7

Слайд 23Такт 8

Слайд 24Такт 9

Слайд 25Такт 10

Слайд 26Такт 11

Слайд 27Такт 12

Слайд 28Такт 15

Слайд 29Такт 16

Слайд 30Такт 56

Слайд 31Такт 57

Слайд 32Пример 21. L.D F6,34(R2)2. L.D F2,45(R3)3. MUL.D F0,F2,F44. SUB.D F8,F2,F65.

DIV.D F10,F0,F66. ADD.D F6,F8,F2 ДопущенияЛатентность загрузки/сохранения : 2Латентность сложения/вычитания :

Слайд 33Такт 0

Слайд 34Такт 4

Слайд 35Такт 5

Слайд 36Такт 6

Слайд 37Такт 7

Слайд 38Такт 8

Слайд 39Такт 9

Слайд 40Такт 15

Слайд 41Такт 16

Слайд 42Такт 17

Слайд 43Такт 18

Слайд 44Такт 19

Слайд 45Такт 20

Слайд 46Такт 21

Слайд 47Такт 57

Слайд 48Такт 58

Слайд 49Общее описание алгоритма

Слайд 50Достоинства и недостатки алгоритма.Достоинства:Повышение пропускной способности Уменьшение времени простоя процессораНедостаткиБольшие

аппаратные затраты на реализацию дополнительных устройств.

Слайд 51Пример задачиДано: C = 3A + 4 + BР-р R1

соответствует AР-р R2 соответствует BР-р R3 соответствует CАссемблерный кодld R4,

Похожие презентации

Обратная связь

Что такое TheSlide.ru?

Слайд 1Алгоритм Тамасуло
Разработан в компании IBM в начале 80-ых годов.
Первоначально использовался

в вещественном сопроцессоре IBM 360/92.
Это алгоритм динамического планирования инструкций, позволяет

Слайд 2Алгоритм Тамасуло
Разрешение конфликтов RAW происходит за счет запуска инструкции, только

когда готовы ее операнды.
Устранение WAR и WAW конфликтов происходит за

Слайд 4Состав процессора
Очередь планирования (Instruction queue)[ОП]
Регистровый файл (FP Registers) [РФ]
Станции резервирования

(Reserve Station) [СР]
Простое вещественное устройство (FP adder)
Сложное вещественное устройство (FP

инструкции
Ожидание готовности операндов
Исполнение
Сохранение результата

Слайд 7Устройство СР
Состоит из двух дескрипторов операндов.
Дескриптор операнда содержит значение операнда

Слайд 8Планирование инструкций
Выборка с вершины ОП.
Выборка происходит по 1 инструкции

за такт.
Выборка осуществляется в программном порядке, так как очередь FIFO
Декодирование.
Назначение

Слайд 9Ожидание готовности операндов, исполнение, сохранение результатов
Инструкция ожидает в СР до

Слайд 10Обработка инструкций загрузки и сохранения.
Инструкция загрузки:
Вычисление адреса
Выполнение загрузки

по адресу
Инструкция сохранения:
Вычисление адреса
Ожидания готовности операнда.
Выполнение сохранения по адресу.
Буфер загрузки:

Слайд 11Порядок исполнения инструкций загрузки и сохранения.
Определяется наличием зависимостей между

инструкциями по ячейкам памяти.
Адреса ячеек вычисляются на первом этапе.
Инструкция

Слайд 12Файл переименования
Находиться в РФ.
Содержит имена переименованных регистров.
Состоит из двух полей:
Если

Слайд 13Пример 1
1. L.D F6,34(R2)
2. L.D F2,45(R3)
3. MUL.D F0,F2,F4
4. SUB.D F8,F2,F6
5.

DIV.D F10,F0,F6
6. ADD.D F6,F8,F2

Допущения
Латентность загрузки/сохранения : 2
Латентность сложения/вычитания :

Слайд 14Обозначения
Op — операция, которая будет выполняться
Vj, Vk— готовые значения операндов.
Qj,

Слайд 32Пример 2
1. L.D F6,34(R2)
2. L.D F2,45(R3)
3. MUL.D F0,F2,F4
4. SUB.D F8,F2,F6
5.

DIV.D F10,F0,F6
6. ADD.D F6,F8,F2

Допущения
Латентность загрузки/сохранения : 2
Латентность сложения/вычитания :

Слайд 50Достоинства и недостатки алгоритма.
Достоинства:
Повышение пропускной способности
Уменьшение времени простоя процессора
Недостатки
Большие

Слайд 51Пример задачи
Дано: C = 3A + 4 + B
Р-р R1

соответствует A
Р-р R2 соответствует B
Р-р R3 соответствует C
Ассемблерный код
ld R4,