![]() |
|
сделать стартовой | добавить в избранное |
![]() |
Компьютеры, Программирование
Компьютеры и периферийные устройства
Архитектура IA-32 |
Введение2 Технология SIMD4 Краткое обозрение технологий SIMD5 Технология MMX5 SSE5 SSE26 SSE36 Микроархитектура I el e Burs 7 Цели, для которых была разработана Микроархитектура I el e Burs 7 Обзор конвейера микроархитектуры I el e Burs 7 Блок начальной загрузки8 Беспорядочное ядро9 Секция изъятий9 Обзор блока начальной загрузки конвейера11 Предвыборка11 Декодер11 Исполнительный кэш трасс11 Предсказание ветвей11 Обзор исполнительного ядра13 Задержка инструкций и производительность13 Исполнительные блоки и выводные порты13 14 Кэши15 Предвыборка данных16 Плюсы и минусы программной и аппаратной предвыборки16 Загрузка и хранение18 Управление хранением18 Технология Hyper- hreadi g19 Ресурсы процессора и технология Hyper- hreadi g20 Реплицированные ресурсы20 Разделенные ресурсы20 Разделяемые ресурсы20 Микроархитектура конвейера и технология НТ21 Блок начальной загрузки конвейера21 Исполнительное ядро21 Извлечение21 Список использованной литературы22 Введение В этой работе проводиться обзор основных моментов необходимых для оптимизации программного обеспечения для текущего поколения процессоров основанных на технологии IA-32, таких как I el Pe ium 4, I el Xeo и I el Pe ium M. Работа дает базу для понимания правильного подхода к кодированию для технологии IA-32. Ключевые моменты, повышающие производительность процессоров текущего поколения на базе IA-32: Расширение инструкций SIMD поддерживающих технологию MMX, потоковые расширения инструкций SIMD (SSE), потоковые расширения инструкций SIMD второй редакции (SSE2) и потоковые расширения инструкций SIMD третьей редакции (SSE3) Микроархитектуры позволяющие выполнение большего количества инструкций на высоких тактовых частотах, иерархия высокоскоростных КЭШей и возможность получать данные по высокоскоростной системной шине Поддержка технологии Hyper hreadi g Процессоры I el Pe ium 4 и I el Xeo построены на микроархитектуре e Burs . Микроархитектура процессора I el Pe ium M основывается на балансе производительности и низкого энергопотребления. Технология SIMD Один из путей к увеличению производительности процессора – это использование технологии вычислений основанной на том, что одна команда оперирует многими данными (si gle-i s ruc io , mul iple da a (SIMD)). Вычисления с помощью SIMD (рисунок 1) представлены в архитектуре IA-32 технологией MMX.Технология MMX позволяет вычислениям SIMD производиться над упакованными целыми числами в виде байтов, слов и двойных слов. Эти целые содержаться в наборе из восьми 64-битных регистрах называемых MMX регистрами (рисунок 2). В процессоре I el Pe ium III технология SIMD была расширена с помощью потоковых расширений SIMD (SSE). SSE позволяет производить вычисления SIMD над операндами, содержащими четыре упакованных элемента с плавающей точкой одинарной точности. Эти операнды могут храниться как в памяти, так и в одном из 128-битных регистров называемых XMM регистрами (рисунок 2). SSE также расширяет вычислительные способности SIMD, путем добавления дополнительных 64-битных MMX команд. Рисунок 1 показывает типичную схему вычислений SIMD. Два блока по четыре упакованных элемента данных (X1, X2, X3, X4 и Y1, Y2, Y3,Y4), обрабатываемых параллельно с помощью одной операцией над каждой парой элементов данных (X1 и Y1, X2 и Y2, X3 и Y3 и X4 и Y4).
Результаты четырех параллельных вычислений сортируются в набор из четырех элементов данных. Рисунок 1. Схема вычислений SIMD В процессорах Pe ium 4 и I el Xeo модель вычислений SIMD была далее расширена с помощью SSE2 и SSE3. SSE2 работает с операндами, хранящимися в памяти или в XMM регистрах. Технология SSE2 расширяет вычисления SIMD для работы с упакованными элементами данных с плавающей точкой двойной точности и 128-битными упакованными целыми числами. В SSE2 введены 144 дополнительные команды для работы с двумя элементами данных с плавающей точкой двойной точности или над упакованными целыми числами в виде шестнадцати байтов, восьми слов, четырех двойных слов и двух четверных слов. SSE3 улучшает x87, SSE и SSE2 с помощью добавления тринадцати инструкций, позволяющих повысить производительность приложений в специфичных областях. Таких как: обработка видео, комплексная арифметика синхронизация потоков. SSE3 дополняет SSE и SSE2 с помощью команд ассиметричной обработки данных SIMD, команд позволяющих горизонтальные вычисления, а так же команд позволяющих избежать загрузки в кэш разделенных нитей. Полный набор технологий SIMD (MMX, SSE, SSE2, SSE3) в технологии IA-32 дает возможность программисту разрабатывать алгоритмы, совмещающие операции над упакованными 64-битными и 128-битными целыми, и операндами с плавающей точкой одинарной и двойной точности. Рисунок 2. Регистры SIMD SIMD улучшает выполнение 3D графики, распознавание речи, обработки изображений, научных приложений и приложений удовлетворяющих следующим характеристикам: Внутренняя параллельность Рекурсивный доступ к областям памяти Локальные рекурсивные операции над данными Контроль над потоком независимых данных Инструкции SIMD для работы с числами с плавающей точкой полностью поддерживают стандарт IEEE 754 «для бинарной арифметики чисел с плавающей точкой». Они доступны во всех режимах работы процессора. Технологии SSE, SSE2 и MMX – это архитектурные дополнения архитектуры IA-32. SSE и SSE2 также включают инструкции кэширования и организации памяти, которые могут улучшить использование КЭШа и производительность приложений. Краткое обозрение технологий SIMD Технология MMX Технология MMX основывается на: 64-битных MMX-регистрах поддержке операций SIMD над упакованными целыми в виде байтов, слов и двойных слов Инструкции MMX полезны в мультимедийных и коммуникационных приложениях SSE SSE основывается на: 128-битных XMM-регистрах 128-битных типах данных, содержащих четыре упакованных операнда с плавающей точкой одинарной точности инструкциях предвыборки данных инструкциях хранения в течение неопределенного срока и других инструкций кэширования и упорядочивания памяти дополнительной поддержке 64-битных целых SIMD Инструкции SSE полезны при обработке трехмерной геометрии, 3D-рендеринга, распознавания речи, а также для кодирования и декодирования видео. SSE2 SSE2 добавляют следующее: 128-битный тип данных с двумя упакованными операндами с плавающей точкой двойной точности 128-битные типы данных для целочисленных операций SIMD над целыми в виде шестнадцати байт, восьми слов, четырех двойных слов или двух четверных слов.
Поддержку арифметики SIMD над 64-битными целочисленными операндами Инструкции для конвертирования между новыми и существующими типами данных Дополнительная поддержка перемешивания данных Дополнительная поддержка операций кэширования и упорядочивания памяти Инструкции SSE2 полезны для обработки 3D графики, кодирования и декодирования видео и шифрования. SSE3 SSE3 добавляет следующее: SIMD операции с плавающей точкой для ассиметричных и горизонтальных вычислений Специальную 128-битную загрузочную инструкцию для избежания разделения нити КЭШа x87 FPU – инструкцию для конвертирования в целое независимо от FCW (floa i g-poi co rol word) инструкции для поддержки синхронизации потоков Инструкции SSE3 могут применяться в научных, видео и многопоточных приложениях. Микроархитектура I el e Burs В этом разделе описываются основные моменты микроархитектуры I el e Burs . Он дает техническую базу необходимую для понимания оптимизационных рекомендаций и правил кодирования процессоров I el Pe ium 4 и I el Xeo . Микроархитектура I el e Burs она спроектирована для достижения высокой производительности при целочисленных вычислениях и вычислениях операндов с плавающей точкой на высоких частотах. Она основывается на следующих моментах: гиперковейерная технология позволяющая работать на высоких частотах (до 10 ГГц) высокопроизводительный, четырехкратный шинный интерфейс для системной шины микроархитектуры I el e Burs скоростной движок для снижения задержек исполнения целочисленных инструкций спекулятивное разупорядоченное исполнение для поддержки параллелизма суперскалярная выдача для поддержки параллелизма поддержка аппаратного переименования регистров для исключения ограничений пространства имен 64-байтные нити КЭШа аппаратная предвыборка Цели, для которых была разработана Микроархитектура I el e Burs Цели, для которых была разработана Микроархитектура I el e Burs : для обеспечения наследственности приложений IA-32 и приложений основанных на SIMD на высокопроизводительных системах для оперирования на высоких тактовых частотах и для масштабирования высокой производительности и высоких тактовых частот в будущем Преимущества микроархитектуры I el e Burs : многоконвейерный дизайн позволяющий работать на высоких тактовых частотах (различные части кристалла работают с различными тактовыми частотами) конвейер, оптимизированный для обработки часто исполняемых инструкций (часто исполняемые инструкции при обычных условиях эффективно декодируются и исполняются с меньшими задержками) внедрение специальных техник для исправления зависания конвейера. Среди них: параллельное выполнение, буферизация и спекуляция. Микроархитектура выполняет инструкции динамически и беспорядочно, так что время, которое необходимое для выполнения каждой отдельной инструкции не всегда может быть определено. Обзор конвейера микроархитектуры I el e Burs Конвейер микроархитектуры I el e Burs состоит из: блока начальной загрузки упорядоченных команд беспорядочного суперскалярного исполнительного ядра блок изъятия упорядоченных команд Блок начальной загрузки поставляет инструкцию в программном порядке в беспорядочное ядро.
Западный научный центр АН Украины. 4 театра (в т. ч. театр оперы и балета). 12 музеев (в т. ч. музеи украинского искусства, народных архитектуры и быта, этнографии и художественных промыслов, картинная галерея., литературно-мемориальный музей И. Франко). Известен с 1256. С 14 в. в Польше, с 1772 в Австрии (название Лемберг). С 1918 в Польше, с 1939 в составе Украины. Кафедральный готический собор (14-15 вв.) с ренессансными капеллами Боимов и Кампианов (обе 17 в.), часовня Трех святителей (16 в.), "Черная каменица" (кон. 16 - нач. 17 вв.) в стиле Возрождения, барочные арсенал (18 в.), костелы бернардинцев (17 в.), иезуитов (17 в.), доминиканцев (18 в.), собор св. Юра (18 в.). ЛЬВОВ (Lwoff) Андре Мишель (р. 1902) - французский генетик и вирусолог, иностранный член АМН СССР (1967). Внес существенный вклад в развитие учения о латентных вирусных инфекциях, объяснил явление лизогении. Исследования Львова легли в основу теории регуляции синтеза белка Ф. Жакоба и Ж. Л. Моно. Нобелевская премия (1965, совместно с Жакобом и Моно)
1. Компьютер для чайников. Компьютер для начинающих (краткие сведения)
2. Архитектура персональных компьютеров IBM PC
3. Анализ структур, характеристик и архитектур 32-разрядных микропроцессоров
4. Краткая история появления параллелизма в архитектуре ЭВМ
5. Краткие сведения об IBM РС - совместимых компьютерах
9. Русская архитектура XVIII века
10. Архитектура г. Ростова-на-Дону
11. Русская архитектура XVII века
13. Особенности средневековой архитектуры
15. Архитектура Древнего Египта
16. Архитектура и мебель барокко
18. Редкие растения, краткая характеристика
21. Краткие лекции по истории политических и правовых учений (к зачету-тестированию)
25. Краткая характеристика культуры Древнего Египта
26. Египетские мотивы в архитектуре Санкт-Петербурга
28. Фадеев "Разгром". Анализ характеров героев. Краткое содержание романа
29. Краткая характеристика золотого века рок-музыки
30. Ленин (Ульянов) Владимир Ильич (краткая биография)
31. Суворов Александр Васильевич (краткая биография)
32. Краткая биография Жана Жака Руссо
33. Голодомор 32-33 років (голод на Украине в 32-33 гг.)
35. Архитектура Московского Кремля XIV-XVI вв. /с фотографиями/
36. Программные средства и приёмы работы на компьютере
37. Принципы работы системы управления параллельными процессами в локальных сетях компьютеров
42. Физические основы действия современных компьютеров
43. Архитектура ПК
44. Внешние устройства персонального компьютера
45. История компьютера и компьютерной техники
46. Управление звуковой картой компьютера
47. Использование компьютеров в управлении предприятием
48. Компьютер
49. Локальная шина персонального компьютера
50. Персональные компьютеры в медицинской практике
52. Разработка АРМ на основе персонального компьютера для дома
53. Базовая аппаратная конфигурация персонального компьютера
57. Типовые расчеты надежности систем на персональном компьютере
58. Синтез голографического изображения с помощью компьютера
59. Вычисление определённого интеграла с помощью метода трапеций на компьютере
60. Применение компьютера в туристической деятельности
62. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРОВ
63. Программное обеспечение персональных компьютеров
65. Расширения полей
66. Компьютер в современном офисе и его экологическая безопасность
67. Обучение детей школьного возраста на компьютерах
68. Компьютер как средство обучения
69. Югославия в 40-90х гг. Краткий обзор
73. Блок питания для компьютера, мощностью 350Вт, форм-фактор АТХ
74. Физические основы действия современных компьютеров
75. Хронологические схемы по истории философии: Философ, его взгяды (кратко)
76. Международные стандарты бухгалтерского учета (IAS)
77. История экономических учений (краткие ответы на вопросы)
78. Оптимальный поиск переносного компьютера (ноутбука) на рынке
79. Бизнес-план расширения производства мусоровозов на ОАО "Коммаш"
80. Расчет конкурентоспособности отечественных фирм, производящих компьютеры
81. Расширение объемов производства и ассортимента полиамидных текстурированых нитей
83. Очень краткая история Неаполитанского (Сицилийского) королевства
85. Краткий курс истории России
89. Краткий очерк истории Бразилии
90. Творец троичного компьютера
91. Роль систем счисления в истории компьютеров
94. Параллельные компьютеры и супер-ЭВМ
96. Использование компьютера для подготовки текста
97. Краткий курс развития вычислительной техники