Разработка программно-аппаратного
обеспечения информационных и
автоматизированных систем
Лекция 2. Архитектуры вычислительных систем
1
Классификация Флинна
– SISD (Single Instruction, Single Data)
– MISD (Multiple Instruction, Single Data)
– SIMD (Single Instruction, Multiple Data)
– MIMD (Multiple Instruction, Multiple Data)
2
Закон Амдала
3
• Предположим, что доля a в
вычислениях может быть
выполнена только
последовательно. Тогда для p
процессоров ускорение составит
Классификация параллельных архитектур
по Симе и Фонтейну
Параллельные
архитектуры
Параллелизм
уровня данных
Векторная
SIMD
Систолическая
Параллелизм
уровня функций
Параллелизм
уровня инструкций
VLIW
Суперскалярная
Параллелизм
уровня потоков
Параллелизм
уровня процессов
С распределенной
памятью
(мультикомпьютер)
С общей памятью
(мультипроцессор)
4
Процессор
5
Основные характеристики процессора
• по организации доступа к памяти: гарвардская или фоннеймановская архитектура, где гарвардская
архитектура подразумевает физически раздельные память инструкций и память данных, а в
архитектуре фон Неймана инструкции и данные хранятся в одном устройстве;
• разрядность данных, обрабатываемых в АЛУ;
• тактовая частота ( т.е. частота перемещения данных между компонентами процессора); эта частота в
общем случае не эквивалентна частоте преобразования данных;
• регистровая модель процессора – число и назначение регистров, их разрядность;
• система команд процессора – набор поддерживаемых инструкций, возможные операнды для них;
• показатель CPI (Cycles Per Instruction) – количество тактов для исполнения инструкций (обычно этот
параметр имеет индивидуальные значения для инструкций или их групп).
6
Процессор
Архитектура
системы команд
Микроархитектура
7
Пример характеристик CPU Intel Coffee Lake
Серия Количество ядер
(потоков)
Тактовая частота,
ГГц
Потребляемая
мощность
(«тепловой
пакет»), Вт
Core i9 6 (12) 2,1 – 4,0 35 - 95
Core i7 4 (8) 2,4 – 4,0 35 - 95
Core i5 4 (8) 1,7 – 3,6 35 – 95
Core i3 2 (4) 3,1 – 4,0 35 – 91
Pentium Gold 2 (4) 3,1 – 3,9 35 – 54
Celeron 2 (2) 2,9 – 3,2 35 - 54
8
GPU Nvidia
9
Характеристики GPU семейства RTX
компании Nvidia
GTX 1650 RTX 2060 RTX 2080 TITAN RTX
Ядер CUDA 896 1920 2944 4608
Тензорных ядер – 240 368 576
Кластеров
обработки графики
2 3 6 6
Производительност
ь FP64, GFLOPS
83,1 163,8 203,0 388,8
Производительност
ь тензорных ядер
INT8/INT4, TOPS
– 83,8/167,7 142,7/285,4 199,0/398,1
Потребляемая
мощность, Вт
75 160 215 280
10
Модуль Nvidia Jetson для встраиваемых
применений
• CUDA (Compute Unified Device
Architecture) позволяет
переносить часть вычислений
на GPU
11
Процессоры цифровой обработки сигналов
• Также «сигнальные процессор», DSP (Digital Signal Processor)
• Основная черта – наличие команды «умножение с накоплением»
(MAC, Multiply and Accumulate)
• TI C5000, C6000
• Analog Devices ADSP21xx, TigerSharc, BlackFin
12
Характеристики TI C6000
13
Нейросети
14
Варианты архитектур нейросетей
15
Нейроускоритель Google TPU
16
Микроконтроллеры
• МК (MCU) содержат в одном корпусе ядро
процессора, память и периферию
• Широкие диапазоны характеристик
• 8 бит, 4-8 МГц (Attiny, 8051)
• 32 бит, 24-200 МГц (Cortex-M)
• Встроенные модули АЦП, USB, UART, SPI
• Реже – контроллеры внешней памяти
• Накристальная память содержит flash для
программ и ОЗУ для данных
17
Пример средств разработки для МК
• Настройка аппаратного обеспечения
МК с помощью конфигуратора создает
наборы библиотек (C headers) с
константами, описывающими
периферийные устройства и базовым
набором функций для доступа к ним
• Разработка программного обеспечения
производится на базе IDE при условии
подключения созданных программных
компонентов
• Разработка программного обеспечения
существенно зависит от настройки
аппаратного обеспечения
18
Платформа Arduino
• Arduino не является процессором
или микроконтроллером
• Основа платформы –
управляющий модуль и
дополнительные платы
расширения (shield)
• Программирование на базе языка
Си, однако существенно
упрощена настройка
периферийных устройств
19
Пример периферийных устройств
• Набор датчиков с интерфейсом PMOD
• PMOD – 2 ряда по 6 выводов (2 вывода
питания, 2 вывода земли, 8 сигнальных
выводов)
• Нет универсального интерфейса, с
помощью форм-фактора PMOD могут
быть подключены различные варианты
устройств
20
Платформы на базе ПЛИС
• Zedboard – отладочная
плата на базе ПЛИС Zynq-
7000
• Alveo – ускоритель на базе
высокопроизводительной
FPGA Xilinx
• Модуль «Плеяда» (Россия)
на базе FPGA Xilinx
21
Многоядерные процессоры
• SW26010
• Тенденции:
• Кластерная организация
• Специализация
процессорных ядер
(требуется анализ
программного
обеспечения)
• Управляющие ядра ARM
22
Гетерогенные вычислительные системы.
• Гетерогенные («разнородные») системы предназначены для
задач с различными типами вычислительной нагрузки для
отдельных подзадач
• Пример: CPU + GPU – процессор общего назначения и
графический ускоритель для построения трехмерной графики
• Разновидности вспомогательных подсистем:
• DSP (сигнальный процессор)
• FPGA
• Сетевой процессор
23
Облачные и туманные вычисления
• Облачные вычисления (cloud computing) – передача данных на
сервер («в облако») для последующей обработки
• Туманные вычисления (fog computing) – предварительная
обработка собранных данных с целью уменьшения сетевого
трафика и обеспечения автономной реакции
24
Интернет вещей
• Internet of Things (IoT)
• Распределенные системы датчиков
(возможно, исполнительных устройств)
• Обязателен беспроводной интерфейс
• Интерфейсы с высокой скоростью и дальностью
передачи имеют высокое потребление энергии
• Может использоваться многозвенная
архитектура: маломощный беспроводной
интерфейс → концентратор → ПК (сеть)
25
Системы сбора данных.
• Интернет вещей может рассматриваться как подкласс систем сбора
данных
• Распределенные датчики (например, промышленная автоматика)
подключаются по беспроводным (см. IoT) или проводным
интерфейсам, образуя иерархию устройств
• Подсистема датчиков автомобиля (совокупности близко находящихся
автомобилей)
• Подсистема датчиков станка (цеха, предприятия)
• Подсистема датчиков «умного дома»
• Реализация – микроконтроллер с низким энергопотреблением
• Предварительная статистическая обработка, фильтрация данных, мониторинг
состояния
26
Выводы:
• Аппаратная архитектура вычислительного устройства находится в
тесной взаимосвязи с особенностями решаемых задач
• Различные классы задач требуют различных архитектур
вычислительных устройств
• Перспективными являются гетерогенные вычислительные
системы и разработка методов их проектирования
27

More Related Content

PDF
Лекция 5: Многопоточное программирование: часть 1 (Multithreading programming...
PDF
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
PDF
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
PPTX
Hpc 2.26.03.2013.
PDF
Лекция 9. Программирование GPU
PDF
Решения компании Cisco для обеспечения безопасности сетей операторов связи и ...
PDF
Архитектура и программирование потоковых многоядерных процессоров для научных...
Лекция 5: Многопоточное программирование: часть 1 (Multithreading programming...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Hpc 2.26.03.2013.
Лекция 9. Программирование GPU
Решения компании Cisco для обеспечения безопасности сетей операторов связи и ...
Архитектура и программирование потоковых многоядерных процессоров для научных...

Similar to Лекция 2 Разработка программно-аппаратного обеспечения информационных и автоматизированных систем.pptx (20)

PDF
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
PPTX
Обзор современных микроконтроллеров и их архитектур
PPTX
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
PPTX
Современные серверы DEPO Storm и системы хранения DEPO Storage
PPTX
Модульные промышленные ПК Advantech
PPTX
13.pptx
PPTX
Технические средства реализации информационных процессов
PPTX
Параллельное программирование на современных видеокартах
PDF
Новейшие серверные решения от Fujitsu и как они позволяют экономить
PPT
Смарт - Технологии, Взгляд Со Стороны Разработчика
PPT
Prez osob mikroproc
PPTX
Introduction to CUDA calculations with GPU
ODP
Virt2real - есть ли жизнь в железе?
PDF
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
PDF
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
PPTX
Опыт внедрения OpenStack
PDF
Cisco UCS полный обзор
PDF
Новейшие серверные решения от Fujitsu и как они позволяют экономить
PPTX
ARM vs Intel microarchitecture
PDF
ETegro: решения для ЦОД
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Обзор современных микроконтроллеров и их архитектур
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Современные серверы DEPO Storm и системы хранения DEPO Storage
Модульные промышленные ПК Advantech
13.pptx
Технические средства реализации информационных процессов
Параллельное программирование на современных видеокартах
Новейшие серверные решения от Fujitsu и как они позволяют экономить
Смарт - Технологии, Взгляд Со Стороны Разработчика
Prez osob mikroproc
Introduction to CUDA calculations with GPU
Virt2real - есть ли жизнь в железе?
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Опыт внедрения OpenStack
Cisco UCS полный обзор
Новейшие серверные решения от Fujitsu и как они позволяют экономить
ARM vs Intel microarchitecture
ETegro: решения для ЦОД
Ad

Лекция 2 Разработка программно-аппаратного обеспечения информационных и автоматизированных систем.pptx

  • 1. Разработка программно-аппаратного обеспечения информационных и автоматизированных систем Лекция 2. Архитектуры вычислительных систем 1
  • 2. Классификация Флинна – SISD (Single Instruction, Single Data) – MISD (Multiple Instruction, Single Data) – SIMD (Single Instruction, Multiple Data) – MIMD (Multiple Instruction, Multiple Data) 2
  • 3. Закон Амдала 3 • Предположим, что доля a в вычислениях может быть выполнена только последовательно. Тогда для p процессоров ускорение составит
  • 4. Классификация параллельных архитектур по Симе и Фонтейну Параллельные архитектуры Параллелизм уровня данных Векторная SIMD Систолическая Параллелизм уровня функций Параллелизм уровня инструкций VLIW Суперскалярная Параллелизм уровня потоков Параллелизм уровня процессов С распределенной памятью (мультикомпьютер) С общей памятью (мультипроцессор) 4
  • 6. Основные характеристики процессора • по организации доступа к памяти: гарвардская или фоннеймановская архитектура, где гарвардская архитектура подразумевает физически раздельные память инструкций и память данных, а в архитектуре фон Неймана инструкции и данные хранятся в одном устройстве; • разрядность данных, обрабатываемых в АЛУ; • тактовая частота ( т.е. частота перемещения данных между компонентами процессора); эта частота в общем случае не эквивалентна частоте преобразования данных; • регистровая модель процессора – число и назначение регистров, их разрядность; • система команд процессора – набор поддерживаемых инструкций, возможные операнды для них; • показатель CPI (Cycles Per Instruction) – количество тактов для исполнения инструкций (обычно этот параметр имеет индивидуальные значения для инструкций или их групп). 6
  • 8. Пример характеристик CPU Intel Coffee Lake Серия Количество ядер (потоков) Тактовая частота, ГГц Потребляемая мощность («тепловой пакет»), Вт Core i9 6 (12) 2,1 – 4,0 35 - 95 Core i7 4 (8) 2,4 – 4,0 35 - 95 Core i5 4 (8) 1,7 – 3,6 35 – 95 Core i3 2 (4) 3,1 – 4,0 35 – 91 Pentium Gold 2 (4) 3,1 – 3,9 35 – 54 Celeron 2 (2) 2,9 – 3,2 35 - 54 8
  • 10. Характеристики GPU семейства RTX компании Nvidia GTX 1650 RTX 2060 RTX 2080 TITAN RTX Ядер CUDA 896 1920 2944 4608 Тензорных ядер – 240 368 576 Кластеров обработки графики 2 3 6 6 Производительност ь FP64, GFLOPS 83,1 163,8 203,0 388,8 Производительност ь тензорных ядер INT8/INT4, TOPS – 83,8/167,7 142,7/285,4 199,0/398,1 Потребляемая мощность, Вт 75 160 215 280 10
  • 11. Модуль Nvidia Jetson для встраиваемых применений • CUDA (Compute Unified Device Architecture) позволяет переносить часть вычислений на GPU 11
  • 12. Процессоры цифровой обработки сигналов • Также «сигнальные процессор», DSP (Digital Signal Processor) • Основная черта – наличие команды «умножение с накоплением» (MAC, Multiply and Accumulate) • TI C5000, C6000 • Analog Devices ADSP21xx, TigerSharc, BlackFin 12
  • 17. Микроконтроллеры • МК (MCU) содержат в одном корпусе ядро процессора, память и периферию • Широкие диапазоны характеристик • 8 бит, 4-8 МГц (Attiny, 8051) • 32 бит, 24-200 МГц (Cortex-M) • Встроенные модули АЦП, USB, UART, SPI • Реже – контроллеры внешней памяти • Накристальная память содержит flash для программ и ОЗУ для данных 17
  • 18. Пример средств разработки для МК • Настройка аппаратного обеспечения МК с помощью конфигуратора создает наборы библиотек (C headers) с константами, описывающими периферийные устройства и базовым набором функций для доступа к ним • Разработка программного обеспечения производится на базе IDE при условии подключения созданных программных компонентов • Разработка программного обеспечения существенно зависит от настройки аппаратного обеспечения 18
  • 19. Платформа Arduino • Arduino не является процессором или микроконтроллером • Основа платформы – управляющий модуль и дополнительные платы расширения (shield) • Программирование на базе языка Си, однако существенно упрощена настройка периферийных устройств 19
  • 20. Пример периферийных устройств • Набор датчиков с интерфейсом PMOD • PMOD – 2 ряда по 6 выводов (2 вывода питания, 2 вывода земли, 8 сигнальных выводов) • Нет универсального интерфейса, с помощью форм-фактора PMOD могут быть подключены различные варианты устройств 20
  • 21. Платформы на базе ПЛИС • Zedboard – отладочная плата на базе ПЛИС Zynq- 7000 • Alveo – ускоритель на базе высокопроизводительной FPGA Xilinx • Модуль «Плеяда» (Россия) на базе FPGA Xilinx 21
  • 22. Многоядерные процессоры • SW26010 • Тенденции: • Кластерная организация • Специализация процессорных ядер (требуется анализ программного обеспечения) • Управляющие ядра ARM 22
  • 23. Гетерогенные вычислительные системы. • Гетерогенные («разнородные») системы предназначены для задач с различными типами вычислительной нагрузки для отдельных подзадач • Пример: CPU + GPU – процессор общего назначения и графический ускоритель для построения трехмерной графики • Разновидности вспомогательных подсистем: • DSP (сигнальный процессор) • FPGA • Сетевой процессор 23
  • 24. Облачные и туманные вычисления • Облачные вычисления (cloud computing) – передача данных на сервер («в облако») для последующей обработки • Туманные вычисления (fog computing) – предварительная обработка собранных данных с целью уменьшения сетевого трафика и обеспечения автономной реакции 24
  • 25. Интернет вещей • Internet of Things (IoT) • Распределенные системы датчиков (возможно, исполнительных устройств) • Обязателен беспроводной интерфейс • Интерфейсы с высокой скоростью и дальностью передачи имеют высокое потребление энергии • Может использоваться многозвенная архитектура: маломощный беспроводной интерфейс → концентратор → ПК (сеть) 25
  • 26. Системы сбора данных. • Интернет вещей может рассматриваться как подкласс систем сбора данных • Распределенные датчики (например, промышленная автоматика) подключаются по беспроводным (см. IoT) или проводным интерфейсам, образуя иерархию устройств • Подсистема датчиков автомобиля (совокупности близко находящихся автомобилей) • Подсистема датчиков станка (цеха, предприятия) • Подсистема датчиков «умного дома» • Реализация – микроконтроллер с низким энергопотреблением • Предварительная статистическая обработка, фильтрация данных, мониторинг состояния 26
  • 27. Выводы: • Аппаратная архитектура вычислительного устройства находится в тесной взаимосвязи с особенностями решаемых задач • Различные классы задач требуют различных архитектур вычислительных устройств • Перспективными являются гетерогенные вычислительные системы и разработка методов их проектирования 27