Архитектура HAWQ / Алексей Грищенко (Pivotal)

Архитектура
HAWQ
Грищенко Алексей

Кто я?
Enterprise Architect @ Pivotal
•  7 лет в задачах обработки данных
•  5 лет с MPP-системами
•  4 года с Hadoop
•  HAWQ - с первой beta
•  Отвечаю за архитектуру всех внедрений HAWQ и
Greenplum в EMEA
•  Spark contributor
•  http://0x0fff.com

О чем расскажу?
•  Что такое HAWQ

•  Зачем он нужен

•  Из каких компонент он состоит

•  Как он работает

•  Пример выполнения запроса

•  Пример выполнения запроса
•  Альтернативные решения

Что такое
•  Аналитический движок SQL-on-Hadoop

Что такое
•  HAdoop With Queries

Что такое
Postgres Greenplum HAWQ
2005
Fork
Postgres 8.0.2

Что такое
2005
Fork
Postgres 8.0.2
2009
Rebase
Postgres 8.2.15

Что такое
2005
Fork
Postgres 8.0.2
2009
Rebase
Postgres 8.2.15
2011 Fork
GPDB 4.2.0.0

Что такое
2005
Fork
Postgres 8.0.2
2009
Rebase
Postgres 8.2.15
2011 Fork
GPDB 4.2.0.0
2013
HAWQ 1.0.0.0

Что такое
2005
Fork
Postgres 8.0.2
2009
Rebase
Postgres 8.2.15
2011 Fork
GPDB 4.2.0.0
2013
HAWQ 1.0.0.0
HAWQ 2.0.0.0
Open Source
2015

HAWQ – это …
•  1’500’000 строк кода C и C++

HAWQ – это …
•  1’500’000 строк кода C и C++
–  Из которых 200’000 только в заголовочных файлах

HAWQ – это …
•  1’500’000 строк кода C и C++
•  180’000 строк кода Python

HAWQ – это …
•  1’500’000 строк кода C и C++
•  60’000 строк кода Java

HAWQ – это …
•  1’500’000 строк кода C и C++
•  23’000 строк Makefile’ов

HAWQ – это …
•  1’500’000 строк кода C и C++
•  7’000 строк shell-скриптов

HAWQ – это …
•  1’500’000 строк кода C и C++
•  Более 50 корпоративных клиентов

HAWQ – это …
•  1’500’000 строк кода C и C++
•  Более 50 корпоративных клиентов
–  Из них более 10 в EMEA

Apache HAWQ
•  Apache HAWQ (incubating) с 09’2015
–  http://hawq.incubator.apache.org
–  https://github.com/apache/incubator-hawq
•  Что находится в Open Source
–  Исходники версии HAWQ 2.0 альфа
–  Релиз HAWQ 2.0 бэта до конца 2015 года
–  Релиз HAWQ 2.0 GA в начале 2016
•  Сообщество еще только зарождается –
присоединяйтесь!

Зачем он нужен?
•  Универсальный SQL-интерфейс к данным
Hadoop для BI с ANSI SQL-92, -99, -2003

–  Пример из практики – запрос Cognos на 5000
строк с множеством оконных функций

•  Универсальный инструмент для ad hoc
аналитики

аналитики
–  Пример из практики – распарсить URL,
выдернув из него имя хоста и протокол

аналитики
•  Хорошая производительность

аналитики
•  Хорошая производительность
–  Сколько раз данные будут скинуты на HDD для
выполнения SQL-запроса в Hive?

Кластер с HAWQ
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
Сервер 6
Datanode
Сервер N
Datanode
Сервер 5
Datanode
interconnect
…

Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
Сервер 6
Datanode
Сервер N
Datanode
Сервер 5
Datanode
YARN NM YARN NM YARN NM
YARN RM
YARN App
Timeline
interconnect
…

HAWQ Master
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
HAWQ
Standby
Сервер 2
ZK JM
HAWQ Segment
Сервер 6
Datanode
HAWQ Segment
Сервер N
Datanode
HAWQ Segment
Сервер 5
Datanode
YARN RM
YARN App
Timeline
interconnect
…

Мастер Сервера
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
HAWQ Segment
Сервер 6
Datanode
HAWQ Segment
Сервер N
Datanode
HAWQ Segment
Сервер 5
Datanode
YARN RM
YARN App
Timeline
interconnect
…
HAWQ Master
HAWQ
Standby

Мастер Сервера
HAWQ Master
Парсер
запросов
Оптимизатор
запросов
Глобальный
менеджер
ресурсов
Менеджер
транзакций
Диспетчер
процессов
Каталог
метаданных
HAWQ Standby Master
Парсер
запросов
запросов
Глобальный
менеджер
ресурсов
Менеджер
транзакций
Диспетчер
процессов
Каталог
метаданных
WAL
репл.

HAWQ Master
HAWQ
Standby
Сегменты
Сервер 1
SNameNode
Сервер 4
ZK JM
NameNode
Сервер 3
ZK JM
Сервер 2
ZK JM
Сервер 6
Datanode
Сервер N
Datanode
Сервер 5
Datanode
YARN RM
YARN App
Timeline
interconnect
HAWQ Segment HAWQ Segment HAWQ Segment …

Сегменты
HAWQ Segment
Движок выполнения
запросов
libhdfs3
Расширения PXF
HDFS Datanode
Локальная ФС
Директория для
временных данных
Логи
YARN Node Manager

Метаданные
•  Структура аналогична структуре каталога
Postgres

Postgres
•  Статистика

Postgres
–  Количество записей и страниц в таблице

Postgres
–  Наиболее частые значения для каждого поля

Postgres
–  Гистограмма для каждого числового поля

Postgres
–  Количество уникальных значений в поле

Postgres
–  Количество null значений в поле

Postgres
–  Количество null значений в поле
–  Средний размер значения поля в байтах

Статистика
Без статистики
Join двух таблиц, сколько записей в результате?

ü  От 0 до бесконечности

Количество строк
Join двух таблиц по 1000 записей в каждой, сколько
записей в результате?

ü  От 0 до 1’000’000

Гистограммы и MCV
ü  От 0 до 1’000’000
Join двух таблиц по 1000 записей в каждой, с известной
кардинальностью, гистограммой распределения,
наиболее частыми значениями, количеством null?

Гистограммы и MCV
ü  От 0 до 1’000’000
Join двух таблиц по 1000 записей в каждой, с известной
кардинальностью, гистограммой распределения,
наиболее частыми значениями, количеством null?
ü  ~ От 500 до 1’500

•  Информация о структуре таблицы
ID Name Num Price
1 Яблоко 10 50
2 Груша 20 80
3 Банан 40 40
4 Апельсин 25 50
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
8 Ананас 35 90

–  Поля распределения
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
hash(ID)

–  Количество hash bucket распределения
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
hash(ID)
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100

–  Партиционирование (hash, list, range)
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100
hash(ID)
ID Name Num Price
2 Груша 20 80
3 Банан 40 40
5 Киви 5 120
6 Арбуз 20 30
7 Дыня 40 100

•  Общие метаданные
–  Пользователи и группы

–  Права доступа к объектам

–  Права доступа к объектам
•  Хранимые процедуры
–  PL/pgSQL, PL/Java, PL/Python, PL/Perl, PL/R

Оптимизатор Запросов
•  Используется cost-based оптимизатор

•  Выбрать можно один из двух

–  Planner – модифицированный оптимизатор
Postgres

Postgres
–  ORCA (Pivotal Query Optimizer) – разработан
специально для HAWQ

Postgres
•  Хинты оптимизатора работают как в Postgres

Postgres
–  Включить/отключить определенную операцию

Postgres
–  Включить/отключить определенную операцию
–  Изменить веса базовых операций

Формат Хранения
Какой формат хранения данных является
наиболее оптимальным?

ü  Зависит от того, что является для вас
критерием оптимальности

–  Минимальное потребление ресурсов CPU

–  Минимальный объем занимаемого дискового пр-ва

–  Минимальное время извлечения записи по ключу

–  Минимальное время извлечения подмножества
столбцов таблицы

–  Минимальное время извлечения подмножества
столбцов таблицы
–  что-то другое?

•  Построчное хранение
–  «Обрезанный» формат postgres
•  Без toast
•  Без ctid, xmin, xmax, cmin, cmax

•  Построчное хранение
–  «Обрезанный» формат postgres
•  Без toast
•  Без ctid, xmin, xmax, cmin, cmax
–  Сжатие
•  Без сжатия
•  Quicklz
•  Zlib уровни 1 - 9

•  Apache Parquet
–  Поколоночное хранение блоков
последовательных строк (“row group”)

–  Сжатие
•  Snappy
•  Gzip уровни 1 – 9

–  Сжатие
•  Snappy
•  Gzip уровни 1 – 9
–  Размер “row group” и страницы задается для
каждой таблицы отдельно

Разделение Ресурсов
•  Два основных варианта

–  Независимое разделение – HAWQ и YARN не
знают друг о друге

–  YARN – HAWQ запрашивает выделение
ресурсов у менеджера ресурсов YARN

•  Гибкая утилизация кластера
–  Запрос может выполняться на части нод

–  Запрос может иметь несколько потоков
исполнения на каждой из нод

–  Запрос может иметь несколько потоков
исполнения на каждой из нод
–  Желаемый параллелизм можно задать вручную

•  Пулы ресурсов (Resource Queue) задают

–  Количество параллельных запросов

–  Приоритет на использование CPU

–  Лимит по памяти

–  Лимит по ядрам CPU

–  MIN/MAX потоков исполнения в целом по системе

–  MIN/MAX потоков исполнения на каждой ноде

–  MIN/MAX потоков исполнения на каждой ноде
•  Задаются для пользователя или группы

Внешние Данные
•  PXF
–  Фреймворк для доступа к внешним данным
–  Легко расширяется, многие пишут свои плагины
–  Официальные плагины: CSV, SequenceFile,
Avro, Hive, HBase
–  Open Source плагины: JSON, Accumulo,
Cassandra, JDBC, Redis, Pipe

Внешние Данные
•  PXF
–  Фреймворк для доступа к внешним данным
–  Легко расширяется, многие пишут свои плагины
–  Официальные плагины: CSV, SequenceFile,
Avro, Hive, HBase
–  Open Source плагины: JSON, Accumulo,
Cassandra, JDBC, Redis, Pipe
•  HCatalog
–  HAWQ видит таблицы из HCatalog как свои
внутренние таблицы

Жизненный Цикл Запроса
HAWQ Master
Менедж. тр-й
Парсер Опт. запросов
Диспетч. проц.
Менедж. рес-ов
NameNode
Сервер 1
Локальная директория
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM Движок
Ресурсы Подготовка Исполнение Результат Завершение План

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
ScanBars
b
HashJoinb.name = s.bar
ScanSells
s
Filterb.city ='San Francisco'
Projects.beer, s.price
MotionGather
MotionRedist(b.name)

План
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
Подготовка Исполнение Результат Завершение Ресурсы

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
Нужно 5 контейнеров
Каждый по 1 ядру
и 256 MB RAM
План Подготовка Исполнение Результат Завершение Ресурсы

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
и 256 MB RAM
Сервер 1: 2 контейнера
Сервер 2: 1 контейнер
Сервер N: 2 контейнера

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
и 256 MB RAM
QE QE QE QE QE

Ресурсы
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
План Исполнение Результат Завершение Подготовка

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
Ресурсы План Исполнение Результат Завершение Подготовка

Подготовка
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
Ресурсы План Результат Завершение Исполнение

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
Подготовка Ресурсы План Результат Завершение Исполнение

Исполнение
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
Подготовка Ресурсы План Завершение Результат

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
ScanBars
b
ScanSells
s
MotionGather
Исполнение Подготовка Ресурсы План Завершение Результат

Результат
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
Исполнение Подготовка Ресурсы План Завершение

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
Освобождаем
Результат Исполнение Подготовка Ресурсы План Завершение

HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM
QE
Движок
QE QE QE QE QE
Ок
Освобождаем
Результат Исполнение Подготовка Ресурсы План Завершение

Завершение
HAWQ Master
NameNode
Сервер 1
HAWQ Segment
Движок
HDFS Datanode
Сервер 2
HAWQ Segment
Движок
HDFS Datanode
Сервер N
HAWQ Segment
Движок
HDFS Datanode
YARN RM Движок
Результат Исполнение Подготовка Ресурсы План

Скорость
•  Данные не приземляются на диск без
необходимости

Скорость
•  Данные не буферизируются на сегментах без

Скорость
•  Данные передаются между нодами по UDP

Скорость
•  Хороший стоимостной оптимизатор запросов

Скорость
•  Оптимальность кода на C++

Скорость
•  Оптимальность кода на C++
•  Гибкая настройка параллелизма

Альтернативы
Hive SparkSQL Impala HAWQ

ANSI SQL

ANSI SQL
Встроенные языки

ANSI SQL
Нагрузка на диски

ANSI SQL
Параллелизм

ANSI SQL
Дистрибутивы

ANSI SQL
Стабильность

ANSI SQL
Стабильность
Сообщество

Задачи
•  Интеграция с AWS и S3

Задачи
•  Интеграция с Mesos

Задачи
•  Улучшение интеграции с Ambari

Задачи
•  Интеграция с дистрибутивами Cloudera,
MapR, IBM

Задачи
•  Интеграция с дистрибутивами Cloudera,
MapR, IBM
•  Сделать самый быстрый и удобный движок
SQL-on-Hadoop

Заключение
•  Современный движок SQL-on-Hadoop
•  Для анализа структурированных данных
•  Объединяет в себе лучшие качества
альтернативных решений
•  Новичок среди open source
•  Community на стадии зарождения
Присоединяйтесь!

Вопросы
Apache HAWQ
http://hawq.incubator.apache.org
dev@hawq.incubator.apache.org
user@hawq.incubator.apache.org
Связь со мной: http://0x0fff.com

Архитектура HAWQ / Алексей Грищенко (Pivotal)

More Related Content

What's hot (20)

Viewers also liked (20)

Similar to Архитектура HAWQ / Алексей Грищенко (Pivotal) (20)

More from Ontico (20)

Архитектура HAWQ / Алексей Грищенко (Pivotal)