Машинное обучение
для интеллектуализации
ваших приложений
ZZ Photo Артем Чернодуб
Искусственный интеллект
1997 2001 2029 2035
Источники:
• к/ф «Космическая одиссея 2001 года», 1968, реж. С. Кубрик
• к/ф «Терминатор», 1984, реж. Д. Кэмерон
• к/ф «Я, робот», 2004, реж. А. Пройас
2 / 40
Нейронауки
Биологически-инспирированные
модели
Машинное обучение
3 / 40
Машинное обучение
• синтез алгоритмов из представленных данных,
«обучающей выборки»
• эффективность работы синтезированного
алгоритма как главная мера качества
• круг задач искусственного интеллекта
• математика как базовая научная дисциплина
(теория вероятности, случайные процессы,
математическая статистика)
4 / 40
Виды машинного обучения
• регрессия (regression)
• классификация (classification)
• кластеризация (clusterization)
• обучение с подкреплением (reinforcement
learning)
• эволюционные алгоритмы (evolutionary
algorithms)
5 / 40
Регрессия – данные
x y
0.00 0.00
0.10 0.59
0.20 0.95
0.30 0.95
0.40 0.59
0.50 0.00
0.60 -0.59
0.70 -0.59
0.80 -0.95
0.90 1.00
6 / 40
Регрессия – решения
7 / 40
Классификация – ирисы Фишера
Iris versicolorIris setosa Iris virginica
8 / 40
Классификация – данные
Длина
чашелистника
Ширина
чашелистника
Длина
лепестка
Ширина
лепестка
Вид ириса
4.3 3.0 1.1 0.1 setosa
4.4 2.9 1.4 0.2 setosa
4.4 3.0 1.3 0.2 setosa
…
4.9 2.5 4.5 1.7 virginica
5.6 2.8 4.9 2.0 virginica
…
5.0 2.0 3.5 1.0 versicolor
5.1 2.5 3.3 1.1 versicolor
9 / 40
Классификация – решение
10 / 40
Кластеризация
число классов заранее неизвестно
11 / 40
Кластеризация – решения
12 / 40
Распознавание текста
13 / 40
Распознавание лиц
14 / 40
Детекция морд котов
15 / 40
Дополненная реальность
16 / 40
Распознавание звука
• распознавание
звуковых команд
• распознавание
музыкальных жанров
• распознавание
названий песен
• синтез новой музыки
17 / 40
Обработка естественных текстов
• системы машинного перевода
• рекомендательные системы он-лайн
магазинов
• таргетирование рекламы в поисковых
системах
• распознавание спама
18 / 40
Биометрическая аутентификация
Разрешение доступа по:
• отпечаткам пальцев
• радужной оболочке глаза
• клавиатурному почерку
• тембру голоса
• рукописному почерку
• геометрии руки
19 / 40
и т.д.
20 / 40
Мы живем в мире Big Data
Данные для компьютеров:
• в 2006 году было создано
и сохранено 160 эксабайт
(160х1018) информации
• в 2010 году было создано
и сохранено 1 зетабайт
(1021) информации
Пример: рост количества
цифровых фото
21 / 40
Алгоритмы регрессии
• Линейная регрессия (Linear Regression)
• Многослойные персептроны (Multilayer
Perceptron)
• RBF-нейросети (Radial Basis Function Networks)
• Машины опорных векторов для регресии (Support
Vector Regression, SVR)
22 / 40
Алгоритмы классификации
• k ближайших соседей (k-Nearest Neighbours)
• Нейронные сети (Neural Networks = MLP & RBF)
• Машины опорных векторов (Support Vector
Machines)
• Деревья решений (бустинг)
23 / 40
Алгоритмы кластеризации
• k средних (k-Means)
• Иерархическая кластеризация (Hierarhical
Clustering)
• Самоорганизующиеся карты Кохонена (Self-
Organizing Maps)
• Гауссовские смешанные модели (Gaussian
Mixture Models)
24 / 40
Некоторые алгоритмы для
предобработки данных
• общие, проблемно-независимые – PCA, LDA,
Kernel PCA
• для изображений – SIFT, SURF, CHoG, Zernike
Moments, Wavelets
• для звука – DFT, FFT, Mel cepstra, Wavelets
• для текста – ITF-DF, N-grams
25 / 40
Некоторые прикладные пакеты для
машинного обучения
• OpenCV – библиотека средств машинного
зрения.
• PythonXY – пакет «все-в-1» популярных методов
машинного обучения.
• LibSVM – надежная кросс-платфроменная.
библиотека машин опорных векторов.
• NetLab – библиотека «обычных» нейронных
сетей.
• Theano – библиотека глубоких нейронных сетей.
26 / 40
Тезис
Машинное обучение – это технология, требующая
специального подхода.
27 / 40
Правило № 1
Если есть возможность не использовать машинное
обучение – не используйте его.
28 / 40
Правило № 2
Не изобретайте велосипед.
29 / 40
Правило № 3
Тестируйте качество вашего алгоритма на
опубликованных бенчмарках.
30 / 40
Правило № 4
Данные для обучения должны быть
репрезентативными.
31 / 40
Правило № 5
Делите выборку на Train, Test и Validation.
Train Test Validation
32 / 40
Правило № 6
Сложность выбранной эмпирической модели должна
быть адекватна сложности задачи.
33 / 40
Правило № 7
Применяйте регуляризацию.
34 / 40
Правило № 8
• нормируйте данные;
• центрируйте данные;
• в случае классификации, перемешивайте выборку.
35 / 40
Правило № 9
Не нужно дообучать синтезированные эмпирические
модели в режиме реального времени.
36 / 40
Правило № 10
Обучайте модели в MATLAB, Python и подобных
дружественных средах.
37 / 40
Литература
1. С. Осовский. Нейронные сети для обработки
информации – пер. с польского. М.: Финансы и
статистика, 2002. – 344с.
2. Bishop C.M. Pattern Recognition and Machine
Learning. Springer, 2006 – 738 p.
3. С. Хайкин. Нейронные сети: полный курс.
Вильямс, 2006.
38 / 40
Машинное обучение: перенос
ответственности за работу
алгоритма с программиста
на данные
39 / 40
… однажды.

More Related Content

PDF
Вебинар: Введение в машинное обучение
PDF
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
PDF
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)
PDF
Тот день, когда аноны с 4chan затроллили разведывательные агентства и мировые...
PDF
Введение в машинное обучение
PDF
Thankscap by looi
PPT
Искусственные нейронные сети
PDF
Сверточные нейронные сети
Вебинар: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Нейронные сети: практическое применение / Наталия Ефремова (NTechLab)
Тот день, когда аноны с 4chan затроллили разведывательные агентства и мировые...
Введение в машинное обучение
Thankscap by looi
Искусственные нейронные сети
Сверточные нейронные сети

Viewers also liked (15)

PPTX
Hейронные сети на практике — R&D, Azoft
PDF
К.В. Воронцов "Нейронные сети (продолжение)"
PDF
Введение в искусственные нейронные сети
PDF
Лекция №13 "Глубокие нейронные сети"
PPTX
Deep learning: Тооцоолон бодох машиныг яаж зураг ойлгодог болгох вэ?
PPT
Prospects of Information Technologies
PDF
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
ODP
Руководство по обучению сверточной нейронной сети для поиска ключевых точек о...
PDF
Погружение в Deep Learning
PDF
Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT / Ма...
PPT
Laringe y Cuerdas Vocales
PDF
2016 Future of Open Source Survey Results
PDF
2015 Upload Campaigns Calendar - SlideShare
PPTX
What to Upload to SlideShare
PDF
Getting Started With SlideShare
Hейронные сети на практике — R&D, Azoft
К.В. Воронцов "Нейронные сети (продолжение)"
Введение в искусственные нейронные сети
Лекция №13 "Глубокие нейронные сети"
Deep learning: Тооцоолон бодох машиныг яаж зураг ойлгодог болгох вэ?
Prospects of Information Technologies
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
Руководство по обучению сверточной нейронной сети для поиска ключевых точек о...
Погружение в Deep Learning
Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT / Ма...
Laringe y Cuerdas Vocales
2016 Future of Open Source Survey Results
2015 Upload Campaigns Calendar - SlideShare
What to Upload to SlideShare
Getting Started With SlideShare
Ad

Similar to Машинное обучение для интеллектуализации ваших приложений (20)

PDF
Введение в машинное обучение
PDF
#АналитикаРешает - обзорная лекция про аналитику
PPTX
Машинное обучение в электронной коммерции — практика использования и подводны...
PDF
Машинное и глубокое обучение
PDF
Deep learning: technology overview and trends
PDF
Блеск и нищета современного ИИ, из истории кибернетики в СССР, философия ИИ -...
PDF
Machine Learning introdaction in biology
PDF
Introduction to Data Science
PDF
SECON'2014 - Андрей Устюжанин - Маленькие секреты больших данных
PDF
2017-05-06 02 Илья Сиганов. Зачем учить машины?
PDF
Зачем учить машины?
PPTX
Vvedenie-v-iskusstvennyj-intellekt.(ppt)
PPTX
Machine Learning introdaction Превращение данных в знания
PPTX
Презентация _Системы искусственного интеллекта и машинного обучения_ (11 клас...
PDF
Машинное обучение в электронной коммерции - практика использования и подводны...
PPTX
Deep Learning Course Introduction
PPTX
Artificial Intelligence (lecture for schoolchildren) [rus]
PPT
Ai v3
PPTX
Machine Learning as a Service
PPTX
Machine learning with Python / Олег Шидловский / Doist [Python Meetup 27.03.15]
Введение в машинное обучение
#АналитикаРешает - обзорная лекция про аналитику
Машинное обучение в электронной коммерции — практика использования и подводны...
Машинное и глубокое обучение
Deep learning: technology overview and trends
Блеск и нищета современного ИИ, из истории кибернетики в СССР, философия ИИ -...
Machine Learning introdaction in biology
Introduction to Data Science
SECON'2014 - Андрей Устюжанин - Маленькие секреты больших данных
2017-05-06 02 Илья Сиганов. Зачем учить машины?
Зачем учить машины?
Vvedenie-v-iskusstvennyj-intellekt.(ppt)
Machine Learning introdaction Превращение данных в знания
Презентация _Системы искусственного интеллекта и машинного обучения_ (11 клас...
Машинное обучение в электронной коммерции - практика использования и подводны...
Deep Learning Course Introduction
Artificial Intelligence (lecture for schoolchildren) [rus]
Ai v3
Machine Learning as a Service
Machine learning with Python / Олег Шидловский / Doist [Python Meetup 27.03.15]
Ad

More from PAY2 YOU (6)

PDF
PAY2YOU
PDF
PAY2YOU
PPTX
Details of Lazy Deep Learning for Images Recognition in ZZ Photo app
PDF
ZZ Photo product review
PPTX
ZZ Photo
PDF
ZZ Photo
PAY2YOU
PAY2YOU
Details of Lazy Deep Learning for Images Recognition in ZZ Photo app
ZZ Photo product review
ZZ Photo
ZZ Photo

Машинное обучение для интеллектуализации ваших приложений