SlideShare a Scribd company logo
Introduction to Machine Learning
Dmitry Petukhov,
Machine Learning Consultant, Microsoft Most Valuable AI Professional
&& Coffee Addicted
#AI #MachineLearning
AI vs ML vs DL
Artificial Intelligence
Machine Learning
Deep Learning
Source: deeplearningbook.org
AI: Current State
Picture credit: McKinsey&Company, 2017
Credit Portfolio Risk
Personalized
Product Offering
Real-timeBatch Processing
Processing Speed
Volume
Pbytes
Tbytes
Gbytes
Structured
data
Semi-structured
Unstructured
Customer Loyalty &
Marketing
Fraud Detection &
Security
Credit Scoring
Compliance &
Regulatory Reporting
Operational Efficiencies
Customer Segmentation
Voice identity, Chat-bots,
Person Financial Manager
Anti money laundering
AI: Retail Banking Cases
Brand Sentiment
Analysis
Social Network Analysis
Picture credit: slideshare.net
AI: How it works?
Разделы машинного обучения
Типовые ML-задачи:
 Обучение с учителем (supervised learning)
 Обучение без учителя (unsupervised learning)
 Обучение с частичным привлечением учителя (semi-supervised learning)
 Обучение с подкреплением (reinforcement learning)
Picture credit: lakshaysuri.wordpress.com
Классы алгоритмов
Picture credit: towardsdatascience.com
Обучение с учителем
 Обучение с учителем (supervised learning)
 Классификация (classification)
 Логистическая регрессия
 Деревья решений
 Ансамбли деревьев
 Нейросети
 Машина опорных векторов
 k-NN
 ...
 Регрессия (regression)
 Линейная регрессия
 Деревья решений
 Ансамбли деревьев
 Нейросети
 ...
 Обучение без учителя (unsupervised learning)
 Кластеризация (clustering)
 Уменьшение размерности (dimensionality reduction)
 Обучение с частичным привлечением учителя
(semi-supervised learning)
 Обучение с подкреплением (reinforcement learning)
Linear Regression vs SVM vs Trees
Picture credit: towardsdatascience.com
Linear regression
Support Vector Machine
Decision Trees
Find Neural Network
Picture credit: towardsdatascience.com
Оценка модели: регрессия
Pictures credit: wikipedia.org
Оценка модели: классификация
Pictures credit: wikipedia.org
True-positive, TP — пациент болен раком, диагноз положительный.
False-positive, FP — пациент здоров, диагноз положительный.
True-negative, TN — пациент здоров, диагноз отрицательный.
False-negative, FN — пациент болен раком, диагноз отрицательный.
Accuracy (аккуратность) — процент верных предсказаний.
Recall (полнота) — процент больных, которых мы нашли, из всех больных.
Precision (точность) — процент здоровых из тех, кого мы определили, как больного.
F-score (F-мера) — гармоническое среднее Precision и Recall.
Обучение без учителя
 Обучение с учителем (supervised learning)
 Классификация (classification)
 Регрессия (regression)
 Обучение без учителя (unsupervised learning)
 Кластеризация (clustering)
 K-means (K-means++, K-means||)
 Иерархическая кластеризация
 Кластеризация на основе распределений (EM-алгоритм)
 Кластеризация на основе плотности (DBSCAN)
 …
 Уменьшение размерности (dimensionality reduction)
 Метод главных компонент (PCA)
 Метод независимых компонент (ICA)
 t-distributed stochastic neighbor embedding (t-SNE)
 Автоэнкодеры
 …
 Обучение с частичным привлечением учителя
(semi-supervised learning)
 Обучение с подкреплением (reinforcement learning)
Pictures credit: scikit-learn.sourceforge.net and visiondummy.com
Как выбрать?
Важны:
Обучающаяся выборка:
 количество наблюдений;
 количество признаков.
Признаки:
 наличие выбросов;
 наличие пропущенных значений;
 характер распределения;
 необходимость нормализации;
 мультиколлинеарность признаков.
Целевая переменная:
 линейная разделимость классов;
 возможность экстраполировать.
Модель:
 интерпретируемость;
 скорость обучения.
Picture credit: www.azure.com/ai
Microsoft AI Platform
…or Amazon Web Services, Google Cloud Platform, Яндекс.Облако
Data Azure Machine Learning Consumers
Cloud storage
Business problem Modeling Business valueDeployment
Model
REST API
Manage
Local storage
Source: Microsoft Data Amp 2017
ML Studio
Web IDE + ML runtime
ML Web Services
ML-model publication
Azure AI Gallery
Data
Experiment
Demo
library(Quandl)
library(dplyr)
library(forecast)
dt <- Quandl("BCHARTS/BITBAYUSD", api_key = ******) %>%
select(Date, Close)
dt.train <- dt %>% filter(Date < max(Date) - months(3))
dt.test <- dt %>% filter(Date > max(dt.train$Date))
timeseries <- ts(dt.train$Close, frequency = 1)
model <- ets(timeseries)
© 2018, Dmitry Petukhov. CC BY-SA 4.0 license. Microsoft and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.
Thank you!
Download presentation from
http://0xcode.in/machine-learning-intro or
Q&A
Now or later (see contacts below)
Stay connected
Befriend at the Facebook/@codezombie
Read me at the Habr/@codezombie
All contacts on http://0xCode.in/@codez0mb1e

More Related Content

PDF
Введение в машинное обучение
Grigory Sapunov
 
PPTX
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...
Ontico
 
PPTX
Нейронечёткая классификация слабо формализуемых данных | Тимур Гильмуллин
Positive Hack Days
 
PPT
Лекция 8
Ivan Stolyarov
 
PPTX
Introduction to Auto ML
Dmitry Petukhov
 
PPTX
Intelligent Banking: AI cases in Retail and Commercial Banking
Dmitry Petukhov
 
PPTX
IaaS, PaaS, and DevOps for Data Scientist
Dmitry Petukhov
 
Введение в машинное обучение
Grigory Sapunov
 
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...
Ontico
 
Нейронечёткая классификация слабо формализуемых данных | Тимур Гильмуллин
Positive Hack Days
 
Лекция 8
Ivan Stolyarov
 
Introduction to Auto ML
Dmitry Petukhov
 
Intelligent Banking: AI cases in Retail and Commercial Banking
Dmitry Petukhov
 
IaaS, PaaS, and DevOps for Data Scientist
Dmitry Petukhov
 

More from Dmitry Petukhov (12)

PPTX
Introduction to Deep Learning
Dmitry Petukhov
 
PPTX
Microsoft Machine Learning Server. Architecture View
Dmitry Petukhov
 
PPTX
AI in IoT: Use Cases and Challenges
Dmitry Petukhov
 
PPTX
Azure Machine Learning
Dmitry Petukhov
 
PPTX
Machine Intelligence for Fraud Prediction
Dmitry Petukhov
 
PPTX
Machine Learning with Microsoft Azure
Dmitry Petukhov
 
PPTX
Democratizing Artificial Intelligence
Dmitry Petukhov
 
PPTX
AI for Retail Banking
Dmitry Petukhov
 
PPTX
R + Apache Spark
Dmitry Petukhov
 
PPTX
Introduction to R
Dmitry Petukhov
 
PPTX
Microsoft Azure + R
Dmitry Petukhov
 
PPTX
Machine Learning in Microsoft Azure
Dmitry Petukhov
 
Introduction to Deep Learning
Dmitry Petukhov
 
Microsoft Machine Learning Server. Architecture View
Dmitry Petukhov
 
AI in IoT: Use Cases and Challenges
Dmitry Petukhov
 
Azure Machine Learning
Dmitry Petukhov
 
Machine Intelligence for Fraud Prediction
Dmitry Petukhov
 
Machine Learning with Microsoft Azure
Dmitry Petukhov
 
Democratizing Artificial Intelligence
Dmitry Petukhov
 
AI for Retail Banking
Dmitry Petukhov
 
R + Apache Spark
Dmitry Petukhov
 
Introduction to R
Dmitry Petukhov
 
Microsoft Azure + R
Dmitry Petukhov
 
Machine Learning in Microsoft Azure
Dmitry Petukhov
 
Ad

Introduction to Machine Learning

  • 1. Introduction to Machine Learning Dmitry Petukhov, Machine Learning Consultant, Microsoft Most Valuable AI Professional && Coffee Addicted #AI #MachineLearning
  • 2. AI vs ML vs DL Artificial Intelligence Machine Learning Deep Learning Source: deeplearningbook.org
  • 3. AI: Current State Picture credit: McKinsey&Company, 2017
  • 4. Credit Portfolio Risk Personalized Product Offering Real-timeBatch Processing Processing Speed Volume Pbytes Tbytes Gbytes Structured data Semi-structured Unstructured Customer Loyalty & Marketing Fraud Detection & Security Credit Scoring Compliance & Regulatory Reporting Operational Efficiencies Customer Segmentation Voice identity, Chat-bots, Person Financial Manager Anti money laundering AI: Retail Banking Cases Brand Sentiment Analysis Social Network Analysis
  • 6. Разделы машинного обучения Типовые ML-задачи:  Обучение с учителем (supervised learning)  Обучение без учителя (unsupervised learning)  Обучение с частичным привлечением учителя (semi-supervised learning)  Обучение с подкреплением (reinforcement learning) Picture credit: lakshaysuri.wordpress.com
  • 8. Picture credit: towardsdatascience.com Обучение с учителем  Обучение с учителем (supervised learning)  Классификация (classification)  Логистическая регрессия  Деревья решений  Ансамбли деревьев  Нейросети  Машина опорных векторов  k-NN  ...  Регрессия (regression)  Линейная регрессия  Деревья решений  Ансамбли деревьев  Нейросети  ...  Обучение без учителя (unsupervised learning)  Кластеризация (clustering)  Уменьшение размерности (dimensionality reduction)  Обучение с частичным привлечением учителя (semi-supervised learning)  Обучение с подкреплением (reinforcement learning)
  • 9. Linear Regression vs SVM vs Trees Picture credit: towardsdatascience.com Linear regression Support Vector Machine Decision Trees
  • 10. Find Neural Network Picture credit: towardsdatascience.com
  • 12. Оценка модели: классификация Pictures credit: wikipedia.org True-positive, TP — пациент болен раком, диагноз положительный. False-positive, FP — пациент здоров, диагноз положительный. True-negative, TN — пациент здоров, диагноз отрицательный. False-negative, FN — пациент болен раком, диагноз отрицательный. Accuracy (аккуратность) — процент верных предсказаний. Recall (полнота) — процент больных, которых мы нашли, из всех больных. Precision (точность) — процент здоровых из тех, кого мы определили, как больного. F-score (F-мера) — гармоническое среднее Precision и Recall.
  • 13. Обучение без учителя  Обучение с учителем (supervised learning)  Классификация (classification)  Регрессия (regression)  Обучение без учителя (unsupervised learning)  Кластеризация (clustering)  K-means (K-means++, K-means||)  Иерархическая кластеризация  Кластеризация на основе распределений (EM-алгоритм)  Кластеризация на основе плотности (DBSCAN)  …  Уменьшение размерности (dimensionality reduction)  Метод главных компонент (PCA)  Метод независимых компонент (ICA)  t-distributed stochastic neighbor embedding (t-SNE)  Автоэнкодеры  …  Обучение с частичным привлечением учителя (semi-supervised learning)  Обучение с подкреплением (reinforcement learning) Pictures credit: scikit-learn.sourceforge.net and visiondummy.com
  • 14. Как выбрать? Важны: Обучающаяся выборка:  количество наблюдений;  количество признаков. Признаки:  наличие выбросов;  наличие пропущенных значений;  характер распределения;  необходимость нормализации;  мультиколлинеарность признаков. Целевая переменная:  линейная разделимость классов;  возможность экстраполировать. Модель:  интерпретируемость;  скорость обучения.
  • 15. Picture credit: www.azure.com/ai Microsoft AI Platform …or Amazon Web Services, Google Cloud Platform, Яндекс.Облако
  • 16. Data Azure Machine Learning Consumers Cloud storage Business problem Modeling Business valueDeployment Model REST API Manage Local storage Source: Microsoft Data Amp 2017 ML Studio Web IDE + ML runtime ML Web Services ML-model publication Azure AI Gallery Data Experiment
  • 17. Demo library(Quandl) library(dplyr) library(forecast) dt <- Quandl("BCHARTS/BITBAYUSD", api_key = ******) %>% select(Date, Close) dt.train <- dt %>% filter(Date < max(Date) - months(3)) dt.test <- dt %>% filter(Date > max(dt.train$Date)) timeseries <- ts(dt.train$Close, frequency = 1) model <- ets(timeseries)
  • 18. © 2018, Dmitry Petukhov. CC BY-SA 4.0 license. Microsoft and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. Thank you!
  • 19. Download presentation from http://0xcode.in/machine-learning-intro or Q&A Now or later (see contacts below) Stay connected Befriend at the Facebook/@codezombie Read me at the Habr/@codezombie All contacts on http://0xCode.in/@codez0mb1e

Editor's Notes

  • #3: AI – наука и технология создания интеллектуальных машин. Способность к обучению. ML – сплав мат. дисциплин. Математическая строгость.
  • #4: Ангажированы. Самое интересное впереди. Приложения: от голосовых помощников до переноса стилей, от стартапов до NASDAQ TOP 100.
  • #5: Революция за последние 3 года: - скоринг кредитных рисков и предсказание просрочки; - мошеннические схемы: от ворованных карт до отмывания денег через ЮЛ; - отток клиентов и стимулирование лояльности; - мониторинг маркетинговых компаний и раннее обнаружение информационных атак.
  • #7: Метка и признак. Прецедент. Вопрос – ответ Структура и паттерны. Уплотнения в пространстве Симбиоз Обучения хождению
  • #8: В столбцах, в строках Нас тут интересует Цена на акции Клиенты интернет-магазина
  • #11: Полиноминальная Простынь с нарисованными шариками. Гиперплоскость.
  • #21: (c) 2018, Dmitry Petukhov. CC BY-SA 4.0 license.