SlideShare a Scribd company logo
Python機械学習プログラミング
読み会
第1章
「データから学習する能力」をコンピュータに与える
1
[第2版]
基盤 江口春紀
目次
● データを知識に変える「知能機械」
● 3種類の機械学習
● 基本用語と表記法
● 機械学習システムを構築するためのロードマップ
● 機械学習にPythonを使用する
2
データを知識に変える「知能機械」
3
BIG DATA
無尽蔵のリソース
3種類の機械学習
4
教師あり
学習
強化学習教師なし
学習
教師あり学習
5
回帰分類
教師あり学習 (分類)
6
● スパム
● 非スパム
● スパム
● 非スパム
?
教師あり学習 (分類)
● 二値分類の概念図
7
Negative
class
Positive
class
● 回帰分析
● 回帰分析は、複数の説明変数と連続値の応答変数が与えられ、
結果を予測できるようにそれらの変数の関係を探るもの。
● 線形回帰の概念図
教師あり学習 (回帰)
8説明変数(勉強時間)
応答変数
(テストの点数)
教師あり学習
● 特徴
● ラベル付けされたデータを使う
● 直接のフィードバック
● 成果予測と未来予測
9
● 強化学習の目標
● 環境(environment)とのやりとりに基づいて、
性能を改善するシステム (agent)を開発すること。
● Agent
● 環境とのやり取りを通じて強化学習を使用することで
一連の行動を学習できる。
● 環境とのやり取りを通じて報酬を
最大化しようとする。
強化学習
10
● チェスエンジン
● 報酬(即時的なフィードバック)
● 相手の駒を取る(正の報酬)
● 自分の駒を取られる(負の報酬)
● 報酬(遅延的なフィードバック)
● 勝ち(正の報酬)
● 負け(負の報酬)
強化学習
11
即時的・遅延的なフィードバックに基づいて
報酬を最大化する
強化学習
● 特徴
● 意思決定プロセス
● 報酬系
● 一連のアクションを学習
12
教師なし学習
● 特徴
● ラベルと目的変数なし
● フィードバックなし
● データから隠れた構造を見つけ出す
13
クラスタリング(clustering)をする
教師なし学習
● 概念図(クラスタリングの例)
● 特徴量であるx1, x2の類似性に基づき
データを3つのグループに分割している。
14
教師なし学習
● データ圧縮のための次元削減
● 特徴量の前処理において使用されるアプローチのうちの 1つ。
● 圧縮することで、データの可視化にも役立つ。
15
基本用語と表記法
● Irisデータセット
● Setosa, Versicolor, Virginica
の3種類のあやめのデータセット
16
特徴量
(属性、計測値、寸法)
サンプル
(インスタンス、観測)
花びら
品種ラベル
(ターゲット)
がく
基本用語と表記法
17
特徴量
ターゲット
機械学習システムを構築するためのロードマップ
18
前処理 学習 評価 予測
前処理
19
色
色調花の明度
高さ
幅
● 特徴抽出とスケーリング
● 特徴選択
● 次元削減
● サンプリング
学習
● モデル選択
● それぞれのモデルにはそれぞれの特性があるので、
数種類のアルゴリズムを比較する。(ノーフリーランチ定理)
● 交差検証
● 汎化性能を推定してモデルの評価を行う。
● 性能指標
● 正解率(accuracy)、検出率(sensitivity / recall)等
を指標にする。
● ハイパーパラメータ最適化
● モデルの性能の調整を行う。
20
評価と予測
● 汎化誤差の評価
● モデルにテストデータセットを適用して性能を測る。
● 未知データの予測
● 学習や評価に使用した前処理を適用する。
21
機械学習にPythonを使用する
● 使用しているパッケージ
● Numpy=1.12.1
● SciPy=0.19.0
● scikit-learn=0.18.1
● matplotlib=2.0.2
● pandas=0.20.1
22
第1章のまとめ
● 機械学習の主な概念
● 教師あり学習、教師なし学習、強化学習
● 機械学習のロードマップ
● 前処理、学習、評価、予測
● Pythonの環境構築
23

More Related Content

What's hot (9)

PPTX
研究室勉強会資料「データ分析チュートリアル」
ymmt3-lab
 
PDF
統計用言語Rの使い方
Ak Ok
 
PDF
TokyoR 第36回LT Rで部分空間法
Prunus 1350
 
PDF
開発者からみたTensor flow
Hideo Kinami
 
PPTX
データ分析スクリプトのツール化入門 - PyConJP 2016
Akinori Kohno
 
PDF
Rの導入とRStudio事始め(改訂版)
Takashi Yamane
 
PPTX
Pythonとdeep learningで手書き文字認識
Ken Morishita
 
PDF
Python 機械学習プログラミング データ分析演習編
Etsuji Nakai
 
PDF
知能型システム論(後半)
Sotetsu KOYAMADA(小山田創哲)
 
研究室勉強会資料「データ分析チュートリアル」
ymmt3-lab
 
統計用言語Rの使い方
Ak Ok
 
TokyoR 第36回LT Rで部分空間法
Prunus 1350
 
開発者からみたTensor flow
Hideo Kinami
 
データ分析スクリプトのツール化入門 - PyConJP 2016
Akinori Kohno
 
Rの導入とRStudio事始め(改訂版)
Takashi Yamane
 
Pythonとdeep learningで手書き文字認識
Ken Morishita
 
Python 機械学習プログラミング データ分析演習編
Etsuji Nakai
 
知能型システム論(後半)
Sotetsu KOYAMADA(小山田創哲)
 

Similar to [第2版] Python機械学習プログラミング 第1章 (20)

PDF
Hands on-ml section1-1st-half-20210317
Nagi Kataoka
 
PPTX
[輪講] 第1章
Takenobu Sasatani
 
PPTX
ae-2. 機械学習の基礎(教師なし学習,教師あり学習)
kunihikokaneko1
 
PPTX
機械学習の基礎
Ken Kumagai
 
PPTX
東北大学AIE - 機械学習入門編
Daiyu Hatakeyama
 
PDF
Python 機械学習プログラミング データ分析ライブラリー解説編
Etsuji Nakai
 
PPTX
Machine learning
Masafumi Noda
 
PPTX
早稲田大学 理工メディアセンター 機械学習とAI セミナー: 機械学習入門
Daiyu Hatakeyama
 
PPTX
第一回 機械学習
Akira Maegawa
 
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
Shunsuke Nakamura
 
PDF
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
Shunsuke Nakamura
 
PPTX
Machine learning
TakahiroBaba3
 
PDF
DATUM STUDIO PyCon2016 Turorial
Tatsuya Tojima
 
PPTX
Machine Learning Fundamentals IEEE
Antonio Tejero de Pablos
 
PDF
[第2版] Python機械学習プログラミング 第2章
Haruki Eguchi
 
PDF
機械学習の理論と実践
Preferred Networks
 
PPTX
機械学習アルゴリズム基礎
ssuser60e2a31
 
PDF
機械学習 入門
Hayato Maki
 
PDF
データベースで始める機械学習
オラクルエンジニア通信
 
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
Shunsuke Nakamura
 
Hands on-ml section1-1st-half-20210317
Nagi Kataoka
 
[輪講] 第1章
Takenobu Sasatani
 
ae-2. 機械学習の基礎(教師なし学習,教師あり学習)
kunihikokaneko1
 
機械学習の基礎
Ken Kumagai
 
東北大学AIE - 機械学習入門編
Daiyu Hatakeyama
 
Python 機械学習プログラミング データ分析ライブラリー解説編
Etsuji Nakai
 
Machine learning
Masafumi Noda
 
早稲田大学 理工メディアセンター 機械学習とAI セミナー: 機械学習入門
Daiyu Hatakeyama
 
第一回 機械学習
Akira Maegawa
 
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
Shunsuke Nakamura
 
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
Shunsuke Nakamura
 
Machine learning
TakahiroBaba3
 
DATUM STUDIO PyCon2016 Turorial
Tatsuya Tojima
 
Machine Learning Fundamentals IEEE
Antonio Tejero de Pablos
 
[第2版] Python機械学習プログラミング 第2章
Haruki Eguchi
 
機械学習の理論と実践
Preferred Networks
 
機械学習アルゴリズム基礎
ssuser60e2a31
 
機械学習 入門
Hayato Maki
 
データベースで始める機械学習
オラクルエンジニア通信
 
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
Shunsuke Nakamura
 
Ad

More from Haruki Eguchi (16)

PDF
[第2版]Python機械学習プログラミング 第16章
Haruki Eguchi
 
PDF
[第2版]Python機械学習プログラミング 第15章
Haruki Eguchi
 
PDF
[第2版]Python機械学習プログラミング 第14章
Haruki Eguchi
 
PDF
[第2版]Python機械学習プログラミング 第13章
Haruki Eguchi
 
PDF
[第2版]Python機械学習プログラミング 第12章
Haruki Eguchi
 
PPTX
[第2版]Python機械学習プログラミング 第11章
Haruki Eguchi
 
PPTX
[第2版]Python機械学習プログラミング 第12章
Haruki Eguchi
 
PPTX
[第2版]Python機械学習プログラミング 第10章
Haruki Eguchi
 
PPTX
[第2版]Python機械学習プログラミング 第9章
Haruki Eguchi
 
PDF
[第2版]Python機械学習プログラミング 第8章
Haruki Eguchi
 
PDF
[第2版]Python機械学習プログラミング 第7章
Haruki Eguchi
 
PDF
[第2版]Python機械学習プログラミング 第6章
Haruki Eguchi
 
PDF
[第2版] Python機械学習プログラミング 第5章
Haruki Eguchi
 
PDF
[第2版] Python機械学習プログラミング 第4章
Haruki Eguchi
 
PDF
[第2版] Python機械学習プログラミング 第3章(5節~)
Haruki Eguchi
 
PDF
[第2版] Python機械学習プログラミング 第3章(~4節)
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第16章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第15章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第14章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第13章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第12章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第11章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第12章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第10章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第9章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第8章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第7章
Haruki Eguchi
 
[第2版]Python機械学習プログラミング 第6章
Haruki Eguchi
 
[第2版] Python機械学習プログラミング 第5章
Haruki Eguchi
 
[第2版] Python機械学習プログラミング 第4章
Haruki Eguchi
 
[第2版] Python機械学習プログラミング 第3章(5節~)
Haruki Eguchi
 
[第2版] Python機械学習プログラミング 第3章(~4節)
Haruki Eguchi
 
Ad

Recently uploaded (8)

PDF
[Hardening Designers Confernece 2025]ランサムウェアでの見えざるログ・見えるログ
kataware
 
PDF
SIG-AUDIO 2025 Vol.02 オンラインセミナー SIG-Audioプレゼン資料_オーディオプラグイン開発_塩澤達矢.pdf
IGDA Japan SIG-Audio
 
PDF
Hyperledger Fabric公式サンプル fabric-samples徹底解説
LFDT Tokyo Meetup
 
PDF
プライバシ保護のためのインターネットアーキテクチャの進化 (2025-07-11)
Jun Kurihara
 
PDF
Hyperledger Fabric最新v3.x系での機能強化、変更点にキャッチアップ!
LFDT Tokyo Meetup
 
PDF
20250630_aws_reinforce_2025_aws_sheild_network_security_director
uedayuki
 
PDF
人気ブロックチェーン基盤「Hyperledger Fabric」最新版を動かしてみた!
LFDT Tokyo Meetup
 
PDF
20250710_Devinで切り拓くDB革命_〜価値創出に集中せよ〜.pdf
Masaki Yamakawa
 
[Hardening Designers Confernece 2025]ランサムウェアでの見えざるログ・見えるログ
kataware
 
SIG-AUDIO 2025 Vol.02 オンラインセミナー SIG-Audioプレゼン資料_オーディオプラグイン開発_塩澤達矢.pdf
IGDA Japan SIG-Audio
 
Hyperledger Fabric公式サンプル fabric-samples徹底解説
LFDT Tokyo Meetup
 
プライバシ保護のためのインターネットアーキテクチャの進化 (2025-07-11)
Jun Kurihara
 
Hyperledger Fabric最新v3.x系での機能強化、変更点にキャッチアップ!
LFDT Tokyo Meetup
 
20250630_aws_reinforce_2025_aws_sheild_network_security_director
uedayuki
 
人気ブロックチェーン基盤「Hyperledger Fabric」最新版を動かしてみた!
LFDT Tokyo Meetup
 
20250710_Devinで切り拓くDB革命_〜価値創出に集中せよ〜.pdf
Masaki Yamakawa
 

[第2版] Python機械学習プログラミング 第1章