SlideShare a Scribd company logo
数学カフェ
「確率・統計・機械学習」
(Part1)
2017年4⽉22⽇数学カフェ
Yahoo! Japan コワーキングスペース LODGE
株式会社Preferred Networks ⼤野健太
oono@preferred.jp
⼤野健太
• twitter: @delta2323_
• 経歴
• 数学専攻(修⼠) → 2012.4 PFI → 2014.10 PFN
• 担当
• バイオプロジェクト
• Chainerコアチーム
• インターン・採⽤チーム
2
• 2014年3⽉設⽴
• 本社:東京 アメリカ⼦会社:カリフォルニア州サンマテオ
• 社員数:約70名(8割以上はエンジニア・リサーチャー)
• 事業内容:深層学習の産業、特に産業⽤ロボット・交通・バイオ
ヘルスケアへの応⽤
3
夏季インターン(5/7締切)
フルタイム募集中!
4
ニューラルネット愛護協会
5
http://bit.ly/dl-spcn
※エイプリルフールネタです
アジェンダ
• 導⼊
• 機械学習の理論
• 深層学習
6
⼈⼯知能?
• ロボット?アンドロイド?
• 鉄腕アトム・初⾳ミク・Pepper etc. …
• ⽂章を理解する・話し⾔葉を理解する・写真から顔を⾒つける・
ゲームの次の⼿を決める・経営をする・⼈間とチャットする・⾞
を⾃動運転する・複雑な問題を解く etc. …
• 機械が⼈間のように認識・判断・⾏動するための技術?
• 今⽇はあまり⼈⼯知能の話はしません
• ⼈⼯知能を実現するかもしれないと期待されている機械学習・深層学習
技術についてお話しします
photo: flickr
なぜ機械学習が必要か?
例:⼈物写真から年齢を判定する
• 何を基準に分類する?
• ⾝⻑が⾼かったら⼤⼈? ー> そうとも限らない
• ⽩髪だったら⾼齢? ー> そうとも限らない
• 顔?服装?体格?
• 判断に必要な情報をどうやって抽出する?
• ⼈物の写っている位置・スケール・姿勢はバラバラ
• 顔・髪・肩が写っている場所をどうやって⾒つける?
• ⼈間がルールを列挙するのは実質的に不可能
8http://how-old.net
機械学習によるアプローチ
• 年齢情報のついた画像を機械に⼤量に与えて、それぞれの年代に
特徴的な傾向・パターンを機械⾃⾝に発⾒させる
• ⼈間は機械にどの部分を注⽬すべきかを明⽰的には与えない
9
photo: flicker
機械学習を⽤いた画像分類
10
ILSVRC2012 Supervison
Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). Imagenet classification with
deep convolutional neural networks. In Advances in neural information
processing systems (pp. 1097-1105).
画像認識精度
11
http://www.image-net.org/challenges/LSVRC/
機械学習・深層学習の応⽤先
画像 ⾳声 動画 ⾃然⾔語 センサー ゲノム 化合物 パケット
分類 回帰 異常検知
⽣成
モデル
クラスタ
リング
パターン
認識
推薦 強化学習
⼈物検出
シーン
認識
ゲームAI ⾳声認識 動作認識 ⾔語認識 ⾏動解析 画像⽣成
対話 広告配信 ⾃動運転 医療診断
セキュ
リティ
ロボット
マーケ
ティング
翻訳
ドローンの運転制御
13
https://www.youtube.com/watch?v=yFCCanSxOE4
アジェンダ
• 導⼊
• 機械学習の理論
• 定式化
• 最適化
• 汎化性能
• 深層学習
14
参考スライド
15http://www.slideshare.net/irrrrr/2015-46395273
同僚の楠本さんが情報オリンピック春合宿で⾏った講義
Toy example
• ⾚丸と⿊丸うまく分類したい
• 1点 = 1データ
• データの情報:x, y座標、⾊
16
●●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
→y
→ x
●
● : +1
: -1
直線で完全に分類できる 放物線ならば完全に分類できる
Toy example
どう直線を引いても分類できない
↓
分類間違いが少なくなるように
最適な直線を選ぶ
17
●●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
考えないといけない問題
• どういう分類曲線を引いても良いことにするか?
– 直線に限定する、2次曲線も含めるetc.
• 分類間違いをどうやって測るか?「最適」とは何か?
• 許される曲線の中で最適なものをどうやって⾒つけるか?
機械学習のレシピ
• ⼊⼒:訓練データ
D = {(x1, y1), (x2, y2), …, (xN, yN)}, xi ∈ X = Rd, yi ∈ Y = R
• 出⼒:予測モデル
未知のデータ x から y を予測するアルゴリズム
• 設計者の⽤意するもの
仮説集合 Θ、損失関数 L(x, y; θ)
18
今⽇は頻度論的な⽴場での教師あり学習につ
いて説明します
機械学習のレシピ1:仮説集合 Θ
各 θ∈Θ に、x から y を予測する「予測モデル」を対応させる
設計者が決めること
• Θ をどういう集合にするか?
• 各 θ にどういう予測モデルを対応させるか?
• 予測モデルが決定的か確率的か?
• 決定的:x から y が⼀意的に決まる、つまり関数 f θ: X → Y
• 確率的:決まらない、例えば確率分布 pθ(x, y) や pθ(y | x)
19
記号について
今⽇の講演では
f (x, y; θ) と f θ (x, y)
p (x, y; θ) と pθ (x, y)
は同じ関数を表しています
20
仮説集合の例
例1:直線全体(決定的)
{ l (x1, x2, y) = 1 [y > ax1 + bx2 + c] | (a, b, c) ∈ Θ = R3}
例2:指数型分布族(確率的)
{ p (y = 1 | x; θ) = exp (C (x) + θ・F(x) – ψ (θ)) | θ ∈ Θ = Rd}
C, F : Rd → Rn, ψ: 分配関数
例3:ニューラルネット(確率的)→詳しく
{ p (y = 1 | x; θ) = sigmoid (µ (x; θ)) | θ ∈ Θ ⊂ Rd } y ∈ {±1}
µ は θ をパラメータとする決定的な関数(NNとか)
21
1[…]:…が真なら1、そうでないなら-1
sigmoid(s) = 1/(1 + exp(-s)) :シグモイド関数
ニューラルネットで確率を表現する
yが連続値の場合
y = NN (x; θ) + ε
ε ~ N(ε | 0, I)
22
NNx
ε
_ + _ y
p(y | x; θ) = N (y - NN(x; θ) | 0, I)
ニューラルネットで確率を表現する
yが連続値の場合
µ, σ = NN (x; θ)
ε ~ N (ε | 0, 1)
y = µ + σ ε
23
NNx
µ
σ
Gauss y
ε
p (y | x; θ) = N (y | µ, σ)
ニューラルネットで確率を表現する
yが2値の場合
z = NN(x; θ)
p(y=1 | x; θ) = sigmoid(z)
24
NNx z
sig
moid
p
sigmoid(s) = 1/(1 + exp(-s)) :シグモイド関数
ニューラルネットで確率を表現する
yがK個のカテゴリ値の場合
z = NN(x; θ) ∈ RK
P = softmax(z)
p (y=k | x; θ) = Pk for k = 1, …, K
25
NNx z
soft
max
y
softmax(z) = (p1, . . . , pK)
pi =
exp(zi)
PK
i=1 exp(zi)
機械学習のレシピ2:損失関数 L(x, y; θ)
予測モデルの「精度」を測る関数
• L の関数形は設計者次第だが、通常 x に対する予測結果が望ましい
結果 y に近いほどL (x, y, θ) が⼩さくなるように定義する
26
損失関数の例
例1:Toy example
L(x, y; (a, b, c)) = 1[y^(x) ≠ y], y^(x) = 1[ax1 + bx2 + c > 0]
例2:2乗誤差
L(x, y; θ) = (f (x; θ) – y)2
例3:負の対数尤度(Negative Log Likelihood, NLL)
L(x, y; θ) = - log p(y | x; θ)
27
●●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
→x2
→ x1
2乗誤差 =ガウスノイズ + 最尤推定
次のようなモデルを考える
• 仮説集合:{ fθ : X → Y | θ ∈ Θ}(決定的な関数)
• 損失関数:L(x, y; θ) = (fθ (x) - y)2(⼆乗誤差)
これは、次のモデルと同等
• 仮説集合:{gθ | gθ = fθ(x) + ε, θ ∈ Θ, ε = N(0, 1)}(確率的)
• 損失関数:L(x, y; θ) = - log p(y | gθ(x))(負の対数尤度)
28
訓練誤差最⼩化
• 最適化に利⽤できるLの情報は問題設定によって異なる
argminθ ∑i L(xi, yi; θ)
θ:パラメータ
x:⼊⼒ベクトル
y:正解ラベル
L:損失関数
29
クエリ 使える情報
ブラックボックス最適化 (x, y) L(x, y)
ニューラルネット (x, y) L(x, y), ∇θ L(x, y)
argminθ f (θ):f (θ)を最⼩にするθ
↑あとで
訓練誤差 E^ (θ)という
この定式化に乗らない例
Generative Adversarial Network (GAN)
[Goodfellow+14]
⽣成器 Gと識別器 Dからなる
⽣成器は本物のデータと⾒分けがつかない偽データを⽣成するのが⽬標
識別器は本物のデータと偽データを区別するのが⽬標
2プレーヤーのmin maxゲームとして定式化される
30
Gen xgenz Dis prob
x
minφ maxθ Ex~D [log Dθ (x)] + Ez~N(0, I) [log (1 – Dθ (Gφ (z)))]
Goodfellow, Ian, et al. "Generative adversarial nets." Advances in neural
information processing systems. 2014.
GANの⽣成結果
• 正確にはGANの改良版であるWasserstein GAN (WGAN)
[Arjovsky+17]の結果
• Wasserstein GANの論⽂では関数空間の位相について議論し
ていて、数学の⼈にも⾯⽩いと思う
31Arjovsky, Martin, Soumith Chintala, and Léon Bottou. "Wasserstein
gan." arXiv preprint arXiv:1701.07875 (2017).
アジェンダ
• 導⼊
• 機械学習の理論
• 定式化
• 最適化
• 汎化性能
• 深層学習
32
⼀番楽な⽅法:解析解が求まる
∇θ E^(θ) = 0 が(θ に関する⽅程式として)解析的に計算できる
ならば、最⼩解を直接計算すれば良い
例:線形モデル + 2乗誤差 + L2 正則化
33
E^(θ) = 1/N ∑i L(xi, yi; θ)
→ E^(θ) の最⼩解は、θ = (XTX + λ)-1XT Y
• x∈ Rd, y∈R, Θ = Rd
• L(x, y; θ) = 1/2 (y – θTx)2 + λ/2 ||θ||2
2
数値最適化
34
argminθ ∑i L(xi, yi; θ)
• ⼀般には解析的には解けないので数値最適化アルゴリズムを利
⽤して、最適解に近い解を探索する
• L や Θ の形によって、様々な最適化の⼿法が提案されており、
理論的な保証や⼯学的な⼯夫がある
勾配降下法 (Gradient Descent, GD)
35
initialize θ
until some criterion is satisfied:
θ ← θ - η ∇θ E^(θ)
output θ η:学習率
E^(θ) = 1/N ∑i L(xi, yi; θ)
関数の傾きが最も急な
⽅向に少しだけ動く
θt+1
E^
-∇θE^(θ)
θt
凸関数
f : Rd →Rが凸関数であるとは任意のa, b∈Rd, t∈[0, 1]に対して、
f (ta + (1-t) b) ≦ t f (a) + (1-t) f (b)
が成り⽴つこと
36
GDの収束の理論保証(凸関数の場合)
勾配法による最適化で最適解への収束や、そのスピードを評価できる
• 仮説空間がユークリッド空間のコンパクト集合
• 損失関数が凸関数でリプシッツ性を持つ
37
厳密に⾔うとparameter averaging
した出⼒について証明している
Gradient Descentの問題点
• 計算量が重い
• 各訓練データに対して勾配を計算するので、計算量はO(訓練データ)
• Saddle pointやlocal minimumにはまる(後半で詳しく)
38
Stochastic Gradient Descent (SGD)
39
until some criterion is satisfied:
get data (x, y) randomly
θ ← θ – η N ∇θ L(x, y; θ)
output θ
until some criterion is satisfied:
θ ← θ - η Σi∇θ L(xi, yi; θ)
output θ
GD
SGD
SGDの収束保証(凸関数)
40
ここが期待値に
変わっただけ
凸関数の場合
strongly convexを仮定すると、GDによる最適化で、より早い
global minimumへの収束を証明できる
41
※この定理で証明されているSGDのアルゴリズムでは、学
習率ηは⼀定ではなく、イテレーションごとにηt=O(1/t)
と変えている
アジェンダ
• 導⼊
• 機械学習の理論
• 定式化
• 最適化
• 汎化性能
• 深層学習
42
素朴な疑問
こういう分類器を作れば分類精度
100% !!
→ あまり良くない
複雑な分類曲線を引ける
= 仮説集合 Θ が「⼤きい」
= 候補となる予測モデルが多い
43
●●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
過学習 (Overfitting)
• 機械学習を適⽤したいタスクでは、今⼿元にあるデータだけではな
く、未知のデータに対する予測能⼒(汎化能⼒, generalization)
を持つようにしたい
• 複雑な仮説集合では、真のデータ分布だけではなく、データとは無
関係なノイズもモデリングし、汎化能⼒が得られない
44
https://research.preferred.jp/2010/12/subgradient-optimization-3/
過学習
45
q
データ分布
サンプリング
(xi, yi) ~ q i.i.d
D ={(xi, yi)i=1,…,n}
推定
(訓練誤差最⼩解)
pθ^
訓練データ
学習モデル
データが真のデータ分布 q からi.i.d.で
サンプリングされていると仮定する
qとpθ^の乖離が著しい
と汎化能⼒が得られない
適切な仮説集合の⼤きさ
46
Under fitting
仮説集合が⼩さすぎると
すでにある訓練データを正しく予測できない
Over fitting
仮説集合が⼤きすぎると、訓練データを予測できるが、
未知のデータの予測が悪くなる(かもしれない)
正則化
予測モデルが持つモデルに適当な制約をかけることにより、過
学習を防ぐテクニック
47
E^ (θ) = 1/N ∑i L(xi, yi; θ) + λ ||θ||2
2
例:L2正則化
訓練誤差にパラメータのノルムに関するペナルティを加えて、モ
デルのパラメータが⼤きくならないように制約をつける
正則化はとても重要なテクニックで理論的な研究も
沢⼭あるのですが、今⽇はあまりお話できません…
アジェンダ
• 導⼊
• 機械学習の理論
• 深層学習
48
深層学習(ディープラーニング)
• 機械学習の⼀種
• 予測器(先ほどの L)として、⼊⼒データに対して、単純かつ
微分可能な変換を何回も適⽤するモデルを利⽤する
49
http://www.wsdm-conference.org/2016/slides/WSDM2016-Jeff-Dean.pdf
深層学習の基本計算
• 下層の⼊⼒ x を重み付きで⾜しあわせ、活性化関数 h をかけて出
⼒
50
x1
x2
x3
+1
a
w1
w2
w3
w4
h
a = h(x1w1+x2w2+x3w3+w4) = h(wtx)
hの例 ReLU: h(x) = max(0, x)
θ = (w1, w2, w3, w4)
Multi Layer Perceptron (MLP)
この計算を何層にも重ねる
51
x1
x2
x3
x4
y
0.3
-0.2
0.4
重み
結合ユニット
アーキテクチャ
(ユニット数や層数を指定して、重みは指定しない)
深いネットワーク
52http://image-net.org/challenges/talks/ilsvrc2015_deep_residual_learning_kaiminghe.pdf
深層学習モデルのパラメータ数
53
Dean, Jeffrey, et al. "Large scale distributed deep networks." Advances in neural information processing
systems. 2012.
Adam Coates, et al. ICML'13 Proceedings of the 30th International Conference on International Conference
on Machine Learning - Volume 28Pages III-1337-III-1345
Shazeer, Noam, et al. "Outrageously large neural networks: The sparsely-gated mixture-of-experts
layer." arXiv preprint arXiv:1701.06538 (2017).
[Dean+12]
1.7 billion [Adam+13] 11 billion
[Shazeer+17]
137 billion
学習アルゴリズム(SGD)
ニューラルネットは誤差逆伝播により勾配を効率的に計算できる
54
initialize θ
until convergence:
get data (x, y)
θ ← θ - η ∇θ L(x, y; θ)
η:学習率
← この更新式にはバリエーション
がある(あとで)
Neural Network as a Computational Graph
• 多くのフレームワークでは、NNは計算グラフとして実現される
• データノードと計算ノードからなる2部グラフのDAGとして表現す
るのが計算グラフの最も簡単な表現⽅法
55
y = x1 * x2
z = y - x3
x1 mul suby
x3
z
x2
データノード
計算ノード
順伝播(forward propagation)
56
y = x1 * x2
x1 mul suby
x3
z
x2
z = y - x3
連鎖律(Chain Rule)
57
活性の伝播⽅向
エラーの伝播⽅向
x f y
x f y
→ 勾配は活性と逆向きに伝播する
Forward Propagation
損失をLとすると、連鎖律より
誤差逆伝播(Backpropagation)
58
y = x1 * x2
* ga is a derivative of z w.r.t. a i.e. ga =∇a z
x1 mul suby
x3
z
x2
z = y - x3
gx1 = gy * x2
gx2 = gy * x1
gz = 1
gy = gz
gx3 = -gz
gzgy
gx3
gx1
gx2
まとめ
• 機械学習では、ルールでは記述できないようなデータの傾向・
法則を捉えることで、未知データに対する予測を⾏える事を⽬
指します
• 頻度論でのアプローチでの教師あり分類問題は、そのためには
仮説集合と損失関数から訓練誤差を定義し、それを最適化する
という⾵に定式化できます
• 深層学習では、単純で微分可能な変換を何回も繰り返すモデル
を使います。
59
後半の内容の予告
60
残念なお知らせ:
深層学習のモデルが作る損失関数は⾮凸
⼼配事1
「勾配法はsaddle pointにはまってしまうのでは!?」
⼼配事2
「勾配法ではlocal minimumにしかたどりつけないのでは!?」
• Q. 深層学習のモデルが作る損失関数はどのような形をしているか?
• Q. その損失関数の最適化するのに適したアルゴリズムは何か?
61
深層学習の汎化性能
深層学習のモデルはとてつもない数のパラメータ数を持つにも
関わらず、過学習せずに学習できる(こともある)
深層学習モデルの汎化性能を理論的に説明できないか?
62

More Related Content

PDF
よくわかるフリストンの自由エネルギー原理
Masatoshi Yoshida
 
PDF
統計的学習の基礎6章前半 #カステラ本
Akifumi Eguchi
 
PPTX
社会心理学者のための時系列分析入門_小森
Masashi Komori
 
PDF
「統計的学習理論」第1章
Kota Matsui
 
PDF
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
Deep Learning Lab(ディープラーニング・ラボ)
 
PDF
“機械学習の説明”の信頼性
Satoshi Hara
 
PDF
Recent Advances on Transfer Learning and Related Topics Ver.2
Kota Matsui
 
PDF
木と電話と選挙(causalTree)
Shota Yasui
 
よくわかるフリストンの自由エネルギー原理
Masatoshi Yoshida
 
統計的学習の基礎6章前半 #カステラ本
Akifumi Eguchi
 
社会心理学者のための時系列分析入門_小森
Masashi Komori
 
「統計的学習理論」第1章
Kota Matsui
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
Deep Learning Lab(ディープラーニング・ラボ)
 
“機械学習の説明”の信頼性
Satoshi Hara
 
Recent Advances on Transfer Learning and Related Topics Ver.2
Kota Matsui
 
木と電話と選挙(causalTree)
Shota Yasui
 

What's hot (20)

PDF
データ解析13 線形判別分析
Hirotaka Hachiya
 
PDF
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tatsuya Tojima
 
PPTX
NLPにおけるAttention~Seq2Seq から BERTまで~
Takuya Ono
 
PDF
深層学習とベイズ統計
Yuta Kashino
 
PDF
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
 
PDF
比例ハザードモデルはとってもtricky!
takehikoihayashi
 
PDF
Word2vecの並列実行時の学習速度の改善
Naoaki Okazaki
 
PPTX
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Satoshi Kato
 
PDF
多重代入法の書き方 公開用
Koichiro Gibo
 
PDF
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
Akisato Kimura
 
PDF
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
Koichi Hamada
 
PDF
クラシックな機械学習入門:付録:よく使う線形代数の公式
Hiroshi Nakagawa
 
PPTX
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
 
PDF
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
Ken'ichi Matsui
 
PDF
状態空間モデルの考え方・使い方 - TokyoR #38
horihorio
 
PDF
深層学習による非滑らかな関数の推定
Masaaki Imaizumi
 
PDF
Rで学ぶロバスト推定
Shintaro Fukushima
 
PPTX
強化学習 DQNからPPOまで
harmonylab
 
PDF
Reinforcement Learning @ NeurIPS2018
佑 甲野
 
PDF
LSTM (Long short-term memory) 概要
Kenji Urai
 
データ解析13 線形判別分析
Hirotaka Hachiya
 
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tatsuya Tojima
 
NLPにおけるAttention~Seq2Seq から BERTまで~
Takuya Ono
 
深層学習とベイズ統計
Yuta Kashino
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
 
比例ハザードモデルはとってもtricky!
takehikoihayashi
 
Word2vecの並列実行時の学習速度の改善
Naoaki Okazaki
 
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Satoshi Kato
 
多重代入法の書き方 公開用
Koichiro Gibo
 
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
Akisato Kimura
 
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
Koichi Hamada
 
クラシックな機械学習入門:付録:よく使う線形代数の公式
Hiroshi Nakagawa
 
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
 
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
Ken'ichi Matsui
 
状態空間モデルの考え方・使い方 - TokyoR #38
horihorio
 
深層学習による非滑らかな関数の推定
Masaaki Imaizumi
 
Rで学ぶロバスト推定
Shintaro Fukushima
 
強化学習 DQNからPPOまで
harmonylab
 
Reinforcement Learning @ NeurIPS2018
佑 甲野
 
LSTM (Long short-term memory) 概要
Kenji Urai
 
Ad

Viewers also liked (7)

PDF
圏とHaskellの型
KinebuchiTomo
 
PPTX
数学つまみぐい入門編
Akira Yamaguchi
 
PDF
楕円曲線入門 トーラスと楕円曲線のつながり
MITSUNARI Shigeo
 
PDF
20170422 数学カフェ Part2
Kenta Oono
 
PDF
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
Ken'ichi Matsui
 
PDF
Comparison of deep learning frameworks from a viewpoint of double backpropaga...
Kenta Oono
 
PDF
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
Ken'ichi Matsui
 
圏とHaskellの型
KinebuchiTomo
 
数学つまみぐい入門編
Akira Yamaguchi
 
楕円曲線入門 トーラスと楕円曲線のつながり
MITSUNARI Shigeo
 
20170422 数学カフェ Part2
Kenta Oono
 
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
Ken'ichi Matsui
 
Comparison of deep learning frameworks from a viewpoint of double backpropaga...
Kenta Oono
 
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
Ken'ichi Matsui
 
Ad

Similar to 20170422 数学カフェ Part1 (20)

PDF
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
Kensuke Otsuki
 
PPTX
深層学習の数理
Taiji Suzuki
 
PDF
Deep learning入門
magoroku Yamamoto
 
PPTX
パターン認識モデル初歩の初歩
t_ichioka_sg
 
PDF
SGD+α: 確率的勾配降下法の現在と未来
Hidekazu Oiwa
 
PDF
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
Preferred Networks
 
PDF
PRML_from5.1to5.3.1
禎晃 山崎
 
PDF
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
Deep Learning JP
 
PPTX
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
harmonylab
 
PDF
機械学習の理論と実践
Preferred Networks
 
PPTX
Coursera "Neural Networks"
hayashizaki takaaki
 
PPTX
Deep learning basics described
Naoki Watanabe
 
PDF
PRML復々習レーン#9 前回までのあらすじ
sleepy_yoshi
 
PPTX
PRML Chapter 5
Masahito Ohue
 
PDF
How to study stat
Ak Ok
 
PPTX
PRML第6章「カーネル法」
Keisuke Sugawara
 
PDF
PRML5
Hidekazu Oiwa
 
PDF
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
Deep Learning JP
 
PDF
深層学習と確率プログラミングを融合したEdwardについて
ryosuke-kojima
 
PDF
確率的深層学習における中間層の改良と高性能学習法の提案
__106__
 
ディープラーニング入門 ~ 画像処理・自然言語処理について ~
Kensuke Otsuki
 
深層学習の数理
Taiji Suzuki
 
Deep learning入門
magoroku Yamamoto
 
パターン認識モデル初歩の初歩
t_ichioka_sg
 
SGD+α: 確率的勾配降下法の現在と未来
Hidekazu Oiwa
 
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
Preferred Networks
 
PRML_from5.1to5.3.1
禎晃 山崎
 
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
Deep Learning JP
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
harmonylab
 
機械学習の理論と実践
Preferred Networks
 
Coursera "Neural Networks"
hayashizaki takaaki
 
Deep learning basics described
Naoki Watanabe
 
PRML復々習レーン#9 前回までのあらすじ
sleepy_yoshi
 
PRML Chapter 5
Masahito Ohue
 
How to study stat
Ak Ok
 
PRML第6章「カーネル法」
Keisuke Sugawara
 
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
Deep Learning JP
 
深層学習と確率プログラミングを融合したEdwardについて
ryosuke-kojima
 
確率的深層学習における中間層の改良と高性能学習法の提案
__106__
 

More from Kenta Oono (20)

PDF
Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...
Kenta Oono
 
PDF
Deep learning for molecules, introduction to chainer chemistry
Kenta Oono
 
PDF
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017
Kenta Oono
 
PDF
深層学習フレームワーク概要とChainerの事例紹介
Kenta Oono
 
PDF
情報幾何学の基礎、第7章発表ノート
Kenta Oono
 
PDF
GTC Japan 2016 Chainer feature introduction
Kenta Oono
 
PDF
On the benchmark of Chainer
Kenta Oono
 
PDF
Tokyo Webmining Talk1
Kenta Oono
 
PDF
VAE-type Deep Generative Models
Kenta Oono
 
PDF
Common Design of Deep Learning Frameworks
Kenta Oono
 
PDF
Introduction to Chainer and CuPy
Kenta Oono
 
PDF
Stochastic Gradient MCMC
Kenta Oono
 
PDF
Chainer Contribution Guide
Kenta Oono
 
PDF
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
Kenta Oono
 
PDF
Introduction to Chainer (LL Ring Recursive)
Kenta Oono
 
PDF
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料
Kenta Oono
 
PDF
提供AMIについて
Kenta Oono
 
PDF
Chainerインストール
Kenta Oono
 
PDF
Caffeインストール
Kenta Oono
 
PDF
ディープラーニング最近の発展とビジネス応用への課題
Kenta Oono
 
Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...
Kenta Oono
 
Deep learning for molecules, introduction to chainer chemistry
Kenta Oono
 
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017
Kenta Oono
 
深層学習フレームワーク概要とChainerの事例紹介
Kenta Oono
 
情報幾何学の基礎、第7章発表ノート
Kenta Oono
 
GTC Japan 2016 Chainer feature introduction
Kenta Oono
 
On the benchmark of Chainer
Kenta Oono
 
Tokyo Webmining Talk1
Kenta Oono
 
VAE-type Deep Generative Models
Kenta Oono
 
Common Design of Deep Learning Frameworks
Kenta Oono
 
Introduction to Chainer and CuPy
Kenta Oono
 
Stochastic Gradient MCMC
Kenta Oono
 
Chainer Contribution Guide
Kenta Oono
 
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
Kenta Oono
 
Introduction to Chainer (LL Ring Recursive)
Kenta Oono
 
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料
Kenta Oono
 
提供AMIについて
Kenta Oono
 
Chainerインストール
Kenta Oono
 
Caffeインストール
Kenta Oono
 
ディープラーニング最近の発展とビジネス応用への課題
Kenta Oono
 

Recently uploaded (11)

PDF
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
PDF
20250729_Devin-for-Enterprise
Masaki Yamakawa
 
PDF
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
PDF
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
PDF
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
PDF
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
PDF
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
PDF
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
PDF
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
PPTX
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
PPTX
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
20250729_Devin-for-Enterprise
Masaki Yamakawa
 
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 

20170422 数学カフェ Part1