SlideShare a Scribd company logo
3
Most read
8
Most read
10
Most read
1/11
最急降下法
宮澤 彬
総合研究大学院大学 博士前期
miyazawa-a@nii.ac.jp
July 13, 2015
(modified: December 2, 2015)
2/11
最急降下法
関数の停留点(特に極小点)を,反復的な計算で求めるにはどうすれば
よいか.接線の傾きが負である点から,0 に近づく方向に移動していけ
ばよさそうである.
O x
y
y = f (x)
f (x∞) = 0
x0 xk x∞
3/11
Armijo 条件
0 < ξ1 < 1 であるような定数 ξ1 に対して,
f (xk + αdk) ≤ f (xk) + ξ1α f (xk) · dk
を満たす α > 0 を選ぶ.この条件を Armijo 条件 1
という.
O x
y
y = f (xk) + ξ1α f (xk) · dk
y = f (xk) + α f (xk) · dk
y = f (x)
xk xk + αdk
1 スペイン語読みをするならばおそらく/arˈmixo/.
4/11
Wolfe 条件
0 < ξ1 < ξ2 < 1 であるような ξ1, ξ2 に対して
ξ2 f (xk) · dk ≤ f (xk + αdk) · dk
を満たす α > 0 を選ぶ.この条件を曲率条件 (curvature condition)
と呼ぶ.この条件と Armijo 条件を合わせて Wolfe 条件と呼ぶ.
O x
y
ξ2 f (xk)
f (xk)
y = f (x)
xk xk + αdk
5/11
Zoutendijk 条件
定理 目的関数 f (x) は下に有界で,かつ,初期点 x0 における準位集合
{x ; f (x) ≤ f (x0)} におけるを含む開集合 U において連続的微分可能
であるとする.また勾配 f (x) は U で Lipschitz 連続であるとする.
すなわち,ある正定数 L が存在して,任意の x, y ∈ U に対して
f (x) − f (y) ≤ L x − y
が成り立つとする.
このとき xk+1 = xk + αkdk を以下の条件を満たすようにとる.
各 αk が Wolfe 条件を満たす.
各 dk が降下方向である.すなわち f (xk) · dk < 0 を満たす.
すると点列 (xk)k について
∞
k=0
f (xk) · dk
dk
2
< ∞
が成り立つ.
6/11
Zoutendijk 条件
証明 曲率条件と xk+1 = xk + αkdk から
ξ2 f (xk) · dk ≤ f (xk+1) · dk
(ξ2 − 1) f (xk) · dk ≤ ( f (xk+1) − f (xk)) · dk
が成り立つ.Lipschitz 条件より
( f (xk+1) − f (xk)) · dk ≤ f (xk+1) − f (xk) dk
≤ L xk+1 − xk dk
≤ αkL dk
2
が成り立つ.これらから
αk ≥
( f (xk+1) − f (xk)) · dk
L dk
2
≥
ξ2 − 1
L
f (xk) · dk
dk
2
を得る.
7/11
Zoutendijk 条件
得られた αk を Armijo 条件に代入して
f (xk+1) ≤ f (xk) + ξ1αk f (xk) · dk
≤ f (xk) −
ξ1 (1 − ξ2)
L
( f (xk) · dk)
2
dk
2
となる.ここで k = 0 から m までの和をとると
m
k=0
(f (xk+1) − f (xk)) ≤ −
m
k=0
ξ1 (1 − ξ2)
L
( f (xk) · dk)
2
dk
2
f (xm+1) − f (x0) ≤ −
ξ1 (1 − ξ2)
L
m
k=0
( f (xk) · dk)
2
dk
2
を得る.
8/11
Zoutendijk 条件
上式の右辺は m が増加するにつれて単調に減少する.また f は下に有
界であると仮定していたので
∞
k=0
( f (xk) · dk)
2
dk
2 < ∞ (Zoutendijk)
を得る.
上の (Zoutendijk) を Zoutendijk 条件 2
と呼ぶ.
2 オランダ語読みをするならばおそらく/ˈzɑutəndɛ̞ɪk/.
9/11
Zoutendijk 条件
Zoutendijk 条件が成り立つとする.このとき
S :=
∞
k=0 ( f (xk) · dk)
2
/ dk
2
はある有限の値である.
Cauchy-Schwarz の不等式から,任意の自然数 m について
m
k=0
| f (xk) · dk|
dk
2
≤
m
k=0
( f (xk) · dk)
2
dk
2 ≤ S
が成り立つ.ゆえに
∞
k=0
| f (xk) · dk|
dk
≤
√
S
となり,この級数は収束することが分かる.したがって
| f (xk) · dk|
dk
→ 0 (k → ∞)
となる.
10/11
最急降下法の大域収束性
特に dk = − f (xk) をとる.この dk は f (xk) · dk = − f (xk)
2
< 0
を満たすので,降下方向である.さらに先に示した結果から,
| f (xk) · dk|
dk
= f (xk) → 0 (k → ∞)
を満たす.
Cauchy-Schwarz の不等式における等号成立条件から, dk を固定し
て考えたとき,この dk は f (xk) · dk を最小にするものである.つま
り最も急に減少させるものである.そのため dk = − f (xk) とする方
法を最急降下法 (steepest descent method) と呼ぶ.
11/11
参考文献・おわりに
主に以下を参考にした.
矢部博, 新・工科系の数学「工学基礎 最適化とその応用」, 数理工
学社, 2006.
また,このスライドのソースコードは
https://github.com/pecorarista/documents にある.

More Related Content

PDF
サポートベクターマシン(SVM)の数学をみんなに説明したいだけの会
Kenyu Uehara
 
PDF
強化学習と逆強化学習を組み合わせた模倣学習
Eiji Uchibe
 
PDF
スペクトラルグラフ理論入門
irrrrr
 
PDF
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
Masahiro Suzuki
 
PDF
グラフニューラルネットワークとグラフ組合せ問題
joisino
 
PDF
PRML輪読#1
matsuolab
 
PDF
20190619 オートエンコーダーと異常検知入門
Kazuki Motohashi
 
PDF
機械学習のためのベイズ最適化入門
hoxo_m
 
サポートベクターマシン(SVM)の数学をみんなに説明したいだけの会
Kenyu Uehara
 
強化学習と逆強化学習を組み合わせた模倣学習
Eiji Uchibe
 
スペクトラルグラフ理論入門
irrrrr
 
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
Masahiro Suzuki
 
グラフニューラルネットワークとグラフ組合せ問題
joisino
 
PRML輪読#1
matsuolab
 
20190619 オートエンコーダーと異常検知入門
Kazuki Motohashi
 
機械学習のためのベイズ最適化入門
hoxo_m
 

What's hot (20)

PPTX
猫でも分かるVariational AutoEncoder
Sho Tatsuno
 
PPTX
ベイズ統計学の概論的紹介
Naoki Hayashi
 
PDF
ブラックボックス最適化とその応用
gree_tech
 
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
 
PDF
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
 
PDF
機械学習の理論と実践
Preferred Networks
 
PPTX
劣モジュラ最適化と機械学習1章
Hakky St
 
PDF
Bayes Independence Test - HSIC と性能を比較する-
Joe Suzuki
 
PDF
機械学習による統計的実験計画(ベイズ最適化を中心に)
Kota Matsui
 
PDF
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
 
PDF
最適輸送の解き方
joisino
 
PDF
機械学習におけるオンライン確率的最適化の理論
Taiji Suzuki
 
PDF
強化学習その3
nishio
 
PDF
ELBO型VAEのダメなところ
KCS Keio Computer Society
 
PDF
グラフィカルモデル入門
Kawamoto_Kazuhiko
 
PPTX
確率的バンディット問題
jkomiyama
 
PDF
スパースモデリング、スパースコーディングとその数理(第11回WBA若手の会)
narumikanno0918
 
PDF
クラシックな機械学習入門:付録:よく使う線形代数の公式
Hiroshi Nakagawa
 
PDF
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
Motoya Wakiyama
 
PDF
最適化計算の概要まとめ
Yuichiro MInato
 
猫でも分かるVariational AutoEncoder
Sho Tatsuno
 
ベイズ統計学の概論的紹介
Naoki Hayashi
 
ブラックボックス最適化とその応用
gree_tech
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
 
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
 
機械学習の理論と実践
Preferred Networks
 
劣モジュラ最適化と機械学習1章
Hakky St
 
Bayes Independence Test - HSIC と性能を比較する-
Joe Suzuki
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
Kota Matsui
 
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
 
最適輸送の解き方
joisino
 
機械学習におけるオンライン確率的最適化の理論
Taiji Suzuki
 
強化学習その3
nishio
 
ELBO型VAEのダメなところ
KCS Keio Computer Society
 
グラフィカルモデル入門
Kawamoto_Kazuhiko
 
確率的バンディット問題
jkomiyama
 
スパースモデリング、スパースコーディングとその数理(第11回WBA若手の会)
narumikanno0918
 
クラシックな機械学習入門:付録:よく使う線形代数の公式
Hiroshi Nakagawa
 
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
Motoya Wakiyama
 
最適化計算の概要まとめ
Yuichiro MInato
 
Ad

Viewers also liked (6)

PDF
最適化超入門
Takami Sato
 
PPTX
勾配降下法の 最適化アルゴリズム
nishio
 
PDF
最急降下法で制約つき最適化問題を解いてみた
Kazuhiro Hishinuma
 
PDF
ウィナーフィルタと適応フィルタ
Toshihisa Tanaka
 
PPTX
5分で分かる自己組織化マップ
Daisuke Takai
 
PDF
PRMLの線形回帰モデル(線形基底関数モデル)
Yasunori Ozaki
 
最適化超入門
Takami Sato
 
勾配降下法の 最適化アルゴリズム
nishio
 
最急降下法で制約つき最適化問題を解いてみた
Kazuhiro Hishinuma
 
ウィナーフィルタと適応フィルタ
Toshihisa Tanaka
 
5分で分かる自己組織化マップ
Daisuke Takai
 
PRMLの線形回帰モデル(線形基底関数モデル)
Yasunori Ozaki
 
Ad

Similar to 最急降下法 (20)

PPT
060 期待値・中心極限定理
t2tarumi
 
PDF
PRML 10.4 - 10.6
Akira Miyazawa
 
PDF
20170327_レムニスケートにまつわる色々な計算
matsumoring
 
PDF
統計概論 isseing333
Issei Kurahashi
 
PDF
ゲーム理論 BASIC 演習134 -企業の協力と利益配分 :仁- #ゲーム理論 #gametheory #数学 #仁 #交渉 #協力ゲーム
ssusere0a682
 
PPT
050 確率と確率分布
t2tarumi
 
PDF
東京都市大学 データ解析入門 6 回帰分析とモデル選択 1
hirokazutanaka
 
PDF
回帰
Shin Asakawa
 
PDF
高速フーリエ変換
AtCoder Inc.
 
PDF
Nonparametric Factor Analysis with Beta Process Priors の式解説
Tomonari Masada
 
PDF
半正定値計画問題と最大カット Sedemifinite Programming and Approximation Algorithm for Maxcu...
Yuya Masumura
 
PDF
カーネル法:正定値カーネルの理論
Daiki Tanaka
 
PDF
ガンマ分布族のなす空間の曲率
Masaki Asano
 
PDF
整数格子点上の劣モジュラ被覆に対する高速アルゴリズム
Tasuku Soma
 
PDF
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)
Akira Asano
 
PDF
Scala 初心者が米田の補題を Scala で考えてみた
Kazuyuki TAKASE
 
PDF
Prml07
Tsukasa Fukunaga
 
PDF
ndwave3.pdf
MuiKanarine
 
PDF
linhyp.pdf
MuiKanarine
 
PDF
導来代数幾何入門
Naoya Umezaki
 
060 期待値・中心極限定理
t2tarumi
 
PRML 10.4 - 10.6
Akira Miyazawa
 
20170327_レムニスケートにまつわる色々な計算
matsumoring
 
統計概論 isseing333
Issei Kurahashi
 
ゲーム理論 BASIC 演習134 -企業の協力と利益配分 :仁- #ゲーム理論 #gametheory #数学 #仁 #交渉 #協力ゲーム
ssusere0a682
 
050 確率と確率分布
t2tarumi
 
東京都市大学 データ解析入門 6 回帰分析とモデル選択 1
hirokazutanaka
 
回帰
Shin Asakawa
 
高速フーリエ変換
AtCoder Inc.
 
Nonparametric Factor Analysis with Beta Process Priors の式解説
Tomonari Masada
 
半正定値計画問題と最大カット Sedemifinite Programming and Approximation Algorithm for Maxcu...
Yuya Masumura
 
カーネル法:正定値カーネルの理論
Daiki Tanaka
 
ガンマ分布族のなす空間の曲率
Masaki Asano
 
整数格子点上の劣モジュラ被覆に対する高速アルゴリズム
Tasuku Soma
 
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)
Akira Asano
 
Scala 初心者が米田の補題を Scala で考えてみた
Kazuyuki TAKASE
 
ndwave3.pdf
MuiKanarine
 
linhyp.pdf
MuiKanarine
 
導来代数幾何入門
Naoya Umezaki
 

More from Akira Miyazawa (7)

PDF
LuaTeX-jaとbeamerで言語学関連のスライドを作る
Akira Miyazawa
 
PDF
メタファーの自動生成に向けた客観的評価指標の検討
Akira Miyazawa
 
PDF
An incremental algorithm for transition-based CCG parsing
Akira Miyazawa
 
PDF
PRML 第14章
Akira Miyazawa
 
PDF
スペクトラル・クラスタリング
Akira Miyazawa
 
PDF
PRML 第4章
Akira Miyazawa
 
PDF
Foundations of Statistical Natural Language Processing (chapter 5)
Akira Miyazawa
 
LuaTeX-jaとbeamerで言語学関連のスライドを作る
Akira Miyazawa
 
メタファーの自動生成に向けた客観的評価指標の検討
Akira Miyazawa
 
An incremental algorithm for transition-based CCG parsing
Akira Miyazawa
 
PRML 第14章
Akira Miyazawa
 
スペクトラル・クラスタリング
Akira Miyazawa
 
PRML 第4章
Akira Miyazawa
 
Foundations of Statistical Natural Language Processing (chapter 5)
Akira Miyazawa
 

最急降下法

  • 3. 3/11 Armijo 条件 0 < ξ1 < 1 であるような定数 ξ1 に対して, f (xk + αdk) ≤ f (xk) + ξ1α f (xk) · dk を満たす α > 0 を選ぶ.この条件を Armijo 条件 1 という. O x y y = f (xk) + ξ1α f (xk) · dk y = f (xk) + α f (xk) · dk y = f (x) xk xk + αdk 1 スペイン語読みをするならばおそらく/arˈmixo/.
  • 4. 4/11 Wolfe 条件 0 < ξ1 < ξ2 < 1 であるような ξ1, ξ2 に対して ξ2 f (xk) · dk ≤ f (xk + αdk) · dk を満たす α > 0 を選ぶ.この条件を曲率条件 (curvature condition) と呼ぶ.この条件と Armijo 条件を合わせて Wolfe 条件と呼ぶ. O x y ξ2 f (xk) f (xk) y = f (x) xk xk + αdk
  • 5. 5/11 Zoutendijk 条件 定理 目的関数 f (x) は下に有界で,かつ,初期点 x0 における準位集合 {x ; f (x) ≤ f (x0)} におけるを含む開集合 U において連続的微分可能 であるとする.また勾配 f (x) は U で Lipschitz 連続であるとする. すなわち,ある正定数 L が存在して,任意の x, y ∈ U に対して f (x) − f (y) ≤ L x − y が成り立つとする. このとき xk+1 = xk + αkdk を以下の条件を満たすようにとる. 各 αk が Wolfe 条件を満たす. 各 dk が降下方向である.すなわち f (xk) · dk < 0 を満たす. すると点列 (xk)k について ∞ k=0 f (xk) · dk dk 2 < ∞ が成り立つ.
  • 6. 6/11 Zoutendijk 条件 証明 曲率条件と xk+1 = xk + αkdk から ξ2 f (xk) · dk ≤ f (xk+1) · dk (ξ2 − 1) f (xk) · dk ≤ ( f (xk+1) − f (xk)) · dk が成り立つ.Lipschitz 条件より ( f (xk+1) − f (xk)) · dk ≤ f (xk+1) − f (xk) dk ≤ L xk+1 − xk dk ≤ αkL dk 2 が成り立つ.これらから αk ≥ ( f (xk+1) − f (xk)) · dk L dk 2 ≥ ξ2 − 1 L f (xk) · dk dk 2 を得る.
  • 7. 7/11 Zoutendijk 条件 得られた αk を Armijo 条件に代入して f (xk+1) ≤ f (xk) + ξ1αk f (xk) · dk ≤ f (xk) − ξ1 (1 − ξ2) L ( f (xk) · dk) 2 dk 2 となる.ここで k = 0 から m までの和をとると m k=0 (f (xk+1) − f (xk)) ≤ − m k=0 ξ1 (1 − ξ2) L ( f (xk) · dk) 2 dk 2 f (xm+1) − f (x0) ≤ − ξ1 (1 − ξ2) L m k=0 ( f (xk) · dk) 2 dk 2 を得る.
  • 8. 8/11 Zoutendijk 条件 上式の右辺は m が増加するにつれて単調に減少する.また f は下に有 界であると仮定していたので ∞ k=0 ( f (xk) · dk) 2 dk 2 < ∞ (Zoutendijk) を得る. 上の (Zoutendijk) を Zoutendijk 条件 2 と呼ぶ. 2 オランダ語読みをするならばおそらく/ˈzɑutəndɛ̞ɪk/.
  • 9. 9/11 Zoutendijk 条件 Zoutendijk 条件が成り立つとする.このとき S := ∞ k=0 ( f (xk) · dk) 2 / dk 2 はある有限の値である. Cauchy-Schwarz の不等式から,任意の自然数 m について m k=0 | f (xk) · dk| dk 2 ≤ m k=0 ( f (xk) · dk) 2 dk 2 ≤ S が成り立つ.ゆえに ∞ k=0 | f (xk) · dk| dk ≤ √ S となり,この級数は収束することが分かる.したがって | f (xk) · dk| dk → 0 (k → ∞) となる.
  • 10. 10/11 最急降下法の大域収束性 特に dk = − f (xk) をとる.この dk は f (xk) · dk = − f (xk) 2 < 0 を満たすので,降下方向である.さらに先に示した結果から, | f (xk) · dk| dk = f (xk) → 0 (k → ∞) を満たす. Cauchy-Schwarz の不等式における等号成立条件から, dk を固定し て考えたとき,この dk は f (xk) · dk を最小にするものである.つま り最も急に減少させるものである.そのため dk = − f (xk) とする方 法を最急降下法 (steepest descent method) と呼ぶ.
  • 11. 11/11 参考文献・おわりに 主に以下を参考にした. 矢部博, 新・工科系の数学「工学基礎 最適化とその応用」, 数理工 学社, 2006. また,このスライドのソースコードは https://github.com/pecorarista/documents にある.