【AI論文解説】Consistency ModelとRectified Flow
•
•
•
•
•
•
•
•
•
•
𝑝(𝑧)
𝑧~𝑝(𝑧)
𝑝(𝑥)
•
𝑝(𝑧) 𝑝(𝑥)
•
𝑝(𝑧) 𝑝(𝑥)
•
•
•
•
•
d𝐱𝑡
d𝑡
d𝐱𝑡 = 2𝑡 d𝒘𝑡
d𝐱𝑡 = −𝑡∇𝐱 log𝑝𝑡(𝐱) d𝑡
•
d𝐱𝑡
d𝑡
𝐱𝑡
d𝐱𝑡
d𝑡
𝐱𝑡
•
•
【AI論文解説】Consistency ModelとRectified Flow
⇒
•
•
𝑓𝜽 𝐱, 0 = 𝐱
𝑓𝜽 𝐱𝑡, 𝑡 = 𝑓𝜽 𝐱𝑡−Δ𝑡, 𝑡 − Δ𝑡
𝑓𝜽 𝐱𝑡,𝑡
𝑓𝜽 𝐱𝑡−1,𝑡 − Δ𝑡
•
ℒ𝐶𝐷
𝑁 (𝜽,𝜽−) = 𝔼𝐱,𝝐,𝑛 𝜆 𝑡𝑛 𝑑 𝑓𝜽 𝐱𝑡𝑛+1
, 𝑡𝑛+1 , 𝑓𝜽− ො
𝐱𝑡𝑛
𝝓
, 𝑡𝑛
•
ℒ𝐶𝑇
𝑁 (𝜽,𝜽−) = 𝔼𝐱,𝝐,𝑛 𝜆 𝑡𝑛 𝑑 𝑓𝜽 𝐱 + 𝑡𝑛+1𝝐, 𝑡𝑛+1 , 𝑓𝜽− 𝐱 + 𝑡𝑛𝝐, 𝑡𝑛
ℒ𝐶𝐷
𝑁 𝜽,𝜽− = ℒ𝐶𝑇
𝑁 𝜽,𝜽− + 𝑜(Δ𝑡)
•
•
𝐱𝑡
𝐱𝑡
•
•
•
•
•
•
•
•
•
•
⇒ 
•
•
⇒
⇒
•
•
𝑓𝜽 𝐱𝑡,𝑡,𝑠
𝑓𝜽 𝐱𝑡−1,𝑡 − Δ𝑡, 𝑠
𝐱𝑠
𝑠 = 𝑡 − Δ𝑡
𝑠 = 0
•
•
•
•
•
•
•
【AI論文解説】Consistency ModelとRectified Flow
•
𝐱𝑡 = 𝑡𝐱1 + (1 − 𝑡)𝐱0
d𝐱𝑡 = 𝐱1 − 𝐱0 d𝑡
𝐱𝑡
d𝐱𝑡 = 𝐱1 − 𝐱0 d𝑡 d𝐱𝑡 = 𝑣𝜽(𝐱𝑡,𝑡)d𝑡
min
𝜽
න
0
1
𝔼𝐱0,𝐱1
𝐱1 − 𝐱0 − 𝑣𝜽 𝐱𝑡,𝑡 2
d𝑡
𝐱𝑡 𝐱𝑡
𝐱0 𝐱1
𝐱𝑡
(𝐱0,𝐱1) (𝐱0,𝐱1)
≤
• (𝐱0, 𝐱1)
⇒ 𝐱𝑡
•
• (𝐱0
𝑘
, 𝐱1
𝑘
)
•
•
𝐱1
𝑘
≈ 𝐱0
𝑘
+ 𝑣𝜽 𝐱0,0
min
𝜽
𝔼(𝐱0
𝑘
,𝐱1
𝑘
) 𝐱1
𝑘
− 𝐱0
𝑘
− 𝑣𝜽 𝐱0
𝑘
,0
2
•
•
•
(𝐱0,𝐱1)
(𝐱0,𝐱1)
•
•
•
•
𝜖𝜽
𝛾
= 𝜖𝜽 𝐱𝑡, 𝑡, NULL + 𝛾 𝜖𝜽 𝐱𝑡, 𝑡, 𝒯 − 𝜖𝜽(𝐱𝑡, 𝑡, NULL)
(𝐱0,𝐱1)
𝛾 = 5.0
𝛾 = 5.0 𝛾 = 1.5
𝛾 = 1.5
•
•
•
•
•
【AI論文解説】Consistency ModelとRectified Flow
•
•
•
•
•
•
•
•
•
•
min
𝜽
𝔼𝑡,𝐱0,𝐱1
𝐱1 − (1 − 𝜎min)𝐱0 − 𝑣𝜽 𝐱𝑡,𝑡 2
𝐱𝑡 = 1 − 1− 𝜎min 𝑡 𝐱0 + 𝑡𝐱1
≈
=
•
•
•
•
𝐱𝑡 = 𝑡𝐱 + 1 − 𝑡 𝝐
𝐱𝑡 = ത
𝛼𝑡𝐱 + 1 − ത
𝛼𝑡𝝐
𝐱𝑡 = 𝐱 + 𝜎𝑡𝝐
𝐱 − 𝝐 𝝐 𝐱 𝒗

More Related Content

PDF
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
PPTX
【DL輪読会】Flow Matching for Generative Modeling
PDF
A summary on “On choosing and bounding probability metrics”
PDF
深層生成モデルと世界モデル
PDF
スペクトラルグラフ理論入門
PDF
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
PDF
ELBO型VAEのダメなところ
PDF
[DL輪読会]`強化学習のための状態表現学習 -より良い「世界モデル」の獲得に向けて-
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
【DL輪読会】Flow Matching for Generative Modeling
A summary on “On choosing and bounding probability metrics”
深層生成モデルと世界モデル
スペクトラルグラフ理論入門
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
ELBO型VAEのダメなところ
[DL輪読会]`強化学習のための状態表現学習 -より良い「世界モデル」の獲得に向けて-

What's hot (20)

PDF
動画認識サーベイv1(メタサーベイ )
PDF
[DL輪読会]GANとエネルギーベースモデル
PDF
PRML学習者から入る深層生成モデル入門
PDF
三次元点群を取り扱うニューラルネットワークのサーベイ
PDF
実装レベルで学ぶVQVAE
PDF
Variational AutoEncoder
PDF
[DL輪読会]近年のエネルギーベースモデルの進展
PPTX
【輪読会】Learning Continuous Image Representation with Local Implicit Image Funct...
PDF
[DL輪読会]Deep Learning 第15章 表現学習
PDF
汎化性能測定
PDF
Transformer メタサーベイ
PDF
生成モデルの Deep Learning
PPTX
Curriculum Learning (関東CV勉強会)
PPTX
[DL輪読会]Meta Reinforcement Learning
PPTX
[DL輪読会]Dense Captioning分野のまとめ
PDF
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
PPTX
[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation
PDF
敵対的生成ネットワーク(GAN)
PDF
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
PPTX
物体検出の歴史(R-CNNからSSD・YOLOまで)
動画認識サーベイv1(メタサーベイ )
[DL輪読会]GANとエネルギーベースモデル
PRML学習者から入る深層生成モデル入門
三次元点群を取り扱うニューラルネットワークのサーベイ
実装レベルで学ぶVQVAE
Variational AutoEncoder
[DL輪読会]近年のエネルギーベースモデルの進展
【輪読会】Learning Continuous Image Representation with Local Implicit Image Funct...
[DL輪読会]Deep Learning 第15章 表現学習
汎化性能測定
Transformer メタサーベイ
生成モデルの Deep Learning
Curriculum Learning (関東CV勉強会)
[DL輪読会]Meta Reinforcement Learning
[DL輪読会]Dense Captioning分野のまとめ
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation
敵対的生成ネットワーク(GAN)
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
物体検出の歴史(R-CNNからSSD・YOLOまで)
Ad

Similar to 【AI論文解説】Consistency ModelとRectified Flow (20)

PDF
Control PID clásico para contol automático
PDF
場の量子論
 
PDF
Mémoire R. Denis (2014)
PDF
グラフニューラルネットワーク入門
PDF
フェーザとか
PDF
Cuantificadores y Lógica inferencial aplicando razonamiento
PDF
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
PDF
グレブナー基底輪読会 #1 ―準備体操の巻―
PDF
退化型Keller--Segel系の解の有限時刻爆発について
PPT
Maths XI - Functions - Objective Type Questions level 1 Class work.ppt
PPTX
mathphysicsmastersv2
PDF
暗号技術の実装と数学
PPTX
これならわかる最適化数学8章_動的計画法
PPTX
超複素数
PDF
University CodeSprint 4 - Magic value
PPTX
Prml 最尤推定からベイズ曲線フィッティング
PPTX
強束縛模型における多体電子状態の第2量子化表現
PDF
読書会 「トピックモデルによる統計的潜在意味解析」 第2回 3.2節 サンプリング近似法
PDF
【招待講演】 線形逆問題に対する凸最適化問題の特性解析とその応用
Control PID clásico para contol automático
場の量子論
 
Mémoire R. Denis (2014)
グラフニューラルネットワーク入門
フェーザとか
Cuantificadores y Lógica inferencial aplicando razonamiento
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
グレブナー基底輪読会 #1 ―準備体操の巻―
退化型Keller--Segel系の解の有限時刻爆発について
Maths XI - Functions - Objective Type Questions level 1 Class work.ppt
mathphysicsmastersv2
暗号技術の実装と数学
これならわかる最適化数学8章_動的計画法
超複素数
University CodeSprint 4 - Magic value
Prml 最尤推定からベイズ曲線フィッティング
強束縛模型における多体電子状態の第2量子化表現
読書会 「トピックモデルによる統計的潜在意味解析」 第2回 3.2節 サンプリング近似法
【招待講演】 線形逆問題に対する凸最適化問題の特性解析とその応用
Ad

More from Sony - Neural Network Libraries (11)

PDF
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
PDF
【AI論文解説】 RLHF不要なLLMの強化学習手法: Direct Preference Optimization(+α)
PDF
【DeepLearning研修】Transfomerの基礎と応用 --第4回 マルチモーダルへの展開
PDF
【DeepLearning研修】Transformerの基礎と応用 --第3回 Transformerの画像での応用
PDF
【DeepLearning研修】Transformerの基礎と応用 -- 第2回 Transformerの言語での応用
PDF
【DeepLearning研修】Transformerの基礎と応用 -- 第1回 Transformerの基本
PDF
【AI論文解説】拡散モデルと自己回帰型モデルの融合 ~ 同時に使う手法と使い分ける手法
PDF
20240819_NM_LivePortrait_Nnabla_youtube_final.pdf
PDF
【学会聴講報告】CVPR2024からみるVision最先端トレンド / CVPR2024 report
PPTX
【AI論文解説】クラスタリングベースアプローチによる大規模データセット自動キュレーション
PPTX
【AI論文解説】LLMの事前学習をvisionに適用する手法Autoregressive Image Models
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
【AI論文解説】 RLHF不要なLLMの強化学習手法: Direct Preference Optimization(+α)
【DeepLearning研修】Transfomerの基礎と応用 --第4回 マルチモーダルへの展開
【DeepLearning研修】Transformerの基礎と応用 --第3回 Transformerの画像での応用
【DeepLearning研修】Transformerの基礎と応用 -- 第2回 Transformerの言語での応用
【DeepLearning研修】Transformerの基礎と応用 -- 第1回 Transformerの基本
【AI論文解説】拡散モデルと自己回帰型モデルの融合 ~ 同時に使う手法と使い分ける手法
20240819_NM_LivePortrait_Nnabla_youtube_final.pdf
【学会聴講報告】CVPR2024からみるVision最先端トレンド / CVPR2024 report
【AI論文解説】クラスタリングベースアプローチによる大規模データセット自動キュレーション
【AI論文解説】LLMの事前学習をvisionに適用する手法Autoregressive Image Models

【AI論文解説】Consistency ModelとRectified Flow