SlideShare a Scribd company logo
モンテカルロレイトレーシングの基礎から
OpenCLによる実装まで
TAKAHIRO HARADA
2モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
レイトレーシング
} ラスタライゼーション
–  トライアングルを順番に画面に貼って行く
–  DX, OpenGL
} レイトレーシング
–  もう一つのレンダリング方法
–  ピクセルの色を順番に求める
} リアルタイムグローバルイルミネーション
–  近年Hot
–  モンテカルロレイトレーシングは”the solution”
–  リアルタイムアルゴリズムを考える上で知っておくことは重要
•  リアルタイム化 == これをどう簡略化するか
3モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MOTIVATION
} GI (MCRT) looks scary
–  PBRT本は重すぎ…
–  数式多すぎ…
•  Search for “Monte Carlo Integration”, “Importance
Sampling” on Wikipedia
} 本セッション
–  より直感的な理解を
–  Give more intuitive understanding
–  Not for PBRT lovers
–  Not for equation lovers
4モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
AGENDA
} Basic Topics
} Advanced Topics
} OpenCL Implementation
BASIC TOPICS
6モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
FIND VISIBLE POINT
} ピクセルごとにレイを生成
} レイが表面にぶつかった点のうち最も近いものを見つける
} Brute-force
–  全てのトライアングルに対して
•  t_min = min2( t_min, intersect( ray, tri[i] ) )
–  効率が悪い
} 空間分割を導入することで効率化可能
–  Bounding Volume Hierarchy (BVH)
7モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
FIND VISIBLE POINT
} ピクセルごとにレイを生成
} レイが表面にぶつかった点のうち最も近いものを見つける
} Brute-force
–  全てのトライアングルに対して
•  t_min = min2( t_min, intersect( ray, tri[i] ) )
–  効率が悪い
} 空間分割を導入することで効率化可能
–  Bounding Volume Hierarchy (BVH)
8モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MAJOR SURFACE TYPES
9モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFLECTION (SPECULAR)
} 鏡面反射
} 出射する光の強さ == 入射する光の強さ*
θi = θo
* フレネルを除くと
10モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFLECTION (SPECULAR)
} 鏡面反射
} 出射する光の強さ == 入射する光の強さ*
θi = θo
* フレネルを除くと
11モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFLECTION (SPECULAR)
} 鏡面反射
} 出射する光の強さ == 入射する光の強さ*
θi = θo
* フレネルを除くと
12モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFRACTION (SPECULAR)
} Transmission
} 光が表面で方向を変える
} スネルの法則 (Snell’s law)
} 実際は反射も起こる
ηi sin θi = ηo sin θo
13モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFRACTION + REFLECTION
} どのような透明な物体でも表面で光を反射させる
} 屈折と反射の割合
–  フレネル効果 (Fresnel)
–  屈折率
14モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
FRESNEL
} 割合は一様ではない
} 視線ベクトルと表面の法線ベクトルの角度
–  平行ならば
•  屈折が強い
–  垂直ならば
•  反射が強い
Reflection
Refraction
Reflection
Refraction
<
<
15モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
FRESNEL
} 割合は一様ではない
} 視線ベクトルと表面の法線ベクトルの角度
–  平行ならば
•  屈折が強い
–  垂直ならば
•  反射が強い
} Schlick’s approximation
Schlick
View : Normal
= Orthogonal
View : Normal
= Parallel
 Small IOR  Large IOR
16モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFRACTION + REFLECTION
} 表面で二本のレイをキャスト*
–  反射のレイ
–  屈折のレイ
* レイの数が増えすぎる問題はあるが
17モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFLECTION (SPECULAR)
} 鏡面反射
} 出射する光の強さ == 入射する光の強さ x フレネル
θi = θo
18モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
} レイトレーシング
} モンテカルロレイトレーシング
19モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MAJOR SURFACE TYPES
MONTE CARLO RAY TRACING
21モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATT
} Lambert
} Oren Nayar
–  よりMattな表面
22モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATT
} Lambert
} 表面に当たった光は全ての方向に反射
} ある方向に出て行く光は全ての方向から入ってきた光で決まる
23モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATT
} Lambert
} 表面に当たった光は全ての方向に反射
} ある方向に出て行く光は全ての方向から入ってきた光で決まる
} どうやって全ての方向から入射する光を求める?
24モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATT
} Lambert
} 表面に当たった光は全ての方向に反射
} ある方向に出て行く光は全ての方向から入ってきた光で決まる
} どうやって全ての方向から入射する光を求める?
–  光源が占める角度を知りたい
–  点光源の場合は簡単
25モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATT
} Lambert
} 表面に当たった光は全ての方向に反射
} ある方向に出て行く光は全ての方向から入ってきた光で決まる
} どうやって全ての方向から入射する光を求める?
–  光源が占める角度を知りたい
–  点光源の場合は簡単
–  面光源の場合は?
•  Monte Carlo Integration!
26モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
INTEGRATE INCOMING LIGHT
} どれだけの光が半球から入ってくるか?
} Q: 光源の占める角度を知りたい
27モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
IDEA
} 半球を分割
} それぞれの領域について光源があるかチェック
28モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
IDEA
} 半球を分割
} それぞれの領域について光源があるかチェック
} それぞれの領域にレイを飛ばす
–  Sampleを生成する
29モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
IDEA
} 8本のレイ(sample)のうち2本ヒット
} 半球の約2/8が光源に覆われていると推測できる
} 定式化は
–  単位半球上の面積 (3D)
–  単位半円上の長さ (2D)
•  割合 x 円周 =
2
8
π
30モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
IDEA
}  半球を分割
}  それぞれの領域について光源があるかチェック
–  8 samples
}  サンプルの重み (正規化)
}  2ヒット
(== ratio to total length)
}  単位半円の円周 (2D)
}  光源の面積
Flatten
π ×
2
8
= π
i<8
∑
i=0
1
8
L(i) = π
i<8
∑
i=0
wiL(i)
wi =
1
8
,
∑
wi = 1
π =
∫Ω
dω
2
8
≈
∫Ω
L(ω)dω
31モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MOTE CARLO INTEGRATION
}  ランダムなレイ(sample) を引く (Draw)
}  サンプルが光源に当たるかチェック
–  8 samples
}  サンプルの重み
}  2ヒット
}  光源の面積
–  総サンプル数で割る (正規化)
Flatten
wi = π,
∑
wi = 8π
2π
1
8
× 2π =
2
8
π
32モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MONTE CARLO INTEGRATION
} A numerical integration suited for
–  Integration of a complex high dimensional function
} Draw a random sample
} Calculate a weighted average
∫Ω
L(ω)dω ≈
i<8
∑
i=0
wiLi
=
1
n
i<n
∑
i=0
Li
pdfi
pdfi =
1
π
, n = 8
Formula we see in a textbook
33モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATT
} Lambert
} 表面に当たった光は全ての方向に反射
} ある方向に出て行く光は全ての方向から入ってきた光で決まる
} どうやって全ての方向から入射する光を求める?
–  光源が占める角度を知りたい
34モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATT SURFACE EVALUATION
Ray0 Ray1 Ray2 Ray3 Ray4 Ray5 Ray6 Ray7
Hit? 0 0 0 0 0 0 1 1
Brdf 1/pi 1/pi 1/pi 1/pi 1/pi 1/pi 1/pi 1/pi
cos(n,l) c0 c1 c2 c3 c4 c5 c6 c7
Li(ωi) =
∫Ω
fwhiteLi(ωi)cos θdω
(
1
π
c6 +
1
π
c7)
π
8
∫Ω
L(ω)dω
+
x x x x x x x x
35モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
WHERE PI COMES FROM?
} Lambert
} Distribute energy uniformly
} Pure white surface
–  Incoming light == sum of outgoing light (reflected
light)
} BRDF for a Lambert surface
flambert(x, ωi, ωo) =
R
π
Li(ωi) =
∫Ω
fwhiteLi(ωi)cos θdω fwhite =
1
π
==
Incoming light Sum of reflected light
The image cannot be displayed. Your computer may not have enough memory to open the
image, or the image may have been corrupted. Restart your computer, and then open the file
again. If the red x still appears, you may have to delete the image and then insert it again.
36モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REFLECTION SURFACE EVALUATION
Ray0 Ray1 Ray2 Ray3 Ray4 Ray5 Ray6 Ray7
Hit? 0 0 0 0 0 0 1 1
Brdf 0 0 0 0 0 0 0 b7
cos(n,l) c0 c1 c2 c3 c4 c5 c6 c7
(b7c7)
π
8
+
x x x x x x x x
37モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
GLOSSY
} Microfacet
} 様々なglossinessを表現できる
–  鋭いspecularに近いものから鈍いmattに近いものまで
38モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
GLOSSY
} Microfacet
} 様々なglossinessを表現できる
–  鋭いspecularに近いものから鈍いmattに近いものまで
} Torrance-Sparrowモデル
–  表面の法線は分散を持っている (Distribution) D
–  フレネル F
–  表面自体のocclusion G
Wide distribution Mid distribution Narrow distribution
fmf (n, l, e) =
DFG
4 cos(n, l)cos(n, e)
39モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
GLOSSY (MICROFACET)
} Microfacet
} 様々なglossinessを表現できる
–  鋭いspecularに近いものから鈍いmattに近いものまで
} Torrance-Sparrowモデル
–  表面の法線は分散を持っている (Distribution) D
–  フレネル F
–  表面自体のocclusion G
40モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
GLOSSY SURFACE EVALUATION
Ray0 Ray1 Ray2 Ray3 Ray4 Ray5 Ray6 Ray7
Hit? 0 0 0 0 0 0 1 1
Brdf b0 b1 b2 b3 b4 b5 b6 b7
cos(n,l) c0 c1 c2 c3 c4 c5 c6 c7
(b6c6 + b7c7)
π
8
+
x x x x x x x x
ADVANCED TOPICS
}  Why noisy result?
}  Better sampling
}  How can we make a realistic material?
}  Complex materials
}  Want to have light bounce
}  Indirect illumination
}  Where are nice effects?
}  Distributed ray tracing
NOISE REDUCTION
(IMPORTANCE SAMPLING)
43モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
BETTER SAMPLING
} ノイズはどこから?
} Monte Carlo Integrationを使っているから
–  サンプルの数が十分ではない
–  ランダムサンプリング
–  サンプルの取り方の小さな違い
•  => 異なった結果
44モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
BETTER SAMPLING
} 均一な分割を用いてサンプルを生成した
} 運が悪いと結果が大きく異なる
Flatten
Ans = 2/8 (8 samples)
45モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
BETTER SAMPLING
} 均一な分割を用いてサンプルを生成した
} 運が悪いと結果が大きく異なる
} どうにか改善できないか?
–  もし光源の場所がわかっていたら?
Flatten
Ans = 1/8 (8 samples)
46モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
BETTER SAMPLING
} 均一ではないスプリット
} 重みを変える必要がある
} より多くのサンプルを光源方向に
–  6 samples, w = 1/16
–  2 samples, w = 5/16
} 光源の面積 Flatten
Ans = 3/16 pi (8 samples)
1/165/16
1
16
× 3 × π =
3
16
π
47モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
BETTER SAMPLING
} 均一ではないスプリット
} 重みを変える必要がある
} より多くのサンプルを光源方向に
–  4 samples, w = 1/16
–  2 samples, w = 6/16
} 光源の面積
} サンプル数を減らしたけど同じ結果
–  精度の向上
} Importance sampling
–  より多くのサンプルをターゲットの周辺に
–  重みを修正 (pdfを上げる、下げる)
–  ライトサンプリング
Flatten
Ans = 3/16 pi (6 samples)
1/166/16
1
16
× 3 × π =
3
16
π
48モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
IMPORTANCE SAMPLING EXAMPLE
Uniform Sampling Light Sampling
49モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
LIGHT SAMPLING ENOUGH?
Matt Surface
} ライトサンプリングが有効
Glossy Surface
} ライトサンプリングが有効ではない
} BRDFの値の大きい方向にサンプルを生成した方が
よい
–  BRDFサンプリング
50モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
IMPORTANCE SAMPLING
} ライトサンプリング
} BRDFサンプリング
} Multiple importance sampling
–  Sample light, but adjust weight by BRDF distribution
–  Sample BRDF, but adjust weight by Light distribution
better >>>> worse
worse <<<< better
COMPLEX MATERIALS
52モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
LITTLE BIT MORE ABOUT MATT
} どんなMattな表面でも光を鏡面反射している
–  紙でも
–  完全な拡散だけではない
–  ある程度の光が鏡面反射し、ある程度の光が拡散
} 見る角度によって反射が変わる?
53モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REALISTIC MATT MATERIAL
} どんなMattな表面でも光を鏡面反射している
–  紙でも
–  完全な拡散だけではない
–  ある程度の光が鏡面反射し、ある程度の光が拡散
} 見る角度によって反射が変わる?
–  表面でフレネルの効果が起こっている
–  物体の屈折率 (ior)
54モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REALISTIC MATT MATERIAL
} どんなMattな表面でも光を鏡面反射している
–  紙でも
–  完全な拡散だけではない
–  ある程度の光が鏡面反射し、ある程度の光が拡散
} 見る角度によって反射が変わる?
–  表面でフレネルの効果が起こっている
–  物体の屈折率 (ior)
–  透明な物体の反射屈折に似ている
55モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
WHAT IS MATT SURFACE??
} どんな表面でも光は鏡面反射
} 反射しなかった光は内部に屈折
–  散乱せずに直進するのが純粋な屈折
–  Mattな表面は屈折した光が散乱してどの方向にも均等に出て行く
56モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
REALISTIC MATT MATERIAL
} モデル化
–  2 layer model
–  1st layer: Specular
–  2nd layer: Matt
} Spec x (1-f) + Matt x f
–  f == Fresnel
1-f
f
57モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
WHAT WE HAVE SO FAR
} いくつかのBRDFモデルのみ
} どの表面でもフレネル効果が現れている
} これらだけでリアルなマテリアルの表現ができるのか?
Specular (R) Glossy MattSpecular (T)
58モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
COMPLEX MATERIAL EXAMPLES
59モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
WOOD TILE
} 2レイヤーモデル
–  Glossy
–  Matt
} Glossy x (1-f) + Matt x f
1-f
f
60モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
WOOD TILE
} 2レイヤーモデル
–  Glossy
–  Matt
} Glossy x (1-f) + Matt x f
1-f
f
x (1-f) + x f
61モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
CARBON FIBER
} 3レイヤーモデル
–  Specular
–  Glossy
–  Matt
1-f
f
1-f
f
62モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
Matt Glossy M+G M+G+Specular
63モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
SOMETHING
} 4レイヤーモデル
–  Specular
–  Refraction
–  Glossy
–  Matt
1-f
f
1-f
f
1-f
f
64モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
Matt + Glossy Transparent M+G+T M+G+T+Specular
65モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MATERIAL DESCRIPTION
} fres(G, M)
} fres(S, mix(G, M, 0.5))
} fres(S, add(T, fres(G, M)))
INDIRECT ILLUMINATION
67モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
COMPARISON
Direct Illumination Indirect Illumination
68モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
INDIRECT ILLUMINATION
} ダイレクトイルミネーション
–  半球上から入射する光の総和を推測
–  8サンプル (レイ)
–  ライトに当たったサンプルは0でない値
69モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
INDIRECT ILLUMINATION
} インダイレクトイルミネーション
–  半球上から入射する光の総和を推測
–  8サンプル (レイ)
–  物体に当たったサンプルは0でない値
} 表面から来る光はどのくらい?
??
70モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
LIGHT FROM SURFACE
} 表面から届く光はダイレクトイルミネーションの計算と
同じように行うことができる
We were solving this We want to solve this
71モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
SOLUTION 1
} 8サンプル (レイを飛ばす)
} 8サンプルの値の重み付け和を求める
} .
} 欠点
–  キャストするレイの数が急激に増加
•  レイの総数 = プライマリレイの数 x 8 x 8
•  高い解像度でのレンダリング
•  アンチエイリアシング
–  2バウンド以上だとレイの数が指数関数的に増加
•  バウンドの多いレンダリングに不向き
wi =
π
8
Lo(ωo) ≈
∑
π
8
f(x, n, ωi)Li(ωi)cos(n, ωi)
Lo(ωo) ≈
∑
π
8
f(x, n, ωi)Li(ωi)cos(n, ωi)
72モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
SOLUTION 1
} 1サンプル
} その値だけを用いて光の総和を推定
} .
} 利点
–  飛ばすレイの数が少ない
–  バウンドの多いレンダリングに向いている
} 欠点
–  ノイジーな結果
–  ノイズを減らすため多くのサンプルを生成する必要がある
} 一般的なパストレーシング
–  レイのバウンドが終わるまで追っていく
Lo(ωo) ≈
∑
π
8
f(x, n, ωi)Li(ωi)cos(n, ωi)
Lo(ωo) ≈
π
1
f(x, n, ωi)Li(ωi)cos(n, ωi)
wi =
π
1
OTHER EFFECTS
74モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
SO FAR
} Monte Carlo Integrationを半球上の入射光の積分に用いた
} Monte Carlo Integrationを他の積分に用いる
–  レンズ
–  時間
75モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
OTHER EFFECTS
Depth of Field (Integrate over lens) Motion blur (Integrate over time)
OPENCL
77モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MC RT IS SLOW!
} Computation takes a long time
–  Monte Carlo ray tracing need to cast a lot of rays/pixel
} Slow iteration
–  Inefficient development
–  Cannot test a lot
} If we can make it faster, we can
–  Test more
•  Software reliability
–  Go further
•  Better algorithm
} Computer history == Make it faster!
} Options
–  Algorithm improvement
–  Exploit hardware
78モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
WHY OPENCL?
} Using OpenCL is equivalent to
–  Efficient usage of computational resources
–  Use GPU
–  Use multi-core CPU more efficiently
} GPU has high peak performance
–  AMD Radeon HD 7970 (GCN Architecture)
•  3.8 TFLOPS (S)
•  974 GFLOPS (D)
•  264 GB/s
–  Parallel computation
•  128 SIMD engines
–  64 wide SIMD
79モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
OPENCL
} Open Compute Language (OpenCL) for parallel processors (including GPU)
} OpenCL 1.0 specification released in 2008
} Now v1.2
} ISO C99 with extensions and restrictions
} Software portability
–  Cross platform support
•  Windows, Mac, Linux
–  Multi device support
•  GPU
–  AMD, NVIDIA, Intel
•  CPU
•  etc
–  Write once, run on all the supported
} Direct Compute
–  Need DX
–  GPU only
80モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
CPU VECTOR ADD
} CPU code is simple
float* a = new float[n];
float* b = new float[n];
float* c = new float[n];
for(int i=0; i<n; i++)
{
b[i] = i;
c[i] = n;
}
for(int i=0; i<n; i++)
{
a[i] = b[i] + c[i];
}
delete [] a;
delete [] b;
delete [] c;
Memory allocation
Initialization
Computation
Memory deallocation
81モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
TO IMPLEMENT USING OPENCL
} Need to do 3 things
1.  OpenCL memory has to be allocated, deallocated
2.  Computation has to be written as OpenCL kernel
3.  OpenCL kernel has to be executed via OpenCL APIs
82モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MEMORY ALLOCATION/DEALLOCATION
} CPU
–  Allocation
–  Deallocation
} OpenCL
–  Allocation
–  Deallocation
float* a = new float[n];
delete [] a;
cl_mem a = clCreateBuffer( context, CL_MEM_READ_WRITE, sizeof(float)*n, 0, &e );
clReleaseMemObject( a );
Memory size in byte
83モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
COMPUTE USING OPENCL KERNEL
} CPU
–  n items are executed in serial
} OpenCL
–  n items are executed in parallel
–  A work item processes an item
–  Write program (OpenCL Kernel) for a work item
–  Not in the host C code
for(int i=0; i<n; i++)
{
a[i] = b[i] + c[i];
}
__kernel
void addKernel( __global float* a,
__global float* b,
__global float* c )
{
int i = get_global_id(0);
a[i] = b[i] + c[i];
}
__global : for a memory allocated in global memory
__local : for a memory allocated in local memory
Can use the code for computations in this pattern
84モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
EXECUTE OPENCL KERNEL
} Set OpenCL memories as arguments
–  Specify the index of the argument
} Execute kernel
clSetKernelArg(kernel1, 0, sizeof(cl_mem), (void*)&a);
clSetKernelArg(kernel1, 1, sizeof(cl_mem), (void*)&b);
clSetKernelArg(kernel1, 2, sizeof(cl_mem), (void*)&c);
clEnqueueNDRangeKernel( queue, kernel1, 1, 0, gSize, lSize, 0, 0, 0 );
__kernel
void addKernel( __global float* a,
__global float* b,
__global float* c )
{
int i = get_global_id(0);
a[i] = b[i] + c[i];
}
Order of an argument
Work group size [64, 1, 1]
Global work size [n,1,1]
85モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
OPENCL VECTOR ADD
__kernel
void initKernel( __global float* b,
__global float* c )
{
int i = get_global_id(0);
b[i] = i;
c[i] = i;
}
__kernel
void addKernel( __global float* a,
__global float* b,
__global float* c )
{
int i = get_global_id(0);
a[i] = b[i] + c[i];
}
cl_mem a = clCreateBuffer( context, CL_MEM_READ_WRITE, sizeof(float)*n, 0, &e );
cl_mem b = clCreateBuffer( context, CL_MEM_READ_WRITE, sizeof(float)*n, 0, &e );
cl_mem c = clCreateBuffer( context, CL_MEM_READ_WRITE, sizeof(float)*n, 0, &e );
clSetKernelArg(kernel0, 0, sizeof(cl_mem), (void*)&b);
clSetKernelArg(kernel0, 1, sizeof(cl_mem), (void*)&c);
clEnqueueNDRangeKernel( queue, kernel0, 1, 0, gSize, lSize, 0, 0, 0 );
clSetKernelArg(kernel1, 0, sizeof(cl_mem), (void*)&a);
clSetKernelArg(kernel1, 1, sizeof(cl_mem), (void*)&b);
clSetKernelArg(kernel1, 2, sizeof(cl_mem), (void*)&c);
clEnqueueNDRangeKernel( queue, kernel1, 1, 0, gSize, lSize, 0, 0, 0 );
clReleaseMemObject( a );
clReleaseMemObject( b );
clReleaseMemObject( c );
Memory allocation
Initialization
Computation
Memory deallocation
86モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
CODE COMPARISON
CPU OpenCL
float* a = new float[n];
float* b = new float[n];
float* c = new float[n];
for(int i=0; i<n; i++)
{
b[i] = i;
c[i] = n;
}
for(int i=0; i<n; i++)
{
a[i] = b[i] + c[i];
}
delete [] a;
delete [] b;
delete [] c;
cl_mem a = clCreateBuffer( context, CL_MEM_READ_WRITE, siz
cl_mem b = clCreateBuffer( context, CL_MEM_READ_WRITE, siz
cl_mem c = clCreateBuffer( context, CL_MEM_READ_WRITE, siz
clSetKernelArg(kernel0, 0, sizeof(cl_mem), (void*)&b);
clSetKernelArg(kernel0, 1, sizeof(cl_mem), (void*)&c);
clEnqueueNDRangeKernel( queue, kernel0, 1, 0, gSize, lSize
clSetKernelArg(kernel1, 0, sizeof(cl_mem), (void*)&a);
clSetKernelArg(kernel1, 1, sizeof(cl_mem), (void*)&b);
clSetKernelArg(kernel1, 2, sizeof(cl_mem), (void*)&c);
clEnqueueNDRangeKernel( queue, kernel1, 1, 0, gSize, lSize
clReleaseMemObject( a );
clReleaseMemObject( b );
clReleaseMemObject( c );
Memory allocation
Initialization
Computation
Memory deallocation
87モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
IMPLEMENT DIRECT LIGHTING
} Generate ray
} Cast ray
} Generate sample ray
} Cast shadow ray
} Accumulate result
88モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
SINGLE KERNEL IMPLEMENTATION
} Describe everything in a kernel
} Pros
–  Easy to implement
•  Straightforward port from CPU implementation
} Cons
–  Poor HW utilization
–  Divergence
–  Register pressure
Host:
executeKernel(SingleKernel);
Device:
__kernel
void SingleKernel()
{
while( i < maxSamples )
{
GenerateRay();
CastRay();
if( hit )
{
GenerateSampleRay();
CastShadowRay();
AccumulateResult();
}
}
}
89モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
DIVERGENCE
} 1st
–  Generate Ray
–  Cast Ray
–  Generate Sample Ray
–  Cast Shadow Ray
–  Accumulate Result
90モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
MULTIPLE KERNEL IMPLEMENTATION
} Split the pipeline into multiple kernels
} Pros
–  Better HW utilization
–  More room for optimization
} Cons
–  Need more work than single kernel implementation
–  Host has to queue more OpenCL commands
–  Each kernel has to read/write ray info
Host:
while( i < maxSamples )
{
executeKernel(RayGenerationKernel);
executeKernel(RayCastKernel);
executeKernel(SampleRayKernel);
executeKernel(RayCastKernel);
executeKernel(AccumulationKernel);
}
Device:
__kernel
void RayCastKernel()
{
}
91モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
DIVERGENCE
} 1st
–  Generate Ray
–  Cast Ray
–  Generate Sample Ray
–  Cast Shadow Ray
–  Accumulate Result
92モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
DIVERGENCE 2 BOUNCES
} 1st
–  Generate Ray
–  Cast Ray
–  Generate Sample Ray
–  Cast Shadow Ray
–  Accumulate Result
} 2st
–  Generate Ray
–  Cast Ray
–  Generate Sample Ray
–  Cast Shadow Ray
–  Accumulate Result
93モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
DIVERGENCE
} 1st
–  Generate Ray
–  Cast Ray
–  Generate Sample Ray
–  Cast Shadow Ray
–  Accumulate Result
} 2st
–  Generate Ray
–  Cast Ray
–  Generate Sample Ray
–  Cast Shadow Ray
–  Accumulate Result
94モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
TIPS
} Starting
–  Single kernel implementation
–  Share data types with host (float4)
•  Easy to share functions
–  Replace pointers to indices
} Debugging
–  Printf
–  Debug buffers
} Others
–  Cache compiled kernel
•  Reduce compilation time
Coumans, E., Multithreading and VFX Course note, SIGGRAPH 2013
95モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
EXAMPLES
} All figures in this presentation are generated by an OpenCL renderer
–  Radeon HD 7970
96モンテカルロレイトレーシングの基礎からOpenCLによる実装まで | AUG, 2013
WHAT IS COVERED
} BRDF
–  Reflection, refraction, glossy, matt
} Fresnel
} Monte Carlo Integration
–  Direct Illumination
–  Indirect Illumination
} Importance Sampling
–  Light sampling
–  BRDF sampling
} Layered Materials
} OpenCL Introduction
} Tips for OpenCL implementation

More Related Content

What's hot (20)

PDF
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Takahiro Harada
 
PDF
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
Morpho, Inc.
 
PDF
멀티스레드 렌더링 (Multithreaded rendering)
Bongseok Cho
 
PDF
コンピュテーショナルフォトグラフティの基礎
Norishige Fukushima
 
PDF
Graphics Gems from CryENGINE 3 (Siggraph 2013)
Tiago Sousa
 
PPTX
Parallel Graphics in Frostbite - Current & Future (Siggraph 2009)
repii
 
PDF
VAEs for multimodal disentanglement
Antonio Tejero de Pablos
 
PPTX
ResNetの仕組み
Kota Nagasato
 
PDF
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
 
PDF
生成モデルの Deep Learning
Seiya Tokui
 
PDF
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...
Deep Learning JP
 
PDF
[DL輪読会]近年のエネルギーベースモデルの進展
Deep Learning JP
 
PPTX
Optimizing the Graphics Pipeline with Compute, GDC 2016
Graham Wihlidal
 
PPTX
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
Kosuke Shinoda
 
PPTX
Superpixel Sampling Networks
yukihiro domae
 
PDF
Siggraph2016 - The Devil is in the Details: idTech 666
Tiago Sousa
 
PDF
CVIM#11 3. 最小化のための数値計算
sleepy_yoshi
 
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
 
PDF
「原神」におけるコンソールプラットフォーム開発
Unity Technologies Japan K.K.
 
PDF
ディープラーニングの2値化(Binarized Neural Network)
Hideo Terada
 
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Takahiro Harada
 
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
Morpho, Inc.
 
멀티스레드 렌더링 (Multithreaded rendering)
Bongseok Cho
 
コンピュテーショナルフォトグラフティの基礎
Norishige Fukushima
 
Graphics Gems from CryENGINE 3 (Siggraph 2013)
Tiago Sousa
 
Parallel Graphics in Frostbite - Current & Future (Siggraph 2009)
repii
 
VAEs for multimodal disentanglement
Antonio Tejero de Pablos
 
ResNetの仕組み
Kota Nagasato
 
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
 
生成モデルの Deep Learning
Seiya Tokui
 
[DL輪読会]Progressive Growing of GANs for Improved Quality, Stability, and Varia...
Deep Learning JP
 
[DL輪読会]近年のエネルギーベースモデルの進展
Deep Learning JP
 
Optimizing the Graphics Pipeline with Compute, GDC 2016
Graham Wihlidal
 
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
Kosuke Shinoda
 
Superpixel Sampling Networks
yukihiro domae
 
Siggraph2016 - The Devil is in the Details: idTech 666
Tiago Sousa
 
CVIM#11 3. 最小化のための数値計算
sleepy_yoshi
 
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
 
「原神」におけるコンソールプラットフォーム開発
Unity Technologies Japan K.K.
 
ディープラーニングの2値化(Binarized Neural Network)
Hideo Terada
 

More from Takahiro Harada (17)

PDF
LSNIF: Locally-Subdivided Neural Intersection Function
Takahiro Harada
 
PDF
Neural Texture Block Compression (MAM-MANER Workshop at EGSR 2024)
Takahiro Harada
 
PDF
201907 Radeon ProRender2.0@Siggraph2019
Takahiro Harada
 
PDF
[2018 GDC] Real-Time Ray-Tracing Techniques for Integration into Existing Ren...
Takahiro Harada
 
PDF
Introduction to OpenCL (Japanese, OpenCLの基礎)
Takahiro Harada
 
PDF
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow
Takahiro Harada
 
PDF
確率的ライトカリング 理論と実装 (CEDEC2016)
Takahiro Harada
 
PDF
Introducing Firerender for 3DS Max
Takahiro Harada
 
PDF
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays
Takahiro Harada
 
PDF
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Takahiro Harada
 
PDF
Foveated Ray Tracing for VR on Multiple GPUs
Takahiro Harada
 
PDF
Physics Tutorial, GPU Physics (GDC2010)
Takahiro Harada
 
PDF
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)
Takahiro Harada
 
PDF
Using GPUs for Collision detection, Recent Advances in Real-Time Collision an...
Takahiro Harada
 
PDF
Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)
Takahiro Harada
 
PDF
A Parallel Constraint Solver for a Rigid Body Simulation (SIGGRAPH ASIA 2011)
Takahiro Harada
 
PDF
Forward+ (EUROGRAPHICS 2012)
Takahiro Harada
 
LSNIF: Locally-Subdivided Neural Intersection Function
Takahiro Harada
 
Neural Texture Block Compression (MAM-MANER Workshop at EGSR 2024)
Takahiro Harada
 
201907 Radeon ProRender2.0@Siggraph2019
Takahiro Harada
 
[2018 GDC] Real-Time Ray-Tracing Techniques for Integration into Existing Ren...
Takahiro Harada
 
Introduction to OpenCL (Japanese, OpenCLの基礎)
Takahiro Harada
 
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow
Takahiro Harada
 
確率的ライトカリング 理論と実装 (CEDEC2016)
Takahiro Harada
 
Introducing Firerender for 3DS Max
Takahiro Harada
 
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays
Takahiro Harada
 
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Takahiro Harada
 
Foveated Ray Tracing for VR on Multiple GPUs
Takahiro Harada
 
Physics Tutorial, GPU Physics (GDC2010)
Takahiro Harada
 
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)
Takahiro Harada
 
Using GPUs for Collision detection, Recent Advances in Real-Time Collision an...
Takahiro Harada
 
Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)
Takahiro Harada
 
A Parallel Constraint Solver for a Rigid Body Simulation (SIGGRAPH ASIA 2011)
Takahiro Harada
 
Forward+ (EUROGRAPHICS 2012)
Takahiro Harada
 
Ad

Recently uploaded (9)

PDF
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
PDF
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
PDF
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
PDF
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
PDF
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
PPTX
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
PDF
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
PDF
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
PPTX
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
Ad

Introduction to Monte Carlo Ray Tracing (CEDEC 2013)