SlideShare a Scribd company logo
“Generalized Correspondence-LDA Models (GC-LDA)
for Identifying Functional Regions in the Brain”
ML,CV,NLP関連論文読み会@ABEJA 2017/06/18
慶應義塾大学 水口達矢
自己紹介
名前
* 水口達矢(慶應義塾大学 榊原研究室 M1)
研究内容
* 電子カルテから自動診断(データベース、自然言語処理)
趣味
* 歌を歌う、フットサル
目次
LDAとCorr-LDAについて
* LDAで文書分類
* Corr-LDAで画像の自動アノテート
脳について
* 脳機能地図とfMRI
本研究について
* corr-LDAをfMRIに応用
* Generalized corr-LDA(GC-LDA)
論文の主旨…LDAを用いて脳機能を解析する
目次
LDAとCorr-LDAについて
* LDAで文書分類
* Corr-LDAで画像の自動アノテート
脳について
* 脳機能地図とfMRI
本研究について
* corr-LDAをfMRIに応用
* Generalized corr-LDA(GC-LDA)
論文の主旨…LDAを用いて脳機能を解析する
統計的潜在意味解析
・データの背後にある意味(トピック)を統計的に解析する手法
・トピックモデル:LSI、 PLSI、LDA
日本経済の緩やかな景気回復が続き…
サッカー日本代表が五輪に向けて合宿を…
女優のAさんが電撃結婚!その経緯は?…
ネットNews
記事を選択
スポーツ
が読みたい!
なるべく「スポーツ」の記事を紹介したい
統計的潜在意味解析
・データの背後にある意味(トピック)を統計的に解析する手法
・トピックモデル:LSI、 PLSI、LDA
日本経済の緩やかな景気回復が続き…
サッカー日本代表が五輪に向けて合宿を…
女優のAさんが電撃結婚!その経緯は?…
ネットNews
記事を選択
なるべく「スポーツ」の記事を紹介したい
各文章にトピックを割り当てる
スポーツ
が読みたい!
経済 スポーツ 芸能
統計的潜在意味解析
・データの背後にある意味(トピック)を統計的に解析する手法
・トピックモデル:LSI、 PLSI、LDA
日本経済の緩やかな景気回復が続き…
サッカー日本代表が五輪に向けて合宿を…
女優のAさんが電撃結婚!その経緯は?…
ネットNews
記事を選択
なるべく「スポーツ」の記事を紹介したい
各文章にトピックを割り当てる
スポーツ
が読みたい!
経済 スポーツ 芸能
スポーツのトピックが多く含まれているものを紹介する
LDA[blei et al.,2003]
サッカー日本代表が五輪に向けて合宿を…
経済 スポーツ 芸能
・Latent Dirichlet Allocation
・文章集合を生成する確率モデル(トピックモデル)
・文章ごとにトピック分布、トピックごとに単語分布を仮定
文章ごとのトピック分布 トピックごとの単語分布
サッカー 野球 五輪
ディリクレ分布(α) ディリクレ分布(β)
LDA[blei et al.,2003]
サッカー
日本
代表
五輪
文章数M
トピック数 T
単語分布(φ)
ディリクレ
分布(β)
トピック(y)
ディリクレ分布(α)
トピック分布(θ)
単語数Nd
目次
LDAとCorr-LDAについて
* LDAで文書分類
* Corr-LDAで画像の自動アノテーション
脳について
* 脳機能地図とfMRI
本研究について
* corr-LDAをfMRIに応用
* Generalized corr-LDA(GC-LDA)
画像の自動アノテーション
・画像に自動で情報(ラベル)をつけるタスク
・Corr-LDA、CNN+RNNなどの手法が提案
nature
sea
mountain
tree
生成
Step2.アノテーションの自動生成
画像
yellow fish is swimming
in the sea
画像
ラベル
Step1.画像とラベルの関係を学習
ラベル
Corr-LDA[blei et al.,2003]
yellow fish is swimming
in the sea
トピック:sea 単語分布
・LDAを応用すれば画像のラベルを自動でつけられる
LDA: トピックごとに単語分布
Corr-LDA: トピックごとに単語分布と画像の分布
LDA
Corr-LDA[blei et al.,2003]
yellow fish is swimming
in the sea
トピック:sea 単語分布
・LDAを応用すれば画像のアノテーションを自動でつけられる
LDA: トピックごとに単語分布
Corr-LDA: トピックごとに単語分布と画像の分布
Corr-LDA
画像のための分布
画像をサンプリング?
Corr-LDA[blei et al.,2003]
yellow fish is swimming
in the sea
トピック:sea 単語分布
・LDAを応用すれば画像のアノテーションを自動でつけられる
LDA: トピックごとに単語分布
Corr-LDA: トピックごとに単語分布と画像の分布
Corr-LDA
画像のための分布
SIFT特徴量をサンプリング
特徴量A
特徴量K
特徴量J
画像の特徴抽出
Step1.SIFT特徴量[D.G,Lowe1999]を抽出
SIFT特徴量の抽出(拡大縮小、回転、明暗に強い)
画像の特徴抽出
Step1.SIFT特徴量[D.G,Lowe1999]を抽出 Step2.クラスタリングにより分類
SIFT特徴量の抽出(拡大縮小、回転、明暗に強い)
画像の特徴抽出
特徴量A
特徴量C
特徴量B
Step1.SIFT特徴量[D.G,Lowe1999]を抽出 Step2.クラスタリングにより分類
SIFT特徴量の抽出(拡大縮小、回転、明暗に強い)
Corr-LDA[blei et al.,2003]
yellow fish is swimming
in the sea
トピック:sea 単語分布
Corr-LDA
特徴量分布
SIFTで抽出した特長量をサンプリング
特徴量A
特徴量K
特徴量J
画像を特徴点で表現したことで、単語のように扱える!
( Bag-of-Words ならぬ Bag-of-Features )
特徴量A
特徴量K
特徴量J
Corr-LDA[blei et al.,2003]
yellow
fish
swim
sea
データ数
トピック数
単語分布(φ)
ディリクレ
分布(β)
トピック(y)
ディリクレ分布(α)
トピック(z)
トピック分布(θ)
特徴量数単語数
特徴量A
特徴量K
特徴量J
特徴量分布(Λ)
目次
LDAとCorr-LDAについて
* LDAで文書分類
* Corr-LDAで画像の自動アノテート
脳について
* 脳機能地図とfMRI
本研究について
* corr-LDAをfMRIに応用
* Generalized corr-LDA(GC-LDA)
脳
動物の頭部にある、神経系の中枢。
脊髄とともに中枢神経系をなし、感情・思考・生命維持その他神経活動の中心的、
指導的な役割を担う。
脳とは?
1割の神経細胞(ニューロン)と9割のグリア細胞から構成
(wikipedia)
脳機能地図
脳機能局在論
脳は部位ごとに違う機能を担っているとする説
脳機能地図
認知機能が脳のどこに局在しているのかを表した地図
1861年にブローカが言語中枢を発見以降、認知神経科学の大きな目標
1909年にブロードマンが脳地図が完成(神経細胞の染色)
https://nurseful.jp/career/nursefulshikkanbetsu/cranialnerve/section_1_01_01/
fMRI
fMRI(functional Magnetic Resonance Imaging)
脳の血流動態反応を視覚化し、脳活動をイメージング
非侵襲的な手法として2009年頃から中心的な計測法となる
[smith et al.,2009]
RestingState(安静時状態)
何もしていない状態の脳活動
脳の様々な部位が活動していることが解ってきている
[Michael D. Fox and Michael Greicius.2010]
fMRIによる脳機能地図作成
fMRIによる脳機能地図の作成
認知時のfMRIとRestingStateを比較することで(不)活性化した部位を調べる
[smith et al.,2009]
問題点:1つの動作に複数の認知機能が含まれる
[Michael D. Fox and Michael Greicius.2010]
既存の研究結果を解析(メタ解析)して脳機能地図を作る
目次
LDAとCorr-LDAについて
* LDAで文書分類
* Corr-LDAで画像の自動アノテート
脳について
* 脳機能地図とfMRI
本研究について
* corr-LDAをfMRIメタ解析に応用
* Generalized corr-LDA(GC-LDA)
メタデータ解析による脳機能地図作成
Neurosynth Database
fMRIのデータが1万以上存在
1つのデータには平均35ピーク、46単語の情報量
auditory
adaptivity
effector
function
ピーク(座標) ラベル(単語)
目標:脳機能地図の作成
fMRIにおける既存研究のメタデータ解析
fMRIデータ
auditory
adaptivity
effector
function
Corr-LDA + fMRI
Corr-LDAでfMRIメタデータを学習、トピックを取り出す
Step2.トピックを取り出し、fMRI画像の特徴量とアノテーションを観察
fMRI画像 ラベル
Step1.fMRI画像とアノテーションの関係を学習
特徴量分布
language
semantic
sentence
ラベル
Corr-LDA[blei et al.,2003]
yellow
fish
swim
sea
データ数
トピック数
単語分布(φ)
ディリクレ
分布(β)
トピック(y)
ディリクレ分布(α)
トピック(z)
トピック分布(θ)
特徴量数単語数
特徴量A
特徴量K
特徴量J
特徴量分布(Λ)
データ数
トピック数
単語分布(φ)
ディリクレ
分布(β)
トピック(y)
ディリクレ分布(α)
トピック(z)
トピック分布(θ)
特徴量数単語数
(x1,y1,z1)(x2,y
2,z2)
(x3,y3,z3)
特徴量分布(Λ)
auditory
semantic
effector
language
Generalized Correspondence-LDA Models (GC-LDA)
Data
1. 多変量ガウス分布
認知機能はある地点を中心に分布すると仮定
2. 対称的な多変量混合ガウス分布
左右対象である認知機能を考慮
トピック数
単語分布(φ)
ディリクレ
分布(β)
特徴量分布(Λ)
Generalized Correspondence-LDA Models (GC-LDA)
特徴量分布として2つの分布を試す
Data
1. 多変量ガウス分布
認知機能はある地点を中心に分布すると仮定
2. 対称的な多変量混合ガウス分布
左右対象である認知機能を考慮
トピック数
単語分布(φ)
ディリクレ
分布(β)
特徴量分布(Λ)
Generalized Correspondence-LDA Models (GC-LDA)
特徴量分布として2つの分布を試す
Data
トピック数
単語分布(φ)
ディリクレ
分布(β)
特徴量分布(Λ)
1. 多変量ガウス分布
認知機能はある地点を中心に分布すると仮定
2. 対称的な多変量混合ガウス分布
左右対象である認知機能を考慮
Generalized Correspondence-LDA Models (GC-LDA)
特徴量分布として2つの分布を試す
左右の偏りはあっても良い
トピック数
単語分布(φ)
ディリクレ
分布(β)
特徴量分布(Λ)
・学習(T=200,α=0.1,β=0.01)
・トピックごとの特徴量分布と単語分布を取り出す
脳の領域と単語の関係が抽出される
→脳機能地図が生成させる
Generalized Correspondence-LDA Models (GC-LDA)
結果
文献と同様の結果が得られた (既存の研究結果の要約になっている)
Generalized Correspondence-LDA Models (GC-LDA)
データ数
トピック数
単語分布(φ)
ディリクレ
分布(β)
トピック(y)
ディリクレ分布(α)
トピック(z)
トピック分布(θ)
特徴量数単語数
(x1,y1,z1)(x2,y
2,z2)
(x3,y3,z3)
特徴量分布(Λ)
auditory
semantic
effector
language
γ
γ…トピック(y)からトピック(z)が生成される、という制約を緩める
結果2
タスク
アノテーションから単語(座標)を1部抜き取っておき、その単語(座標)を当てる
auditory
adaptivity
effector
function
ピーク(座標) ラベル(単語)
what is
this word?
結語
・Corr-LDAを拡張したGeneralized Correspondence-LDA(GC-LDA)
を構築した
・GC-LDAを用いてfMRIのメタデータ解析を行った
・パラメータγの導入により精度が向上した(定量的評価)
・脳機能地図の作成において、文献と同様の結果が得られた(定性的評価)
・既存の研究結果の要約と新規仮説の立案への貢献が可能

More Related Content

Featured (20)

PDF
2024 State of Marketing Report – by Hubspot
Marius Sescu
 
PDF
Everything You Need To Know About ChatGPT
Expeed Software
 
PDF
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
 
PDF
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
PDF
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
 
PDF
Skeleton Culture Code
Skeleton Technologies
 
PDF
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
PDF
Content Methodology: A Best Practices Report (Webinar)
contently
 
PPTX
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
PDF
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
PDF
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
PDF
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
PDF
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
PDF
Getting into the tech field. what next
Tessa Mero
 
PDF
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
PDF
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
PDF
Introduction to Data Science
Christy Abraham Joy
 
PDF
Time Management & Productivity - Best Practices
Vit Horky
 
PDF
The six step guide to practical project management
MindGenius
 
PDF
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 
2024 State of Marketing Report – by Hubspot
Marius Sescu
 
Everything You Need To Know About ChatGPT
Expeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
 
Skeleton Culture Code
Skeleton Technologies
 
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 

ML,CV,NLP関連論文読み会 (generalized correspondence-lda models (gc-lda) for identifying functional regions in the brain)

Editor's Notes

  • #3: 紹介する論文は研究とは少し離れた分野、画像寄り、生物寄り
  • #5: 統計的潜在意味解析を説明
  • #6: 統計的潜在意味解析→トピックモデル その使用例をあげる いろんな分野の情報がある。 スポーツ好きな利用者にスポーツの記事を紹介したい。
  • #7: トピックを決めて、記事を色分けする サッカー青
  • #8: 特にLDAについて詳しく話す
  • #9: ここではスポーツ→サッカーの生成過程 確かにこの分布が妥当っぽい 実際にはEMアルゴリズムを用いたMAP推定、ギブスサンプリングで分布が決まる→トピックを取り出す
  • #10: グラフィカルモデル
  • #12: つまり、情報のない画像にアノテーションを付加するタスク 画像検索などに使われる
  • #13: Corr-LDAとは何か
  • #14: Corr-LDAではトピックごとに画像の分布を設ける 画像の生成、サンプリングってどうするの? deConvが流行っているが。。。 :topicの名前
  • #15: Corr-LDA原論文ではSIFTという特徴量を使っている
  • #16: 画像から特徴量抽出
  • #20: グラフィカルモデル
  • #22: ヒトが人たる所以は他の動物にはない大脳皮質の発達 グリア細胞は主にニューロンに栄養を送る役割
  • #23: いろいろな感情や思考をつかさどる脳 脳は普遍的になっているのではなく、部位ごとに機能が分かれている 認知神経科学の分野では脳機能の地図を作ることが大きなタスクの1つ 1861年、運動機能も知恵も聡明だが、言語障害を持った患者がブローカの元を訪れた。 結局その方は亡くなったが、その後の解剖で前頭葉の一部に脳梗塞 昔はつついて(壊して)いた そのあとは染色したり(ブロードマンの脳地図) しかし、最近大きなブレークスルーが起こる
  • #24: CTライクに脳の活動を観測することができる もちろん非侵襲的で患者へのダメージはほとんど無い fMRIによって何もしていない状態でも脳が活動していることが判明 これをRestingStateという
  • #25: fMRIとRestingStateで脳機能地図を作成できる しかし問題点が 例えば料理を食べている映像を見せる→視覚だけでなく、感情、味覚が働く→どの認知機能がどの部位なのか判断しづらい(右上図) 花を見せている研究でも同じ場所が働いていれば、そこは視覚?
  • #26: 脳機能地図の作成のためのメタ解析にCorr-LDAを使用した
  • #27: アノテーションは実際には文章だがストップワードを除去して単語の集合にしている
  • #28: これが複数の研究結果を反映した脳機能地図になっている
  • #29: Corr-LDAの復習
  • #30: Corr-LDAと同じことをやる 違うのは画像の特徴量が位置であること そして分布としてガウス分布を用いる(1つのトピックは、ある地点を中心に分布しているという考え方)
  • #33: 左右の偏りはあってもよい そういった意味で、2は1を包括しているとも言える
  • #34: トピックの特徴量分布と単語分布を取り出せばそれが脳機能地図になっている
  • #35: 実際の結果がこちら A1はきちんと言語野が取れている 聴覚野であるA4がうまく取れてこない(これは聴覚野が左右両方にあってA3と競合したため) 一方でC3では聴覚野がうまく取れている
  • #36: もう一つGC-LDAで改善された点が パラメータγを入れる。γが大きいほど、制約がゆるくなる