非線形の相関関係を 検出する指標の算出
川口勇作 y.kawaguchi@nagoya-u.jp 
Nagoya.R #12 
於:名古屋大学 2014/12/6
メニュー 
1.はじめに 
2.MIC 
3.minervaパッケージ
はじめに 
•相関 
1.二つのものが密接にかかわり合い、一 方が変化すれば他方も変化するような 関係 
2.数学で、一方が増加すると、他方が増 加または減少する、二つの変量の関係 
(デジタル大辞泉より)
はじめに 
•相関 
–一つの値が大きくなるにつれてもう一 方の値が大きく/小さくなる関係 
•気温とアイスの売上 
•カロリー摂取量と体重 
•TOEICスコアと年収 
–線形の関係
101520253035 20406080100120140 気温 アイスの売上
はじめに 
•けど… 
–常に線形の関係ばかりじゃない 
–非線形の関係 
•年齢と身長 
–若いうちは伸びる、年をとると縮む 
•スポーツにおける緊張と成績 
–緊張し過ぎ・リラックスし過ぎだと成績は悪い 
–程よく緊張しているのが良い 
»逆U字の関係
51015 246810 緊張 成績
はじめに 
•ピアソンの積率相関係数 
–線形の関係を想定 
–非線形の関係はうまく検出できない 
–さっきの緊張と成績の例:r = -.01
http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0#mediaviewer/File:Correlation_examples2.svg
はじめに 
•現実のデータは線形ばかりではない 
•世の中には確かに非線形の関係も存在す る 
•線形だけでは現実は見れない 
•非線形の相関も見れる指標を…
MICとは 
•最大情報係数(Maximal Information Coefficient, MIC) 
–Reshef et al. (2011) が考案 
–Science誌の解説文にて「21世紀の相 関」と呼ばれた 
–非線形の相関関係も検出できる指標
MIC 
•MIC 
–R2に準ずる値 
–計算方法 
•相互情報量が最大になるようにグリッドを 引いて計算 
•詳細は原著論文にて
MIC 
原著論文より
MIC 
原著論文より
MIC 
http://lectures.molgen.mpg.de/algsysbio12/MINEPresentation.pdf
minervaパッケージ 
•MICを計算するためのパッケージ 
•「mine」という関数で計算します 
•使い方 
mine(x, y) 
–これだけ 
–cor関数と基本的に同じ使い方
minervaパッケージ 
•mine関数を実行すると、MIC以外に も値がいくつか出てくる 
–MAS 
–MEV 
–MCN 
–MICR2 
–なんかいっぱい出たー
minervaパッケージ 
•大事なものだけ 
–MAS 
•単調性の指標 
–MICR2 
•MICとピアソンの積率相関係数の2乗の差 
•非線形性の指標
minervaパッケージ 
•ちなみにさっきの データなら… 
•r = -.01 
•MIC = 0.892 
(r に換算すると およそ .90!) 
51015 246810 緊張 成績
MICは万能か? 
•否 
–関係性の強さはわかるが、値がどう変 わるかまではMICの数値だけではわから ない 
•散布図やLoessによる平滑化曲線などと併 用して、関係をみることが重要 
–ビッグデータが前提 
•小規模なデータには不適切かも?
参考資料 
Reshef, D. N., Reshef, Y. A., Finucane, H. K., Grossman, S. R., McVean, G., Turnbaugh, P. J., Lander, E. S., Mitzenmacher, M., & Sabeti, P. C. (2011). Detecting novel associations in large data sets. Science, 334, 1518– 1524. 
“相関”の話&そのついでに“21世紀の相関(MIC)”の話(ややマニア向 け)‐ Take a Risk:林岳彦の研究メモ: http://takehiko-i- hayashi.hatenablog.com/entry/20130426/1366948560#fn5 
非線形もOKな相関係数:MIC‐Logics of Blue:http://logics-of- blue.com/%E9%9D%9E%E7%B7%9A%E5%BD%A2%E3%82%82ok%E3%81%AA%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0%EF% BC%9Amic/

More Related Content

PPTX
社会心理学者のための時系列分析入門_小森
PDF
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
PDF
最適化超入門
PDF
21世紀の手法対決 (MIC vs HSIC)
PDF
心理学におけるベイズ統計の流行を整理する
PPTX
ベイズファクターとモデル選択
PDF
星野「調査観察データの統計科学」第3章
PDF
機械学習のためのベイズ最適化入門
社会心理学者のための時系列分析入門_小森
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
最適化超入門
21世紀の手法対決 (MIC vs HSIC)
心理学におけるベイズ統計の流行を整理する
ベイズファクターとモデル選択
星野「調査観察データの統計科学」第3章
機械学習のためのベイズ最適化入門

What's hot (20)

PPTX
強化学習 と ゲーム理論 (MARL)
PDF
階層ベイズとWAIC
PDF
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
PDF
多人数不完全情報ゲームにおけるAI ~ポーカーと麻雀を例として~
PDF
あなたの心にBridgeSampling
PDF
データサイエンス概論第一=8 パターン認識と深層学習
PDF
pymcとpystanでベイズ推定してみた話
PDF
媒介分析について
PDF
相関と因果について考える:統計的因果推論、その(不)可能性の中心
PDF
9 可視化
PPTX
ようやく分かった!最尤推定とベイズ推定
PDF
正準相関分析
PDF
階層モデルの分散パラメータの事前分布について
PDF
機械学習による生存予測
PDF
Stan超初心者入門
PDF
Statistical Semantic入門 ~分布仮説からword2vecまで~
PDF
5分でわかるかもしれないglmnet
PDF
Chapter9 一歩進んだ文法(前半)
PDF
第8章 ガウス過程回帰による異常検知
強化学習 と ゲーム理論 (MARL)
階層ベイズとWAIC
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
多人数不完全情報ゲームにおけるAI ~ポーカーと麻雀を例として~
あなたの心にBridgeSampling
データサイエンス概論第一=8 パターン認識と深層学習
pymcとpystanでベイズ推定してみた話
媒介分析について
相関と因果について考える:統計的因果推論、その(不)可能性の中心
9 可視化
ようやく分かった!最尤推定とベイズ推定
正準相関分析
階層モデルの分散パラメータの事前分布について
機械学習による生存予測
Stan超初心者入門
Statistical Semantic入門 ~分布仮説からword2vecまで~
5分でわかるかもしれないglmnet
Chapter9 一歩進んだ文法(前半)
第8章 ガウス過程回帰による異常検知
Ad

Viewers also liked (6)

PDF
MICの解説
PDF
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
PDF
タイムラインでポジろう!
PDF
数字から読む好不調の波
PPTX
2014年NPBたらいまわされ十傑
PDF
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
MICの解説
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
タイムラインでポジろう!
数字から読む好不調の波
2014年NPBたらいまわされ十傑
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
Ad

More from Yusaku Kawaguchi (20)

PDF
外国語教育研究におけるRを用いた統計処理入門
PDF
Rを用いた外国語教育データの整理・要約
PDF
学習者の英語ライティング方略 使用傾向の操作化―ポーズの位置に着目した予備的検討― 配布資料
PDF
学習者の英語ライティング方略使用傾向の操作化―ポーズの位置に着目した予備的検討―
PDF
外国語教育研究における尺度の構成と妥当性検証
PDF
エッセイライティング中のライティング方略とポーズ 配布資料
PDF
エッセイライティング中のライティング方略とポーズ
PDF
Nagoya.R #16 いろいろできるぞinstallrパッケージ
PDF
Nagoya.R #15 順位相関係数の信頼区間の算出
PPTX
Nagoya.R #14 入門者講習
PDF
学習者のライティング方略は現実のライティングプロセスに反映されるか
PDF
Validation of the computer assisted language learning attitude scale: Focusin...
PDF
外国語における文法的慎重性と性格特性
PDF
Nagoya.R #12 Rprofile作成のススメ
PDF
Nagoya.R #12 入門者講習
PDF
校種間におけるコンピュータ支援語学学習態度の変容:中学生・高校生・大学生を対象とした多母集団の同時分析を用いて
PPTX
エッセイライティングにおける増加語数の時系列推移傾向はエッセイ評価を予測するか―線形回帰モデルおよびポアソン分布へのフィッティングを用いて―
PDF
新しいコンピュータ支援語学学習態度尺度作成の試み:英語を学習する大学生を対象として
PDF
WritingMaetriXと表計算ソフトを用いたライティングプロセスの分析方法
PDF
Nagoya.R #11 入門者講習
外国語教育研究におけるRを用いた統計処理入門
Rを用いた外国語教育データの整理・要約
学習者の英語ライティング方略 使用傾向の操作化―ポーズの位置に着目した予備的検討― 配布資料
学習者の英語ライティング方略使用傾向の操作化―ポーズの位置に着目した予備的検討―
外国語教育研究における尺度の構成と妥当性検証
エッセイライティング中のライティング方略とポーズ 配布資料
エッセイライティング中のライティング方略とポーズ
Nagoya.R #16 いろいろできるぞinstallrパッケージ
Nagoya.R #15 順位相関係数の信頼区間の算出
Nagoya.R #14 入門者講習
学習者のライティング方略は現実のライティングプロセスに反映されるか
Validation of the computer assisted language learning attitude scale: Focusin...
外国語における文法的慎重性と性格特性
Nagoya.R #12 Rprofile作成のススメ
Nagoya.R #12 入門者講習
校種間におけるコンピュータ支援語学学習態度の変容:中学生・高校生・大学生を対象とした多母集団の同時分析を用いて
エッセイライティングにおける増加語数の時系列推移傾向はエッセイ評価を予測するか―線形回帰モデルおよびポアソン分布へのフィッティングを用いて―
新しいコンピュータ支援語学学習態度尺度作成の試み:英語を学習する大学生を対象として
WritingMaetriXと表計算ソフトを用いたライティングプロセスの分析方法
Nagoya.R #11 入門者講習

Nagoya.R #12 非線形の相関関係を検出する指標の算出