物理学はWebデータ分析(広告)に使えるか?
     -素粒子物理学からの視点から-

           佐野正和
         Fringe81株式会社
             2012/8/21
Webデータ分析って難しい
• ECサイトやネット広告には大量のログ

• 大量すぎて分析大変!

• 平均や分散が意味をなさないほどに生データがカ
  オス!!

• クレンジングするとデータの母数が減りすぎて困
  る!!!

• でも結果を出さなければならない、さてどうす
  る。。。
ネット広告分析
• アトリビューション分析
 →個から広告配信結果の全体評価
• コスト配分
 →将来のコンバージョンをアトリビューション
  分析から予測


   ミクロ視点からグローバル分析
 ⇒量子論&統計物理に似ている。。。
アトリビューション分析の個人的イ
      メージ




        色々な相互作
  媒体A      用


                 媒体B
なぜ素粒子物理(直観的観
     点)?
• 個々人の相互作用から媒体メニューの性
  質を捉えたい(アトリビューション分
  析)。

• 媒体メニューがある種の容器だとしたら、
  人は分子や原子のように、相互作用する
  素子という描像が持てないだろうか。

• 素粒子物理(量子論)とのアナロジーが有効
  ではないか。。。
なぜ素粒子物理(技術的観
     点)?
• 自分がよく知っているから。扱いやすい
  分野に議論を持ち込みたい。

• 素粒子物理は歴史が長い→複雑な問題に対
  する計算手法がたくさんある。

• 量子論は統計物理と親和性が高い。
そもそも確率と物理の関係と
       は?
• 数学:確率微分方程式



      これらは関係している
          の?
• 量子力学:(ユークリッド化)シュレディンガー方
  程式
確率過程の例:金融工学
• ブラック-ショールズ方程式は経路積分の
  微分形→熱伝導方程式(ユークリッド化
  シュレディンガー方程式)を満たす
  (Feynman-Kacの公式)。
• 確率微分方程式や伊藤の公式などを使うと。。。
マルコフ過程と経路積分
• マルコフ性

• チャップマン-コルモゴロフの式(連続)



             確率の数珠つなぎ


• この式自体がすでに(抽象的な)経路積
  分
経路積分
• 途中経路が無数にある場合、ひとつひとつの経
  路の発生確率を評価するのは困難⇒出発点から
  終点までの確率的に起こりうる可能な全経路の
  足し合わせを評価。
座標




                   時間
経路積分とシュレディンガー方程
       式
• 確率過程と経路積分は等価

• 確率過程を扱う代わりに経路積分でも解
  析できる。物理の知見を活かせる。

• ラグランジアンに相互作用などを含める
  ことで、より広いクラスの分析に適用で
  きる可能性がある。
                 ラグランジア
                   ン
経路積分の応用で何ができそうか
              (アイデア)
                                            CV

                                  Media C



             様々な人がCVまでに複
              雑な経路をたどる
              …view…view…click…
Media A         search…view…




Media B                           Media D
何ができそうか(アイデア)
• 終状態をCVに固定し、CVに至る経路積分
  の値が最大化される初期条件を見つける
  (メディアの組み合わせ?)。

• 簡易バージョン:定常なマルコフ連鎖

• 既知のアトリビューションスコアの時間
  発展の予測


     Media A       Media B
参考文献
• An Introduction To Quantum Field Theory :
  Michael E. Peskin,Dan V. Schroeder, Westview
  Press

• ゲージ場の量子論Ⅰ九後 汰一郎 培風館

• 無裁定理論とマルチンゲール:浦谷規 朝倉
  書店

• http://arxiv.org/
(物理系(素粒子が強い)及びその他の科学論文
  サイト)
補足(Feynmanダイアグラム)
• 経路を限定して終状態に至る確率を求めることもできる。
• 相互作用部分(●)では起こりうる経路の足しあげが起こり、矢印部分(伝
  播関数)はある特定の経路(view⇒clickやview⇒search等)を示している

                                  CV2
              相互
              作用

       伝播関数
                        相互
                        作用

              相互                   CV1
              作用




• 例えば媒体Aでのview始状態が伝播関数でsearch→中間経路足しあげ→
  自社→CVと移り変わる確率などを求めることもできる。

More Related Content

ODP
Zansa7-信頼性工学と統計
PPTX
Sano web広告最適化20131018v3
PDF
20140213 web×マス広告の統合分析第3部_公開用
PDF
KDD2014_study
PPTX
機械学習を用いた異常検知入門
PDF
ソーシャルデザインパターン -評判と情報収集-
PDF
大規模ネットワークの性質と先端グラフアルゴリズム
PDF
ソーシャルウェブ と レコメンデーション -第4回データマイニング+WEB勉強会@東京
Zansa7-信頼性工学と統計
Sano web広告最適化20131018v3
20140213 web×マス広告の統合分析第3部_公開用
KDD2014_study
機械学習を用いた異常検知入門
ソーシャルデザインパターン -評判と情報収集-
大規模ネットワークの性質と先端グラフアルゴリズム
ソーシャルウェブ と レコメンデーション -第4回データマイニング+WEB勉強会@東京

Similar to 【Zansa】物理学はWebデータ分析に使えるか (20)

PDF
ネットワークマイニング(グラフ構造分析)
PDF
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
PDF
Mahout JP - #TokyoWebmining 11th #MahoutJP
PDF
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
PDF
tut_pfi_2012
PDF
WWW2012勉強会:Information Diffusion in Social Networks
PDF
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
PPTX
Sano tokyowebmining 36_20140526
PPTX
Masakazu Sano Tokyowebmining 37 20140621
PDF
Social network analysis for startups ch6
PDF
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
PDF
Wssit slide
PDF
IIR 21 Link Analysis
PDF
[R勉強会][データマイニング] R言語による時系列分析
PDF
第2回 NIPS+読み会・関西 発表資料 山本
PDF
第9章 ネットワーク上の他の確率過程
PDF
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
PDF
"Mahout Recommendation" - #TokyoWebmining 14th
PDF
2012-06-15-トピックを考慮したソーシャルネットワーク上の情報拡散モデル
PDF
Toward Research that Matters
ネットワークマイニング(グラフ構造分析)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
Mahout JP - #TokyoWebmining 11th #MahoutJP
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
tut_pfi_2012
WWW2012勉強会:Information Diffusion in Social Networks
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
Sano tokyowebmining 36_20140526
Masakazu Sano Tokyowebmining 37 20140621
Social network analysis for startups ch6
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
Wssit slide
IIR 21 Link Analysis
[R勉強会][データマイニング] R言語による時系列分析
第2回 NIPS+読み会・関西 発表資料 山本
第9章 ネットワーク上の他の確率過程
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
"Mahout Recommendation" - #TokyoWebmining 14th
2012-06-15-トピックを考慮したソーシャルネットワーク上の情報拡散モデル
Toward Research that Matters
Ad

More from Zansa (12)

PDF
【Zansa】第17回 ブートストラップ法入門
PPTX
121218 zansa13 for web
PDF
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
PPTX
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.html
PPTX
第8回Zansa 俺の人生ランダムウォーク
PDF
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-
PDF
ベイズ入門
PDF
第5回Zansa勉強会
PDF
Zansa第4回勉強会 重回帰分析
PPTX
Text classification zansa
PDF
Zansa第二回11 28 発表資料 植木
PDF
Zansa0130presentation
【Zansa】第17回 ブートストラップ法入門
121218 zansa13 for web
【Zansa】第12回勉強会 -PRMLからベイズの世界へ
Zansa アト テクノロシ-ー業界の分析という仕事について http://zansa.info/materials-11.html
第8回Zansa 俺の人生ランダムウォーク
【Zansa】 人工社会-複雑系とマルチエージェントシミュレーションの紹介-
ベイズ入門
第5回Zansa勉強会
Zansa第4回勉強会 重回帰分析
Text classification zansa
Zansa第二回11 28 発表資料 植木
Zansa0130presentation
Ad

【Zansa】物理学はWebデータ分析に使えるか