SlideShare a Scribd company logo
Rtoaster × Myndエンジンによる
興味キーワード分析機能開発事例
Mynd株式会社
取締役 / エンジニア
森口 正之
株式会社ブレインパッド
DPG グループマネージャー
田崎 雄一郎
# brainpadtech
自己紹介
2012年 4月 SNS系企業 新卒入社
ぴちぴちの社会人6年目です
2014年11月 ブレインパッド入社
データ マネジメント プラットフォーム グループ グループ マネージャー
Rtoasterのユーザー分析機能や
外部パートナー連携など頑張ってます的な人です
来週からドイツ/フランス/スイス旅行なのでそわそわしてます
興味キーワード分析機能について
Rtoaster 分析機能について
DMPに蓄積された行動情報をもとに、
様々な角度からどんなユーザーがいるかの分析を支援
● 期間
● URL
● キーワード
● 属性
● 自動分析
などなど
キーワード分析機能
Rtoaster契約サイト
10,000人
寿司
カレー豆腐
ユーザーが何に興味を持っているか
直感的にわかりやすく、
次のアクションに繋げやすい
10人
2,000人
600人
うどん
米
ピザ
クーポン発行
カレーに興味あるなら
インド行くでしょ
🍣
📛
🍛
キーワード分析機能の構成
キーワード抽出部分について
● 自社製品のロジック部分考案にデータサイエンティストなどに
協力を依頼することはままある
○ 今回はキーワード機能ということで、自然言語処理の得意なMynd社と協力
● 協業の中でうまくいったこと
○ 物理的に距離が近く、スムーズにコミュニケーションできた
○ キーワードデータをサマリ過ぎずに出力してもらうことで、
今回の機能向けに限定し過ぎたものとならず、
それを利用した新機能の検討などを我々だけで閉じることができた
Mynd株式会社
2015年4月にブレインパッドグループにJOIN
自然言語処理系に強み
あとで詳しく☆
ユーザー分析システム
分析画面
データ集約基盤
キーワード分析機能 構成図
Rtoaster内部は
マイクロサービス構成になってます
連携ハブシステム
自動レコメンドシステム
airflowクラスタ
Auto
Scaling
Group
コアエンジン
などなど
SparkクラスタPrestoクラスタ
処理部分のインスタンス構成
● master node
○ 1台
○ r4.xlarge
● core / task node
○ 計20台
○ r4.xlarge
夜間バッチ負荷のため多め
今後オートスケール予定
● job-manager
○ 1台
○ c4.xlarge
● job-worker
○ 2〜10台
○ c4.2xlarge
並列実行にコア数が欲しいだけで
こんな強い必要はない
リリースしたばかりで負荷検証途中のため、やや力技の構成(参考値程度に)
キーワード処理だけでなく全ての分析機能処理で共通利用
● Array型の処理時間が遅かったため
文字列型で持ち、クエリを早くしている
● 約3000万UUの中から抽出する処理で
○ 単一条件,AND条件で3秒程度
○ OR条件だと25秒程度
■ 400万UUくらいだと7秒程度
● キーワード分析機能においては、
あまり凝った使い方はしていない
○ 単純に数を力でこなす感じ
● 別の分析機能ではSparkMLを利用して
機械学習とかもしている
スケールさせやすい
なんやかんや高速
リリース間隔早い
最近も月2回くらいリリース
ただし追うのも大変
スケールさせやすい
SparkMLなどライブラリも充実
ドキュメントや事例がWeb上に多い
EMRでの構築事例も多い
事例ケースも多く最適解は難しいたまにバグもまじる
調整すべきパラメータが多い
ここまでの伝えたいこと
● キーワード分析機能をMynd社と協力して実現した
○ 社内に自然言語処理や機械学習などに強みを持つメンバーがおり、
一緒に考えられるのはブレインパッドならではの安心感かと!
● Spark, Presto, Airflowなどの大規模処理向けの
アプリケーションを採用して処理をしています
○ エンジニア主体で技術採用も積極的に行えている
○ スモールなサービスだと使わなくても処理として事足りるので、
しっかり業務で携われるのはNo.1 DMPならではのデータ量
● 分散処理からインフラから画面開発までまで
ひとりひとりがフルスタックに開発してます
Myndについて
● 2010年4月 組み込み系開発企業 新卒入社
● 2012年4月 Mynd社立ち上げ
● 2015年4月 BrainPadグループにJoin
● 2017年4月 現職
自己紹介
元々は組み込み系→ネイティブアプリも....→クラウドも....→なんか色々やってます
● エンジニアばかりの小さな会社
○ フルタイムメンバーは現在5人
○ 内4人がエンジニア
● 自然言語処理、機械学習に強みを持っています
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
キーワード抽出って何するの?
...日本企業が世界で勝てない理由のひとつに、
各国政府への「ロビイング」の不足があります。
日本企業が今後...
日本企業
世界
各国政府
ロビイング
不足
今後
日本企業
世界
各国政府
ロビイング
不足
今後
意外と簡単そう....?
● システム化って難しいですよね....
○ お客様に合わせた実装
○ 運用・保守
● 他のモジュールではもっと凝った事もしています!
○ クラスタリング・意味タグ付与・etc
とは言え....
簡単だと思っていただけた方!
是非声をかけてください!

More Related Content

PDF
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
BrainPad Inc.
 
PDF
エンジニア勉強会資料_②エンジニア・デザイナ・プロダクトオーナーが推薦するプロトタイプドリブン開発
BrainPad Inc.
 
PPTX
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
BrainPad Inc.
 
PDF
DMPの分析機能を実現する技術
BrainPad Inc.
 
PDF
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
BrainPad Inc.
 
PDF
Business utilization of real estate image classification system using deep le...
BrainPad Inc.
 
PDF
れこめん道~とあるエンジニアの苦闘の日々
BrainPad Inc.
 
PDF
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
shakezo
 
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
BrainPad Inc.
 
エンジニア勉強会資料_②エンジニア・デザイナ・プロダクトオーナーが推薦するプロトタイプドリブン開発
BrainPad Inc.
 
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
BrainPad Inc.
 
DMPの分析機能を実現する技術
BrainPad Inc.
 
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
BrainPad Inc.
 
Business utilization of real estate image classification system using deep le...
BrainPad Inc.
 
れこめん道~とあるエンジニアの苦闘の日々
BrainPad Inc.
 
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
shakezo
 

What's hot (18)

PDF
今後10年の機械学習ビジネスの可能性
tomohiro furukawa
 
PDF
2018.08.21-機械学習工学研究会 現場を交えた勉強会発表資料
BrainPad Inc.
 
PDF
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
 
PDF
楽天技術研究所 Society 5.0 のクリエイティブ都市
Rakuten Group, Inc.
 
PDF
20171201 deep learning lab albert
Hirono Jumpei
 
PDF
カスタマーサクセスのためのデータ整備人の活動記録
syou6162
 
PDF
深層学習の導入で抱える課題とユースケース実例
Hirono Jumpei
 
PDF
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
Ozawa Kensuke
 
PDF
ユーザに価値を届けるためのデータプラットフォームの考え方
Rakuten Group, Inc.
 
PPTX
[自己PR]12/23 エンジニア"1on1"面談会
Toshi Matsumoto
 
PDF
データサイエンス業務と「ツール」
The Japan DataScientist Society
 
PDF
楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI
Rakuten Group, Inc.
 
PDF
機械学習システムを受託開発 する時に気をつけておきたい事
BrainPad Inc.
 
PDF
楽天における企業内スタートアップの取り組み
Rakuten Group, Inc.
 
PDF
データエンジニアとデータアナリストを兼任して良かったこと
Masatoshi Ida
 
PDF
分析手法のご紹介
Recruit Technologies
 
PDF
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
Rakuten Group, Inc.
 
PPTX
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
Ridge-i
 
今後10年の機械学習ビジネスの可能性
tomohiro furukawa
 
2018.08.21-機械学習工学研究会 現場を交えた勉強会発表資料
BrainPad Inc.
 
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
 
楽天技術研究所 Society 5.0 のクリエイティブ都市
Rakuten Group, Inc.
 
20171201 deep learning lab albert
Hirono Jumpei
 
カスタマーサクセスのためのデータ整備人の活動記録
syou6162
 
深層学習の導入で抱える課題とユースケース実例
Hirono Jumpei
 
ぼくのかんがえたさいきょうの機械学習プロダクトの作り方
Ozawa Kensuke
 
ユーザに価値を届けるためのデータプラットフォームの考え方
Rakuten Group, Inc.
 
[自己PR]12/23 エンジニア"1on1"面談会
Toshi Matsumoto
 
データサイエンス業務と「ツール」
The Japan DataScientist Society
 
楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI
Rakuten Group, Inc.
 
機械学習システムを受託開発 する時に気をつけておきたい事
BrainPad Inc.
 
楽天における企業内スタートアップの取り組み
Rakuten Group, Inc.
 
データエンジニアとデータアナリストを兼任して良かったこと
Masatoshi Ida
 
分析手法のご紹介
Recruit Technologies
 
グローバル企業の中で「変化」を仕掛ける楽天技術研究所 Rakuten Institute of Technology の挑戦
Rakuten Group, Inc.
 
[Ridge-i] Deep Learning Lab - ディープラーニング 導入の課題と実例
Ridge-i
 
Ad

Similar to エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例 (20)

PDF
DataOps in Moneyforward
tetsuro ito
 
PDF
Contextual package
Shota Yasui
 
PDF
失敗談から学ぶ!アクションにつながるデータ分析のコツ[2014.12.11 開催セミナー]
Dentsu Razorfish
 
PDF
DMPの仕組み
Kenta Suzuki
 
PDF
小規模チームで Type script と向き合う話
Tatsuya Yamamoto
 
PDF
オープンソースで開くビッグデータの扉
Open Source Software Association of Japan
 
PDF
dots.サービスのご説明@dots.2周年記念パーティ
dots.
 
PDF
自然言語処理紹介(就職編)
長岡技術科学大学 自然言語処理研究室
 
PDF
プロトタイピングツール投入のケーススタディ
力也 伊原
 
PDF
Visasq
創史 花村
 
PDF
【会社概要資料】STC.pdf
KosukeWada1
 
PDF
データサイエンティストのリアル-2015年~2019年 一般(個人)会員アンケートより
The Japan DataScientist Society
 
PDF
SIGSPATIAL2020 参加報告
Fumihiko Takahashi
 
PDF
プラットフォーム開発でプロダクトマネージャがチャレンジすべきこと #pm_roppongi
Daisuke Matsuda
 
PDF
デ部会 プロトタイプ
Nobuhiko Futagami
 
PPTX
マーケジンDMPセミナー final 0528
Intimate Merger Inc.
 
PDF
迅速な意思決定のために必要なこと
Masahiro Hayashi
 
PPTX
niconicoにおける継続的なデータ活用のためのHadoop運用事例
Makoto SHIMURA
 
PDF
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
株式会社Consumer first
 
PDF
The stumbling block of team development in the growth phase
ssuser1e9374
 
DataOps in Moneyforward
tetsuro ito
 
Contextual package
Shota Yasui
 
失敗談から学ぶ!アクションにつながるデータ分析のコツ[2014.12.11 開催セミナー]
Dentsu Razorfish
 
DMPの仕組み
Kenta Suzuki
 
小規模チームで Type script と向き合う話
Tatsuya Yamamoto
 
オープンソースで開くビッグデータの扉
Open Source Software Association of Japan
 
dots.サービスのご説明@dots.2周年記念パーティ
dots.
 
自然言語処理紹介(就職編)
長岡技術科学大学 自然言語処理研究室
 
プロトタイピングツール投入のケーススタディ
力也 伊原
 
【会社概要資料】STC.pdf
KosukeWada1
 
データサイエンティストのリアル-2015年~2019年 一般(個人)会員アンケートより
The Japan DataScientist Society
 
SIGSPATIAL2020 参加報告
Fumihiko Takahashi
 
プラットフォーム開発でプロダクトマネージャがチャレンジすべきこと #pm_roppongi
Daisuke Matsuda
 
デ部会 プロトタイプ
Nobuhiko Futagami
 
マーケジンDMPセミナー final 0528
Intimate Merger Inc.
 
迅速な意思決定のために必要なこと
Masahiro Hayashi
 
niconicoにおける継続的なデータ活用のためのHadoop運用事例
Makoto SHIMURA
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
株式会社Consumer first
 
The stumbling block of team development in the growth phase
ssuser1e9374
 
Ad

More from BrainPad Inc. (18)

PDF
Oss LT会_20210203
BrainPad Inc.
 
PDF
機械学習システムのアーキテクチャアラカルト
BrainPad Inc.
 
PDF
機械学習システム開発案件の事例紹介
BrainPad Inc.
 
PDF
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
BrainPad Inc.
 
PDF
Python研修の作り方 - teaching-is_learning-
BrainPad Inc.
 
PDF
2018 builderscon airflowを用いて、 複雑大規模なジョブフロー管理 に立ち向かう
BrainPad Inc.
 
PDF
GKEとgRPCで実装する多言語対応・スケーラブルな内部API
BrainPad Inc.
 
PDF
実証実験報告セミナー資料 20180328(抜粋版)
BrainPad Inc.
 
PDF
エンジニア勉強会資料_③Rtoasterの11年
BrainPad Inc.
 
PDF
Big Data Analytics Tokyo講演資料
BrainPad Inc.
 
PDF
DeltaCubeにおけるユニークユーザー集計高速化(実践編)
BrainPad Inc.
 
PDF
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
BrainPad Inc.
 
PDF
Developpers Summit2015 Autumn 講演資料
BrainPad Inc.
 
PDF
Python twitter data_150709
BrainPad Inc.
 
PDF
Sparkストリーミング検証
BrainPad Inc.
 
PDF
Sparkパフォーマンス検証
BrainPad Inc.
 
PDF
Apache Sparkについて
BrainPad Inc.
 
PDF
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
BrainPad Inc.
 
Oss LT会_20210203
BrainPad Inc.
 
機械学習システムのアーキテクチャアラカルト
BrainPad Inc.
 
機械学習システム開発案件の事例紹介
BrainPad Inc.
 
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
BrainPad Inc.
 
Python研修の作り方 - teaching-is_learning-
BrainPad Inc.
 
2018 builderscon airflowを用いて、 複雑大規模なジョブフロー管理 に立ち向かう
BrainPad Inc.
 
GKEとgRPCで実装する多言語対応・スケーラブルな内部API
BrainPad Inc.
 
実証実験報告セミナー資料 20180328(抜粋版)
BrainPad Inc.
 
エンジニア勉強会資料_③Rtoasterの11年
BrainPad Inc.
 
Big Data Analytics Tokyo講演資料
BrainPad Inc.
 
DeltaCubeにおけるユニークユーザー集計高速化(実践編)
BrainPad Inc.
 
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
BrainPad Inc.
 
Developpers Summit2015 Autumn 講演資料
BrainPad Inc.
 
Python twitter data_150709
BrainPad Inc.
 
Sparkストリーミング検証
BrainPad Inc.
 
Sparkパフォーマンス検証
BrainPad Inc.
 
Apache Sparkについて
BrainPad Inc.
 
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
BrainPad Inc.
 

エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例