SlideShare a Scribd company logo
Hadoop
 in
• id:sasata299 (            )

• Hadoop
•
•          http://blog.livedoor.jp/sasata299/
Hadoop導入事例 in クックパッド
Hadoop
Hadoop   MySQL
…
Hadoop



         MySQL
:-)
1. Hadoop

2.

3.

4.

5.
Hadoop
915
30         3   1
(   )
(   )
‣
‣ GROUP BY        (
        (   Д`)

‣                     7000   (
    )
!!
Hadoop
‣ Google   MapReduce

‣
‣
mapper   reducer


(   )    (    )
Hadoop導入事例 in クックパッド
‣ Hadoop Streaming
‣             Ruby

‣ Cloudera    CDH1          (0.18.3)

‣ EC2   Hadoop                  (
           10 50   )

‣ Hadoop               S3
S3 Native FileSystem (s3n://)
   ‣
   ‣                5GB


S3 Block FileSystem (s3://)
   ‣

   ‣                            HDFS


   ‣
Hadoop導入事例 in クックパッド
(            )




    mapper       (   )
mapper, reducer
master

‣ -file                         master     slave


         hadoop jar xxx.jar
          -mapper hoge.rb -reducer fuga.rb
          -file hoge.rb -file fuga.rb
          -file outdata
‣        mapper, reducer File.open
         File.open(‘outdata’) {|f| ...}
S3
‣ hadoop cat
               ※


‣ -cacheFile                            S3
                                slave        (
       File.open) ※
      hadoop jar xxx.jar
       -mapper hoge.rb -reducer fuga.rb
       -file hoge.rb -file fuga.rb
       -cacheFile s3n://path/to/outdata#othername
                    mapper reducer
Hadoop導入事例 in クックパッド
7000   (   )→
7000   (   )→

30
Hadoop++
Hadoop導入事例 in クックパッド
Hadoop       …
                      mapper, reducer   …




         Hadoop


                  …
1.

2.          Hadoop

3. Hadoop

4.             Hadoop

5. Hadoop                     (
                 )

6.                   (Excel       )

7. Hadoop
Hadoop
         !!
• MySQL
          Hadoop



• Hadoop EC2/S3
• Hadoop Streaming   Hadoop
Hadoop導入事例 in クックパッド

More Related Content

PDF
MapReduce入門
Satoshi Noto
 
PPTX
実行統計による実践的SQLチューニング
健一 三原
 
PDF
Kinesis→Redshift連携を、KCLからFirehoseに切り替えたお話
Hajime Sano
 
PPTX
elasticsearch_적용 및 활용_정리
Junyi Song
 
PDF
Introduction à ElasticSearch
Fadel Chafai
 
PDF
Fig 9-02
Hironobu Suzuki
 
PDF
Oracle Spatial 概要説明資料
オラクルエンジニア通信
 
PPTX
Redis勉強会資料(2015/06 update)
Yuji Otani
 
MapReduce入門
Satoshi Noto
 
実行統計による実践的SQLチューニング
健一 三原
 
Kinesis→Redshift連携を、KCLからFirehoseに切り替えたお話
Hajime Sano
 
elasticsearch_적용 및 활용_정리
Junyi Song
 
Introduction à ElasticSearch
Fadel Chafai
 
Fig 9-02
Hironobu Suzuki
 
Oracle Spatial 概要説明資料
オラクルエンジニア通信
 
Redis勉強会資料(2015/06 update)
Yuji Otani
 

What's hot (20)

PDF
Serf / Consul 入門 ~仕事を楽しくしよう~
Masahito Zembutsu
 
PPTX
Oracle Coherence勉強会
Toshiaki Maki
 
PDF
webエンジニアのためのはじめてのredis
nasa9084
 
PPTX
Mongo dbを知ろう
CROOZ, inc.
 
PDF
Node.js Express Tutorial | Node.js Tutorial For Beginners | Node.js + Expres...
Edureka!
 
PDF
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
 
PDF
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
Ryoma Nagata
 
PDF
並列対決 Elixir × Go × C# x Scala , Node.js
Yoshiiro Ueno
 
PDF
Replicate Elasticsearch Data with Cross-Cluster Replication (CCR)
Elasticsearch
 
PDF
A Tale of Three Apache Spark APIs: RDDs, DataFrames, and Datasets with Jules ...
Databricks
 
PDF
MySQL Tuning
Ford AntiTrust
 
PDF
空間データで遊ぶ
オラクルエンジニア通信
 
PDF
ナレッジグラフ/LOD利用技術の入門(後編)
KnowledgeGraph
 
PDF
[DMC F-1] 페이스북 가치 최적화: ROAS 극대화하기
F-1
 
PDF
コンテナイメージの脆弱性スキャンについて
YASUKAZU NAGATOMI
 
PDF
Rediscovering Spring with Spring Boot(1)
Gunith Devasurendra
 
PPTX
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
NTT DATA Technology & Innovation
 
PDF
Kubernetesを使う上で抑えておくべきAWSの基礎概念
Shinya Mori (@mosuke5)
 
PDF
性能測定道 実践編
Yuto Hayamizu
 
PDF
Yahoo! JAPANにおけるApache Cassandraへの取り組み
Yahoo!デベロッパーネットワーク
 
Serf / Consul 入門 ~仕事を楽しくしよう~
Masahito Zembutsu
 
Oracle Coherence勉強会
Toshiaki Maki
 
webエンジニアのためのはじめてのredis
nasa9084
 
Mongo dbを知ろう
CROOZ, inc.
 
Node.js Express Tutorial | Node.js Tutorial For Beginners | Node.js + Expres...
Edureka!
 
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
 
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
Ryoma Nagata
 
並列対決 Elixir × Go × C# x Scala , Node.js
Yoshiiro Ueno
 
Replicate Elasticsearch Data with Cross-Cluster Replication (CCR)
Elasticsearch
 
A Tale of Three Apache Spark APIs: RDDs, DataFrames, and Datasets with Jules ...
Databricks
 
MySQL Tuning
Ford AntiTrust
 
空間データで遊ぶ
オラクルエンジニア通信
 
ナレッジグラフ/LOD利用技術の入門(後編)
KnowledgeGraph
 
[DMC F-1] 페이스북 가치 최적화: ROAS 극대화하기
F-1
 
コンテナイメージの脆弱性スキャンについて
YASUKAZU NAGATOMI
 
Rediscovering Spring with Spring Boot(1)
Gunith Devasurendra
 
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
NTT DATA Technology & Innovation
 
Kubernetesを使う上で抑えておくべきAWSの基礎概念
Shinya Mori (@mosuke5)
 
性能測定道 実践編
Yuto Hayamizu
 
Yahoo! JAPANにおけるApache Cassandraへの取り組み
Yahoo!デベロッパーネットワーク
 
Ad

Viewers also liked (20)

PDF
楽天がHadoopを使う理由
Rakuten Group, Inc.
 
PDF
リクルート式Hadoopの使い方
Recruit Technologies
 
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
 
PPT
クラウド時代の並列分散処理技術
Koichi Fujikawa
 
PDF
Hadoop / MapReduce とは
Takeshi Matsuoka
 
PDF
How to collect Big Data into Hadoop
Sadayuki Furuhashi
 
PDF
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
Cloudera Japan
 
KEY
ソーシャルゲームログ解析基盤のHadoop活用事例
知教 本間
 
PPTX
Apache Hive 2.0; SQL, Speed, Scale
Hortonworks
 
PDF
Apache Flume 1.5を活⽤したAmebaにおけるログのシステム連携
cyberagent
 
PDF
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
 
PDF
Fluentd loves MongoDB, at MongoDB SV User Group, July 17, 2012
Treasure Data, Inc.
 
PDF
Amebaにおけるログ解析基盤Patriotの活用事例
cyberagent
 
PDF
Hiveを高速化するLLAP
Yahoo!デベロッパーネットワーク
 
PDF
金融機関でのHive/Presto事例紹介
Amazon Web Services Japan
 
PDF
Presto As A Service - Treasure DataでのPresto運用事例
Taro L. Saito
 
PDF
Hadoopを用いた大規模ログ解析
shuichi iida
 
PDF
Top 10 BI Trends for 2013
Tableau Software
 
PDF
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
Yahoo!デベロッパーネットワーク
 
PPTX
Flumeを活用したAmebaにおける大規模ログ収集システム
Satoshi Iijima
 
楽天がHadoopを使う理由
Rakuten Group, Inc.
 
リクルート式Hadoopの使い方
Recruit Technologies
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
 
クラウド時代の並列分散処理技術
Koichi Fujikawa
 
Hadoop / MapReduce とは
Takeshi Matsuoka
 
How to collect Big Data into Hadoop
Sadayuki Furuhashi
 
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
Cloudera Japan
 
ソーシャルゲームログ解析基盤のHadoop活用事例
知教 本間
 
Apache Hive 2.0; SQL, Speed, Scale
Hortonworks
 
Apache Flume 1.5を活⽤したAmebaにおけるログのシステム連携
cyberagent
 
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
 
Fluentd loves MongoDB, at MongoDB SV User Group, July 17, 2012
Treasure Data, Inc.
 
Amebaにおけるログ解析基盤Patriotの活用事例
cyberagent
 
Hiveを高速化するLLAP
Yahoo!デベロッパーネットワーク
 
金融機関でのHive/Presto事例紹介
Amazon Web Services Japan
 
Presto As A Service - Treasure DataでのPresto運用事例
Taro L. Saito
 
Hadoopを用いた大規模ログ解析
shuichi iida
 
Top 10 BI Trends for 2013
Tableau Software
 
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
Yahoo!デベロッパーネットワーク
 
Flumeを活用したAmebaにおける大規模ログ収集システム
Satoshi Iijima
 
Ad

Similar to Hadoop導入事例 in クックパッド (20)

KEY
COOKPADでのHadoop利用
Tatsuya Sasaki
 
KEY
マーケティングのためのHadoop利用
Tatsuya Sasaki
 
KEY
800万人の"食べたい"をHadoopで分散処理
Tatsuya Sasaki
 
KEY
Hadoopを業務で使ってみた
Tatsuya Sasaki
 
KEY
961万人の食卓を支えるデータ解析
Tatsuya Sasaki
 
PDF
Hadoop入門とクラウド利用
Naoki Yanai
 
PDF
Hadoop Conference Japan 2011 Fallに行ってきました
moai kids
 
PDF
データ解析技術入門(Hadoop編)
Takumi Asai
 
KEY
Hadoop本 輪読会 1章〜2章
moai kids
 
PDF
Hadoop - Lessons Learned
tcurdt
 
KEY
ちょっとHadoopについて語ってみるか(仮題)
moai kids
 
PDF
サンプルから見るMap reduceコード
Shinpei Ohtani
 
PDF
サンプルから見るMapReduceコード
Shinpei Ohtani
 
PDF
Hadoop I/O Analysis
Richard McDougall
 
PPTX
Hadoop
Po-Han Chen
 
PDF
Big Data - Lab A1 (SC 11 Tutorial)
Robert Grossman
 
PPTX
Hadoop & HDFS for Beginners
Rahul Jain
 
PDF
Hadoop, Taming Elephants
Ovidiu Dimulescu
 
PDF
Chemogenomics in the cloud: Is the sky the limit?
Rajarshi Guha
 
COOKPADでのHadoop利用
Tatsuya Sasaki
 
マーケティングのためのHadoop利用
Tatsuya Sasaki
 
800万人の"食べたい"をHadoopで分散処理
Tatsuya Sasaki
 
Hadoopを業務で使ってみた
Tatsuya Sasaki
 
961万人の食卓を支えるデータ解析
Tatsuya Sasaki
 
Hadoop入門とクラウド利用
Naoki Yanai
 
Hadoop Conference Japan 2011 Fallに行ってきました
moai kids
 
データ解析技術入門(Hadoop編)
Takumi Asai
 
Hadoop本 輪読会 1章〜2章
moai kids
 
Hadoop - Lessons Learned
tcurdt
 
ちょっとHadoopについて語ってみるか(仮題)
moai kids
 
サンプルから見るMap reduceコード
Shinpei Ohtani
 
サンプルから見るMapReduceコード
Shinpei Ohtani
 
Hadoop I/O Analysis
Richard McDougall
 
Hadoop
Po-Han Chen
 
Big Data - Lab A1 (SC 11 Tutorial)
Robert Grossman
 
Hadoop & HDFS for Beginners
Rahul Jain
 
Hadoop, Taming Elephants
Ovidiu Dimulescu
 
Chemogenomics in the cloud: Is the sky the limit?
Rajarshi Guha
 

More from Tatsuya Sasaki (8)

KEY
からあげエンジニアについて
Tatsuya Sasaki
 
KEY
クックパッドでのemr利用事例
Tatsuya Sasaki
 
KEY
からあげとビーチと私
Tatsuya Sasaki
 
KEY
メタプログラミングでDSLを書こう
Tatsuya Sasaki
 
PDF
NoSQLデータベースが登場した背景と特徴
Tatsuya Sasaki
 
KEY
Hadoopをemr経由で利用する方法
Tatsuya Sasaki
 
KEY
Hadoopを業務で使ってみました
Tatsuya Sasaki
 
からあげエンジニアについて
Tatsuya Sasaki
 
クックパッドでのemr利用事例
Tatsuya Sasaki
 
からあげとビーチと私
Tatsuya Sasaki
 
メタプログラミングでDSLを書こう
Tatsuya Sasaki
 
NoSQLデータベースが登場した背景と特徴
Tatsuya Sasaki
 
Hadoopをemr経由で利用する方法
Tatsuya Sasaki
 
Hadoopを業務で使ってみました
Tatsuya Sasaki
 

Recently uploaded (20)

PDF
BLW VOCATIONAL TRAINING SUMMER INTERNSHIP REPORT
codernjn73
 
PPTX
AI in Daily Life: How Artificial Intelligence Helps Us Every Day
vanshrpatil7
 
PDF
OFFOFFBOX™ – A New Era for African Film | Startup Presentation
ambaicciwalkerbrian
 
PDF
A Strategic Analysis of the MVNO Wave in Emerging Markets.pdf
IPLOOK Networks
 
PDF
AI-Cloud-Business-Management-Platforms-The-Key-to-Efficiency-Growth.pdf
Artjoker Software Development Company
 
PPTX
New ThousandEyes Product Innovations: Cisco Live June 2025
ThousandEyes
 
PDF
Make GenAI investments go further with the Dell AI Factory
Principled Technologies
 
PDF
The Evolution of KM Roles (Presented at Knowledge Summit Dublin 2025)
Enterprise Knowledge
 
PDF
Google I/O Extended 2025 Baku - all ppts
HusseinMalikMammadli
 
PDF
Using Anchore and DefectDojo to Stand Up Your DevSecOps Function
Anchore
 
PDF
REPORT: Heating appliances market in Poland 2024
SPIUG
 
PDF
Accelerating Oracle Database 23ai Troubleshooting with Oracle AHF Fleet Insig...
Sandesh Rao
 
PDF
Trying to figure out MCP by actually building an app from scratch with open s...
Julien SIMON
 
PDF
Advances in Ultra High Voltage (UHV) Transmission and Distribution Systems.pdf
Nabajyoti Banik
 
PDF
Security features in Dell, HP, and Lenovo PC systems: A research-based compar...
Principled Technologies
 
PPTX
Dev Dives: Automate, test, and deploy in one place—with Unified Developer Exp...
AndreeaTom
 
PDF
MASTERDECK GRAPHSUMMIT SYDNEY (Public).pdf
Neo4j
 
PPTX
cloud computing vai.pptx for the project
vaibhavdobariyal79
 
PDF
A Day in the Life of Location Data - Turning Where into How.pdf
Precisely
 
PPTX
What-is-the-World-Wide-Web -- Introduction
tonifi9488
 
BLW VOCATIONAL TRAINING SUMMER INTERNSHIP REPORT
codernjn73
 
AI in Daily Life: How Artificial Intelligence Helps Us Every Day
vanshrpatil7
 
OFFOFFBOX™ – A New Era for African Film | Startup Presentation
ambaicciwalkerbrian
 
A Strategic Analysis of the MVNO Wave in Emerging Markets.pdf
IPLOOK Networks
 
AI-Cloud-Business-Management-Platforms-The-Key-to-Efficiency-Growth.pdf
Artjoker Software Development Company
 
New ThousandEyes Product Innovations: Cisco Live June 2025
ThousandEyes
 
Make GenAI investments go further with the Dell AI Factory
Principled Technologies
 
The Evolution of KM Roles (Presented at Knowledge Summit Dublin 2025)
Enterprise Knowledge
 
Google I/O Extended 2025 Baku - all ppts
HusseinMalikMammadli
 
Using Anchore and DefectDojo to Stand Up Your DevSecOps Function
Anchore
 
REPORT: Heating appliances market in Poland 2024
SPIUG
 
Accelerating Oracle Database 23ai Troubleshooting with Oracle AHF Fleet Insig...
Sandesh Rao
 
Trying to figure out MCP by actually building an app from scratch with open s...
Julien SIMON
 
Advances in Ultra High Voltage (UHV) Transmission and Distribution Systems.pdf
Nabajyoti Banik
 
Security features in Dell, HP, and Lenovo PC systems: A research-based compar...
Principled Technologies
 
Dev Dives: Automate, test, and deploy in one place—with Unified Developer Exp...
AndreeaTom
 
MASTERDECK GRAPHSUMMIT SYDNEY (Public).pdf
Neo4j
 
cloud computing vai.pptx for the project
vaibhavdobariyal79
 
A Day in the Life of Location Data - Turning Where into How.pdf
Precisely
 
What-is-the-World-Wide-Web -- Introduction
tonifi9488
 

Hadoop導入事例 in クックパッド