Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Sho Shimauchi
5,245 views
20分でわかるHBase
PyFes 2012.07 で発表したときのスライドです。 HBaseのアーキテクチャ周りを中心に話しました
Technology
◦
Read more
40
Save
Share
Embed
Embed presentation
Download
Downloaded 107 times
1
/ 48
2
/ 48
3
/ 48
4
/ 48
5
/ 48
6
/ 48
7
/ 48
8
/ 48
9
/ 48
10
/ 48
11
/ 48
12
/ 48
13
/ 48
14
/ 48
15
/ 48
16
/ 48
17
/ 48
18
/ 48
19
/ 48
20
/ 48
21
/ 48
22
/ 48
23
/ 48
24
/ 48
25
/ 48
26
/ 48
27
/ 48
28
/ 48
29
/ 48
30
/ 48
31
/ 48
32
/ 48
33
/ 48
34
/ 48
35
/ 48
36
/ 48
37
/ 48
38
/ 48
39
/ 48
40
/ 48
41
/ 48
42
/ 48
43
/ 48
44
/ 48
45
/ 48
46
/ 48
47
/ 48
48
/ 48
More Related Content
PDF
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
by
Cloudera Japan
PDF
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
PDF
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
PDF
刊行記念セミナー「HBase徹底入門」
by
cyberagent
PPTX
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
PDF
5分でわかる Apache HBase 最新版 #hcj2014
by
Cloudera Japan
PPTX
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
PDF
Osc2012 spring HBase Report
by
Seiichiro Ishida
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
by
Cloudera Japan
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
刊行記念セミナー「HBase徹底入門」
by
cyberagent
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
5分でわかる Apache HBase 最新版 #hcj2014
by
Cloudera Japan
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
Osc2012 spring HBase Report
by
Seiichiro Ishida
What's hot
PDF
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
by
Toshihiro Suzuki
PPTX
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
PPTX
HDFS Supportaiblity Improvements
by
Cloudera Japan
PPTX
Cloudera大阪セミナー 20130219
by
Cloudera Japan
PDF
HDFS HA セミナー #hadoop
by
Cloudera Japan
PDF
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
by
Hadoop / Spark Conference Japan
PDF
HBase at LINE
by
Shun Nakamura
PDF
Hadoopのシステム設計・運用のポイント
by
Cloudera Japan
PDF
HBase at Ameba
by
Toshihiro Suzuki
PDF
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
PDF
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
by
Sho Shimauchi
PDF
Evolution of Impala #hcj2014
by
Cloudera Japan
PPTX
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
PDF
MapR M7 技術概要
by
MapR Technologies Japan
PDF
CDH4.1オーバービュー
by
Cloudera Japan
PDF
Guide to Cassandra for Production Deployments
by
smdkk
PDF
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
by
Insight Technology, Inc.
PDF
CDH5最新情報 #cwt2013
by
Cloudera Japan
PDF
Cloudera Manager 5 (hadoop運用) #cwt2013
by
Cloudera Japan
PDF
Cloudera impalaの性能評価(Hiveとの比較)
by
Yukinori Suda
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
by
Toshihiro Suzuki
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
HDFS Supportaiblity Improvements
by
Cloudera Japan
Cloudera大阪セミナー 20130219
by
Cloudera Japan
HDFS HA セミナー #hadoop
by
Cloudera Japan
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
by
Hadoop / Spark Conference Japan
HBase at LINE
by
Shun Nakamura
Hadoopのシステム設計・運用のポイント
by
Cloudera Japan
HBase at Ameba
by
Toshihiro Suzuki
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
by
Sho Shimauchi
Evolution of Impala #hcj2014
by
Cloudera Japan
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
MapR M7 技術概要
by
MapR Technologies Japan
CDH4.1オーバービュー
by
Cloudera Japan
Guide to Cassandra for Production Deployments
by
smdkk
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
by
Insight Technology, Inc.
CDH5最新情報 #cwt2013
by
Cloudera Japan
Cloudera Manager 5 (hadoop運用) #cwt2013
by
Cloudera Japan
Cloudera impalaの性能評価(Hiveとの比較)
by
Yukinori Suda
Viewers also liked
PDF
Cassandraとh baseの比較して入門するno sql
by
Yutuki r
PDF
Facebook Messages & HBase
by
强 王
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
by
NTT DATA OSS Professional Services
PPTX
HBase スキーマ設計のポイント
by
daisuke-a-matsui
PDF
リクルート式ビッグデータ活用術
by
Recruit Technologies
PDF
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
by
Recruit Technologies
PPT
Hbase勉強会(第一回)メモ
by
Takashi Kambayashi
PPT
Cassandra v0.6-siryou
by
あしたのオープンソース研究所
PDF
Hadoop概要説明
by
Satoshi Noto
PPTX
Mongo sharding
by
Takahiro Inoue
PDF
20090713 Hbase Schema Design Case Studies
by
Evan Liu
PDF
MongoDBで作るソーシャルデータ新解析基盤
by
Takahiro Inoue
Cassandraとh baseの比較して入門するno sql
by
Yutuki r
Facebook Messages & HBase
by
强 王
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
by
NTT DATA OSS Professional Services
HBase スキーマ設計のポイント
by
daisuke-a-matsui
リクルート式ビッグデータ活用術
by
Recruit Technologies
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
by
Recruit Technologies
Hbase勉強会(第一回)メモ
by
Takashi Kambayashi
Cassandra v0.6-siryou
by
あしたのオープンソース研究所
Hadoop概要説明
by
Satoshi Noto
Mongo sharding
by
Takahiro Inoue
20090713 Hbase Schema Design Case Studies
by
Evan Liu
MongoDBで作るソーシャルデータ新解析基盤
by
Takahiro Inoue
Similar to 20分でわかるHBase
PDF
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
by
Cloudera Japan
PDF
Cloudian nosql casestudy_20120318
by
CLOUDIAN KK
PPT
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PPT
Googleの基盤クローン Hadoopについて
by
Kazuki Ohta
PPT
Inside mobage platform
by
Toru Yamaguchi
PDF
HBase Across the World #LINE_DM
by
Cloudera Japan
PDF
Lars George HBase Seminar with O'REILLY Oct.12 2012
by
Cloudera Japan
PPTX
Hadoop summit 2012 report
by
Sho Shimauchi
KEY
NHN techcon-20120519-fujimoto
by
Masaki Fujimoto
PDF
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
PDF
Hadoop, NoSQL, GlusterFSの概要
by
日本ヒューレット・パッカード株式会社
PDF
20120423 hbase勉強会
by
Toshiaki Toyama
PDF
20120405 setsunaセミナー
by
Takahiro Iwase
PDF
Hadoopエコシステムのデータストア振り返り
by
NTT DATA OSS Professional Services
PDF
OSC2012 OSC.DB Hadoop
by
Shinichi YAMASHITA
PDF
Facebookのリアルタイム Big Data 処理
by
maruyama097
PDF
WDD2012_SC-004
by
Kuninobu SaSaki
PDF
20120317 IT系勉強会 in 神戸
by
Takahiro Iwase
DOC
cassandra調査レポート
by
Akihiro Kuwano
PDF
HBase活用事例 #hbase_ca
by
Cloudera Japan
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
by
Cloudera Japan
Cloudian nosql casestudy_20120318
by
CLOUDIAN KK
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
Googleの基盤クローン Hadoopについて
by
Kazuki Ohta
Inside mobage platform
by
Toru Yamaguchi
HBase Across the World #LINE_DM
by
Cloudera Japan
Lars George HBase Seminar with O'REILLY Oct.12 2012
by
Cloudera Japan
Hadoop summit 2012 report
by
Sho Shimauchi
NHN techcon-20120519-fujimoto
by
Masaki Fujimoto
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
Hadoop, NoSQL, GlusterFSの概要
by
日本ヒューレット・パッカード株式会社
20120423 hbase勉強会
by
Toshiaki Toyama
20120405 setsunaセミナー
by
Takahiro Iwase
Hadoopエコシステムのデータストア振り返り
by
NTT DATA OSS Professional Services
OSC2012 OSC.DB Hadoop
by
Shinichi YAMASHITA
Facebookのリアルタイム Big Data 処理
by
maruyama097
WDD2012_SC-004
by
Kuninobu SaSaki
20120317 IT系勉強会 in 神戸
by
Takahiro Iwase
cassandra調査レポート
by
Akihiro Kuwano
HBase活用事例 #hbase_ca
by
Cloudera Japan
Recently uploaded
PDF
[2025 Rakuten Technology Conference] Daybreak for AI Agents
by
Woohyeok Kim
PDF
論文紹介:InternVideo2: Scaling Foundation Models for Multimodal Video Understanding
by
Toru Tamaki
PDF
Mixture-of-Personas Language Models for Population Simulation
by
harmonylab
PDF
論文紹介: "Locality-Aware Zero-Shot Human-Object Interaction Detection" "Disentan...
by
Toru Tamaki
PDF
【ツールテクノ】会社説明会資料2026年度版.pdf/月10時間までの学習を勤務時間として計上可能!
by
tooltechno1998
PDF
Multiple Object Tracking as ID Prediction
by
harmonylab
PDF
TransitReID: Transit OD Data Collection with Occlusion-Resistant Dynamic Pass...
by
harmonylab
PDF
Data Scaling Laws for End-to-End Autonomous Driving
by
harmonylab
PDF
SIG-AUDIO 2025 Vol.04 インタラクティブミュージック勉強会 インタラクティブミュージックの書き方
by
IGDA Japan SIG-Audio
PDF
SIG-AUDIO 2025 Vol.04 インタラクティブミュージック勉強会 ダレカレの音ができるまで
by
IGDA Japan SIG-Audio
[2025 Rakuten Technology Conference] Daybreak for AI Agents
by
Woohyeok Kim
論文紹介:InternVideo2: Scaling Foundation Models for Multimodal Video Understanding
by
Toru Tamaki
Mixture-of-Personas Language Models for Population Simulation
by
harmonylab
論文紹介: "Locality-Aware Zero-Shot Human-Object Interaction Detection" "Disentan...
by
Toru Tamaki
【ツールテクノ】会社説明会資料2026年度版.pdf/月10時間までの学習を勤務時間として計上可能!
by
tooltechno1998
Multiple Object Tracking as ID Prediction
by
harmonylab
TransitReID: Transit OD Data Collection with Occlusion-Resistant Dynamic Pass...
by
harmonylab
Data Scaling Laws for End-to-End Autonomous Driving
by
harmonylab
SIG-AUDIO 2025 Vol.04 インタラクティブミュージック勉強会 インタラクティブミュージックの書き方
by
IGDA Japan SIG-Audio
SIG-AUDIO 2025 Vol.04 インタラクティブミュージック勉強会 ダレカレの音ができるまで
by
IGDA Japan SIG-Audio
20分でわかるHBase
1.
20分でわかるHBase Python Developers Festa
2012.07 #pyfes 2012/07/28 @shiumachi
2.
アジェンダ • HBaseとは
• HBaseのデータ構造 • HBaseのテーブル構造とアーキテクチャ • リージョン分割〜HBaseにおけるシャーディン グ〜 • アーキテクチャから見るHBaseの使い方 • ???
3.
お前誰よ? • Sho
Shimauchi ( @shiumachi ) • Cloudera の問い合わせ担当 • ここ最近で一番衝撃的だった問い合わせは、 私の個人ブログの内容について説明してほし いというもの(しかも4年前の記事)
4.
HBase 本日本語訳出ました
• Cloudera の Lars George が書いた HBase のバイ ブル • 訳は安心の玉川さん • レビュー手伝ってました • 今日話すことは全部こ の「馬本」に書いてます
5.
HBaseとは
6.
HBase とは •
分散DB • 列ファミリ指向DB • ソートマップDB • キーバリューストア
7.
なぜHBaseを使うのか RDBMSにデータが入りきらない シャーディングしなきゃいけない
だるい
8.
なぜHBaseを使うのか 頑張ってシャーディングした 書き込みがスケールしない
\(^o^)/オワタ
9.
なぜHBaseを使うのか • シャーディングをサポートしてる
– 自動シャーディング – コマンド一発で手動シャーディング • 書き込みがスケールする • データの耐障害性も確保されてる – これはHadoopのファイルシステムHDFSの機能
10.
HBaseのデータ構造
11.
HBaseのデータ構造 シンプルなキーバリュー型
キー 値
12.
HBaseのデータ構造 キーが「行」「列ファミリ」「列」「タイムスタンプ」 に分かれている
タイム 行キー 列ファミリ 列 値 スタンプ
13.
HBaseのデータ構造 キーバリューがソートされてならんでいる
タイム 行キー 列ファミリ 列 値 スタンプ r1 cf1 c1 1000 ‘python’ r1 cf1 c2 1000 ‘php’ r1 cf2 c1 1000 ‘ruby’ r2 cf1 c2 1000 ‘java’
14.
CM データ構造の話は馬本の 9章冒頭に詳しく書かれて います
是非買って読んでください
15.
HBaseのテーブル構造と アーキテクチャ
16.
HBaseのテーブル構造 • テーブルはリージョン/列ファミリごとに別ファ
イルに保存される • リージョンは、指定された行キーの範囲で分 割される
17.
HBaseのテーブル構造 • 1リージョンには列ファミリの数だけストアファイルが存在
• 実際はもう少し複雑だがここでは簡略化して説明 列ファミリ1 列ファミリ1 リージョン ストアファイル a -‐ c リージョン d -‐ f リージョン d -‐ f
18.
HBaseのアーキテクチャ • RegionServer
– リージョンを管理する • Zookeeper – リージョンサーバの配置や管理テーブルの配置 など、HBaseの中核情報を管理する • HMaster – データそのものは扱わず、管理情報を収集し管 理インタフェースを提供する
19.
リージョンサーバ クライアントはリージョン
クライアント サーバのリージョンに 直接アクセスする リージョンサーバ リージョンサーバ リージョン リージョン
20.
リージョンの位置を知るには? • .META.
テーブル – リージョンサーバとリージョンのマップ情報 – クライアントは .META. テーブルに問い合せて場所を 確認 • ROOT テーブル – .META. の場所をポイントするだけのテーブル – クライアントはROOTテーブルを見て.META.テーブル を探す – ROOTテーブルの場所はZooKeeperに保存されている
21.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
22.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンAに書き込みたい リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
23.
リージョンAにアクセスする場合 クライアント
ZooKeeper ROOTテーブルどこよ? リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
24.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ1にあるよ リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
25.
リージョンAにアクセスする場合 クライアント
ZooKeeper .META.テーブルどこよ? リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
26.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ2にあるよ リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
27.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンAはどこよ? リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
28.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ2にあるよ リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
29.
リージョンAにアクセスする場合 クライアント
ZooKeeper ようやくアクセスできた! 場所はキャッシュしたので、 もうZooKeeperや管理テー ブルを見る必要はない! リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
30.
CM データの流れの話は馬本 の8章に詳しく書かれてい ます
是非買って読んでください
31.
リージョン分割〜HBaseにおける シャーディング〜
32.
リージョン分割 • リージョンが大きくなりすぎるとHBaseはリー
ジョンを自動で分割する • 分割はコストがかかる上管理が大変になるの で、手動による分割を推奨 • 特にデータ投入前の事前分割は強く推奨
33.
リージョン分割
このリージョンは大きくなり すぎたので分割しよう リージョンサーバ リージョンサーバ リージョン
34.
リージョン分割 リージョンサーバ
リージョンサーバ リージョン リージョン
35.
リージョン分割
分割したうちの片方は他の リージョンサーバに渡そう リージョンサーバ リージョンサーバ リージョン リージョン
36.
リージョン分割 ZooKeeperは分割を常に監
ZooKeeper 視している 分割完了後、.META.も更新 される リージョンサーバ リージョンサーバ ROOT .META. リージョン リージョン
37.
アーキテクチャから見るHBaseの 使い方
38.
スキーマ設計 • 列ファミリだけはテーブル作成時に定義しな
ければいけない – 列は任意の数だけ追加可能(所詮はただのキー) • 列ファミリの数だけファイル数が増える – 通常1つ、多くとも3つにとどめる
39.
行キー設計 • ランダムかシーケンシャルか
• ランダムアクセス重視 – 書き込みをリージョンで散らす – 行キーをハッシュにしてしまうなど • シーケンシャル重視 – スキャン(一括取得)したい場合など – 行キーを並べておく
40.
CM データの流れの話は馬本 の8章に詳しく書かれてい ます スキーマ設計の話は9章 に書いてます
是非買って読んでください
41.
まとめ
42.
今日話したこと •
HBaseのデータ構造(キーバリュー) • HBaseのアーキテクチャ • リージョンの考え方 • スキーマ・行キー設計
43.
今日話していないこと(一部) • 先行書き込みログ
– HBaseが壊れてもデータが残っていることを保証 • メムストア – メモリキャッシュのようなもの • フラッシュとコンパクション • HBase API – Java – Thri (python もあるよ) – REST – hbase shell (jruby ベースのインタラクティブシェル) • フィルタ • コプロセッサ • HBCK • MapReduce • データのインポート・エクスポートツール
44.
CM もちろん馬本には全部書 いてあります
是非買って読んでください
45.
まとめ • HBase
を使うことはそんなに難しくありません – 少なくとも自力でシャーディングするよりマシ • 性能を引き出そうとすればそれなりの知識が 必要です – 他の技術も同じ • 正しく活用して、高速かつスケーラブルな HBaseをエンジョイしましょう!
46.
CM HBaseを使いこなすにはド キュメントは必須です 現在手に入る唯一にして 最高のHBase本、それが 馬本です
是非買って読んでください
47.
HBase トレーニング始めました 7月30日(来週の月曜)から、日本語でもHBase トレーニングを始めます
馬本だけじゃ無理という人は是非参加してくだ さい h]p://www.cloudera.co.jp/university/ hbase.html
48.
おしまい
Download