Upload
Download free for 30 days
Login
Submit search
What's Amazon Athena? - re:Growth 2016 Osaka
2 likes
7,479 views
Ganota Ichida
AWS re:Invent 2016 Classmethod, Inc. re:Growth 2016
Internet
Related topics:
Amazon Web Services
Read more
1 of 38
Download now
Downloaded 13 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
More Related Content
PPTX
Aws athenaを使ってみた
Sunggyu Rhie
PDF
Amazon Elasticsearch Serviceを利用したAWSのログ活用
真司 藤本
PDF
Morning Session - AWS Serverless Ways
akitsukada
PPTX
re:Growth athena
淳 千葉
PDF
20161214 re growth-sapporo
Satoru Ishikawa
PDF
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
都元ダイスケ Miyamoto
PDF
Webサービス向け、クラウドデザインパターン:アンチパターン紹介
Yasuhiro Araki, Ph.D
PDF
AWS初心者向けWebinar AWSでBig Data活用
Amazon Web Services Japan
Aws athenaを使ってみた
Sunggyu Rhie
Amazon Elasticsearch Serviceを利用したAWSのログ活用
真司 藤本
Morning Session - AWS Serverless Ways
akitsukada
re:Growth athena
淳 千葉
20161214 re growth-sapporo
Satoru Ishikawa
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
都元ダイスケ Miyamoto
Webサービス向け、クラウドデザインパターン:アンチパターン紹介
Yasuhiro Araki, Ph.D
AWS初心者向けWebinar AWSでBig Data活用
Amazon Web Services Japan
What's hot
(20)
PDF
Serverless services on_aws_dmm_meetup_20170801
Amazon Web Services Japan
PDF
re:Growth 2016 in TOKYO発表「AWS Glueの紹介」
Yosuke Katsuki
PPTX
Aurora新時代の幕開けとDynamoDBの進化
Classmethod,Inc.
PDF
AWS Black Belt Techシリーズ AWS Data Pipeline
Amazon Web Services Japan
PDF
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2017 IoT向け最新アーキテクチャパターン
Amazon Web Services Japan
PDF
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
PDF
Amazonでのレコメンド生成における深層学習とAWS利用について
Amazon Web Services Japan
PDF
AWSでのビッグデータ分析
Amazon Web Services Japan
PDF
AWSサービスアップデートまとめ (re:Invent 2016とその前後)
Amazon Web Services Japan
PDF
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
Amazon Web Services Japan
PDF
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Amazon Web Services Japan
PDF
AWSデータベースアップデート2017
Amazon Web Services Japan
PDF
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
Amazon Web Services Japan
PDF
Aws auto scalingによるwebapサーバbatchサーバの構成例
Takeshi Mikami
PDF
AWS Black Belt Online Seminar 2017 AWS X-Ray
Amazon Web Services Japan
PDF
Search Solutions on AWS
Eiji Shinohara
PDF
20151016 soracom-araki-02
Yasuhiro Araki, Ph.D
PDF
20160526 AWSサービスアップデート
Genta Watanabe
PDF
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
Serverless services on_aws_dmm_meetup_20170801
Amazon Web Services Japan
re:Growth 2016 in TOKYO発表「AWS Glueの紹介」
Yosuke Katsuki
Aurora新時代の幕開けとDynamoDBの進化
Classmethod,Inc.
AWS Black Belt Techシリーズ AWS Data Pipeline
Amazon Web Services Japan
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 IoT向け最新アーキテクチャパターン
Amazon Web Services Japan
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
Amazonでのレコメンド生成における深層学習とAWS利用について
Amazon Web Services Japan
AWSでのビッグデータ分析
Amazon Web Services Japan
AWSサービスアップデートまとめ (re:Invent 2016とその前後)
Amazon Web Services Japan
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
Amazon Web Services Japan
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Amazon Web Services Japan
AWSデータベースアップデート2017
Amazon Web Services Japan
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
Amazon Web Services Japan
Aws auto scalingによるwebapサーバbatchサーバの構成例
Takeshi Mikami
AWS Black Belt Online Seminar 2017 AWS X-Ray
Amazon Web Services Japan
Search Solutions on AWS
Eiji Shinohara
20151016 soracom-araki-02
Yasuhiro Araki, Ph.D
20160526 AWSサービスアップデート
Genta Watanabe
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
Ad
Similar to What's Amazon Athena? - re:Growth 2016 Osaka
(20)
PPTX
AWS ML Update
Amazon Web Services Japan
PPTX
SIGMOD 2022Amazon Redshift Re-invented を読んで
Yohei Azekatsu
PPTX
研究用途でのAWSの利用事例と機械学習について
Yasuhiro Matsuo
PDF
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
PDF
【JAWS-UG AI/ML支部 第14回勉強会】Amazon EC2 Trn1 GA ! ~ AWSが提供するML向けインスタンスの豊富な品揃えと 専...
TakeshiFukae
PDF
20200617 AWS Black Belt Online Seminar Amazon Athena
Amazon Web Services Japan
PDF
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
Amazon Web Services Japan
PDF
Spark Analytics - スケーラブルな分散処理
Tusyoshi Matsuzaki
PDF
aws mackerel twilio_handson_public
Tomoaki Sakatoku
PDF
講演資料「Azure AI Update Ignite Fall 2021を振り返ろう!」
Kohei Ogawa
PPTX
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
Daiyu Hatakeyama
PDF
Moving from on prem to managed services with elastic on azure-final
Shotaro Suzuki
PDF
AWSによるグラフDB構築
Alexander Patrikalakis
PPTX
New Cloud Design Pattern using Amazon Aurora
宗 大栗
PDF
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
Amazon Web Services Japan
PDF
Serverless analytics on aws
Amazon Web Services Japan
PDF
Amazon Web Servicesで未来へススメ!
Genta Watanabe
PDF
Gpu accelerates aimodeldevelopmentandanalyticsutilizingelasticsearchandazure ai
Shotaro Suzuki
PDF
アマゾンにおけるAWSを用いた社内システム移行事例
SORACOM, INC
PPTX
Japan SQL Server Users Group - 第31回 SQL Server 2019勉強会 - Azure Synapse Analyt...
Daiyu Hatakeyama
AWS ML Update
Amazon Web Services Japan
SIGMOD 2022Amazon Redshift Re-invented を読んで
Yohei Azekatsu
研究用途でのAWSの利用事例と機械学習について
Yasuhiro Matsuo
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
【JAWS-UG AI/ML支部 第14回勉強会】Amazon EC2 Trn1 GA ! ~ AWSが提供するML向けインスタンスの豊富な品揃えと 専...
TakeshiFukae
20200617 AWS Black Belt Online Seminar Amazon Athena
Amazon Web Services Japan
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
Amazon Web Services Japan
Spark Analytics - スケーラブルな分散処理
Tusyoshi Matsuzaki
aws mackerel twilio_handson_public
Tomoaki Sakatoku
講演資料「Azure AI Update Ignite Fall 2021を振り返ろう!」
Kohei Ogawa
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
Daiyu Hatakeyama
Moving from on prem to managed services with elastic on azure-final
Shotaro Suzuki
AWSによるグラフDB構築
Alexander Patrikalakis
New Cloud Design Pattern using Amazon Aurora
宗 大栗
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
Amazon Web Services Japan
Serverless analytics on aws
Amazon Web Services Japan
Amazon Web Servicesで未来へススメ!
Genta Watanabe
Gpu accelerates aimodeldevelopmentandanalyticsutilizingelasticsearchandazure ai
Shotaro Suzuki
アマゾンにおけるAWSを用いた社内システム移行事例
SORACOM, INC
Japan SQL Server Users Group - 第31回 SQL Server 2019勉強会 - Azure Synapse Analyt...
Daiyu Hatakeyama
Ad
What's Amazon Athena? - re:Growth 2016 Osaka
1.
Amazon Athenaって何? re:Growth 2016
Osaka classmethod.jp 1 2016.12.12 クラスメソッド株式会社 市田善久
2.
Who are you? classmethod.jp
2 • 市田善久 • 大阪オフィス勤務 Solutions Architect • 前職:レンタルサーバ • Interest : Network / Security BigData / DevOps Athena,AI,X-Ray … classmethod.jp 2
3.
Amazon Athena classmethod.jp 3
4.
What‘s Amazon Athena? 標準SQLを用いてAmazon
S3上にあるデータ を簡単に分析できるインタラクティブなクエリ サービス ザックリ表現で、 「S3のデータに直接SQL投げられるサービス」 classmethod.jp 4
5.
どういうこと? • マネジメントコンソールで数アクション • 標準SQLでアドホッククエリ実行 •
結果は数秒 classmethod.jp 5
6.
特徴その1/4 • すぐ使える。直接クエリできる – ETLやデータのロードが不要 –
Athenaにデータを移す必要がない – S3上のファイルにテーブル定義を適用するだ けで、ファイルに変更を加える必要なく、高 速にクエリを実行可能 • サーバレス – セットアップや管理用インフラは不要 – 高可用性、運用性 classmethod.jp 6
7.
特徴その2/4 • 数秒で結果が得られる – クエリを自動で並列化し、何百、何千コアに 分散し、高速処理 –
パフォーマンス改善 • データの圧縮 • カラムナ形式のフォーマット • 詳細は後程 classmethod.jp 7
8.
特徴その3/4 • 分散SQLエンジンPrestoでクエリ実行 • 様々なデータフォーマットに対応 –
JSON、CSV、TSV、ログファイル、AWS サービスログ、カスタム区切りのテキスト、 Apache Parquet(パーケイ)、Apache ORC 等 classmethod.jp 8
9.
特徴その4/4 • S3へのストリームデータも対応 • Athena自体が未対応のリージョンのS3 に対しても実行可能 –
東京リージョンのバケットに対して利用可能 • 従量課金 – 実行したクエリのみ課金(詳細は後程) classmethod.jp 9
10.
圧縮データのサポート S3上のデータが圧縮されていても解析可能 • Snappy – Google製のオープンソースの圧縮ライブラリ •
Zlib • GZIP classmethod.jp 10
11.
組み合わせ • Amazon QuickSightとの連携(確認中) –
容易に可視化 • JDBC接続 – BIツールやSQLクライアントからクエリ実行 可能(Workbenchなど) • 様々なサードパーティ製ツールとの連携可能 – Amazon Athena用のJDBCドライバはS3で公 開済み classmethod.jp 11
12.
Workbench利用例 classmethod.jp 12
13.
クエリについて • マネジメントコンソールのAthena Query
Editor やSQLクライアントから照会 • DDL文やSQLクエリを実行可能 – 実行不可なものも(CREATE TABLE AS SELECT等) • 結果はコンソールへストリームされる • 結果はS3に保存される – アクセス可能 • 1アカウントあたり同時に5つのクエリを実行可 – デフォルト – 上限緩和申請で拡張可能 classmethod.jp 13
14.
簡単な使い方 1. マネジメントコンソールにログイン 2. CREATE
TABLE(2通り) – マネジメントコンソールでウィザード利用 – DDL文の利用 (Hive DDL) 3. クエリー開始 classmethod.jp 14
15.
サンプルデータ classmethod.jp 15
16.
1. Name &
Location classmethod.jp 16
17.
2. Data Format classmethod.jp
17
18.
3. Columns classmethod.jp 18
19.
4. Partitios classmethod.jp 19
20.
Create Table classmethod.jp 20
21.
Run Query classmethod.jp 21
22.
コスト • 実行したクエリのみに対する課金 – 各クエリでスキャンされたデータ量 •
S3上のデータ1TBスキャン毎に$5 • 失敗クエリは課金対象外 classmethod.jp 22
23.
コスト削減のポイント データスキャンを減らしコスト節約 • データ圧縮 • カラムナフォーマット –
Parquet等の利用でデータ転送量を縮小し、デー タスキャンを縮小 – (必ずしもParquetの方が速くなる訳では無い?) • パーティショニング – スキャン対象を指定 – 詳細は後程 classmethod.jp 23
24.
これまでの課題と解決 • シンプルなパイプライン – S3
> EMR > S3 > Redshift > QuickSight – S3 > Athena > QuickSight classmethod.jp 24 • データ分析の大量作業、大量な知識必要
25.
適切な選択 • Amazon Redshift –
データウェアハウス – 膨大な構造化データに対して複雑なクエリに対して高速に 結果を得られる • Amazon EMR – Hadoop, Spark, Prestoの利用 – これらの分散処理フレームワークを効率的に高いコスト効 率で利用できる • Amazon Athena – S3へのアドホッククエリを実行する最も簡単な方法 要件や環境に応じた最適な選択 classmethod.jp 25
26.
事例 • DataXu社180TB/日を可視化 classmethod.jp 26
27.
国内事例 - Gunosy •
株式会社Gunosy – 日本の大手ニュースキュレーションアプリ・ プロバイダ • Athenaの評価 – 使用してきたシステムよりも高速にクエリ結 果を得られた – 今後、Amazon Athena を分析プラット フォームの中核に据えるつもり classmethod.jp 27
28.
国内事例 - JapanTaxi •
JapanTaxi株式会社 – タクシー配車アプリ等の交通関連アプリ提供 – 毎月200万人アクティブユーザ • Athenaの評価 – 既に保存されているデータを移動させることなく、 クエリの実行が可能 – 費用を抑えながら最も細かいレベルでデータをクエ リ処理できる – Amazon EMR のような、その他のソリューションで 同じデータを活用し、相互運用することも可能 – 特別な管理者を必要としない classmethod.jp 28
29.
パーティショニング • データ分割手法の1つ • 検索効率の向上 •
アプリケーションの修正が不要 • など classmethod.jp 29
30.
Athenaでパーティショニング • Athenaで利用可能 • スキャン対象を指定できる •
パフォーマンスの向上 • スキャン対象の削減によるコスト節約! パーティショニング活用しましょう! classmethod.jp 30
31.
パーティション設定 設定方法は2通りに別れる • S3上のデータが、Hive形式でパーティ ション化されている場合 • S3上のデータが、Hive形式を考慮されて いない場合 classmethod.jp
31
32.
パーティション化されている場合 • テーブル作成時に「PARTITIONED BY」 を指定 –
PARTITIONED BY(dt STRING) • パーティション用のkeyを指定 classmethod.jp 32
33.
パーティションの考慮がない場合 classmethod.jp 33
34.
パーティションの考慮がない場合 • ALTER TABLE
ADD PARTITIONを実行し て、パーティションを追加 • 日付フォルダ毎に実行する必要がある • 手動でやるには限界 – JDBCで自動処理 • 上限20,000/テーブル classmethod.jp 34
35.
パーティショニング要不要 • Athenaは気軽に使えてとても便利 • 事前にパーティショニングは検討した方が いい テーブル定義やデータフォーマットが変更で きるなら、パーティショニングは要検討! classmethod.jp
35
36.
Athenaの利用用途 • データ分析向け – CREATE
TABLE AS SELECTといった構文に 対応していない – 参照用途での利用が想定されている • JDBCやBIツールからの参照 • QuickSightとの連携(確認中です) – 簡単にデータ分析 classmethod.jp 36
37.
やってみたブログ Athena 特集カテゴリー |
Developers.IO • Amazon AthenaでCloudFrontログをSQLで解析する • Amazon Athena に JDBC 接続する • AthenaのJDBCドライバを使ってS3のデータにSQL Workbench経 由でアクセスする • Amazon Athena: カラムナフォーマット『Parquet』でクエリを試 してみた • Amazon AthenaでELBログをSQLで解析する • AWS AthenaでCloudTrailのS3オブジェクトログを解析をしてみま した! • 他多数!! classmethod.jp 37
38.
classmethod.jp 38 ご清聴ありがとう ございました
Download