2
Most read
15
Most read
19
Most read
私ってデータエンジニアなんですか?
気づいたらデータエンジニアと呼ばれるようになった
私がこの職種について考えた
#TRACKTECHJP
1
2023.7.25
© 2020 MonotaRO Co., Ltd. All Rights Reserved.
● 名前
○ 斎藤貴文
● 略歴
○ 2013年 株式会社サイバーエージェント入社
■ OSSでデータ基盤の構築・運用
■ メディアサービスのデータモデリング
○ 2022年 株式会社MonotaRO入社
■ ざっくりデータマネジメント業
2
自己紹介
● 新卒で入社してからずっとデータ基盤の構築・運用や
データマネジメントの業務をしていました
● 気づいたらデータエンジニアという職種が登場
● データエンジニアができる前からデータエンジニアな
私が今の状況とキャリアについて考えてみます
3
今回の発表内容
● どうしてデータエンジニアができたのか
● データエンジニアの現状
● データエンジニアのこれから
○ モノタロウでの取り組み
4
アジェンダ
どうして
データエンジニアができたのか
5
● ビジネスはオフラインがメイン
○ オンラインはあくまでオフラインへの入口
● データとは業務システムのデータ
○ 業務の中で必要な情報を記録していた(SoR)
○ データを見るのは業務の状況把握が主目的
○ 業務レポートやシステムの監視など
● → 業務がデータを作り出す時代
6
ビッグデータ前夜(私が社会人になる前なので解像度は大分低いかもしれません)
業務 観測
● ビジネスはオフラインからオンラインへ
○ 今までの業務データだけではなく、
ユーザーの行動をトラッキングするデータ(SoE)が出現
● SoEとSoRのデータを組み合わせて
ビジネスのインサイトを見つける需要が増大
○ データサイエンスの発展
● → 分析がデータを使う時代
7
ビッグデータ初期の傾向(斎藤が社会人になった前後)
業務 利用
● ビジネスはますますオンラインへ
● データの利用用途とデータのバリュエーションが増加
● 推薦・検索・ABテストなど業務と分析との連携が重要になる
○ データの品質が分析の結果に影響が出る時代
● → あるデータを使うではなく、使えるデータを選ぶ時代へ
● 使えるデータを管理する必要がありデータエンジニアが誕生
8
ビッグデータの成熟から現代へ
業務 利用
管理
データエンジニアの現状
9
● データの利用状況が変わるにつれ、
データに関するプロダクトも多く出現した
○ NoSQL, NewSQL, SaaS, ETL tools, BI, etc.
○ データ基盤を用意するだけなら誰でも簡単にできる時代
● データマネジメントのノウハウも世間には溢れている
● ツールが整っているのであれば、
データエンジニアを雇わなくても大丈夫なのでは?
10
技術も発展している
● 楽になった部分は汎用性の高い三層スキーマでいう物理層の部分
● 概念層・論理層はむしろ複雑化の傾向
● ビジネスによって状況が異なるため一般化・汎化が難しい
● 容易になった部分と複雑化した部分の乖離が大きくなっている
11
......実は楽になっていない?
物理: 実データの保存や処理を管理
論理: ビジネスモデルをデータ表現として管理
概念: ビジネスに基づいたモデルを管理
容易化
複雑化
年々乖離
12
データマネジメントのマトリクス
(概念、物理) (外部、物理)
(内部、論理) (概念、論理) (外部、論理)
(内部、概念) (概念、概念) (外部、概念)
(内部、物理)
システム上の高低
データの流れ
(概念、物理) (外部、物理)
(内部、論理) (概念、論理) (外部、論理)
(内部、概念) (概念、概念) (外部、概念)
(内部、物理)
概念・論理・物理の三層で整理
システム上の高層・低層に対応
ANSI/SPARCの三層スキーマを参考に
内部・概念・外部の三層で整理
データの生成・管理・利用の流れに対応
13
データマネジメントのマトリクス
(外部、概念)
14
データマネジメントのマトリクス
システム上の高低
データの流れ
(概念、物理) (外部、物理)
(概念、論理)
(内部、論理) (外部、論理)
(内部、概念) (概念、概念)
(内部、物理)
データエンジニアは
この領域での課題を解決する
(概念、概念)
15
データマネジメントのマトリクス
システム上の高低
データの流れ
(概念、物理) (外部、物理)
(内部、論理) (概念、論理) (外部、論理)
(内部、概念) (外部、概念)
(内部、物理)
特に概念層と論理層が
これから重要になっていく
データエンジニアのこれから
16
● 前述の通り、容易化した部分と複雑化した部分の乖離が大きい
● 容易化した部分はツールを使えるようになることで解決可能
○ ただし、容易化しているため誰にでもできるとも言える
● 専門家として必要なのは
「複雑化する要求を解決できるようにする」能力
○ 現実の業務・ビジネス上の要求を理解する力
○ 要求を抽象化しモデル化する力
○ ツール・ノウハウを利用したり、人と協力して問題を解決する(させる)力
● → データエンジニアとして特別なスキルがあるというより
ソフトウェアエンジニア、ビジネスマンとしてのスキルが重要
17
データエンジニアとしてのスキル
18
モノタロウでの取り組み例
(概念、物理) (外部、物理)
(内部、論理) (外部、論理)
(内部、概念) (概念、概念) (外部、概念)
(内部、物理)
システム上の高低
データの流れ
①DWHテーブルの構築
データを利用する際に直接業務のデータを参照するのではなく
業務のドメインモデルと利用者の用途に基づいて
社内で共通利用可能なテーブルを構築する
業務データと利用用途のハブとして利用してもらう
(概念、論理)
19
モノタロウでの取り組み例
(概念、物理) (外部、物理)
(内部、論理) (概念、論理) (外部、論理)
(内部、概念) (概念、概念) (外部、概念)
(内部、物理)
システム上の高低
データの流れ
②CoE(Center of Excellence)の構築を目指した取り組み
データエンジニアだけがいろんな要求をDWHに反映するのではなく、
各ドメインの専門家が自らDWHを変更できるようにする
この体制により共通のデータモデルを全社で管理できるようにする
(※今はまだできていません。構築に向けて試行錯誤中です)
● データエンジニアは「使えるデータを管理する」ことが責務
● データエンジニアの業務は以前よりも
楽になった部分もあるが、要求自体は複雑化している
● データエンジニアは今後は
「複雑化する要求を解決できるようにする」能力を求められる
● そんな能力を発揮したい or 身につける意欲がある方
是非モノタロウに!
○ カジュアル面談はこちらから!
○ QRコードは右から!
20
まとめ
21
© 2020 MonotaRO Co., Ltd. All Rights Reserved.

More Related Content

PDF
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
PDF
「指標」を支えるエンジニアリング: DataOpsNight #1
PDF
セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
PDF
Rを用いたLTV(Life Time Value)の推定
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
PDF
DeNAの分析を支える分析基盤
PDF
全社のデータ活用を一段階上げる取り組み
PDF
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
【マーケティング・テクノロジーフェア 大阪 2023】 データから正しい意思決定を行うために 〜全社横断で実施したデータ活用プロジェクトの取...
「指標」を支えるエンジニアリング: DataOpsNight #1
セグメント?クラスタリング? ユーザーを分類し、サービスの改善に活かすポイント
Rを用いたLTV(Life Time Value)の推定
MonotaRO のデータ活用と基盤の過去、現在、未来
DeNAの分析を支える分析基盤
全社のデータ活用を一段階上げる取り組み
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...

What's hot (20)

PPTX
心理的安全性と、Veinの紹介 Psychological safety and introduction of Vein
PDF
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
PDF
データ基盤に関わる問い合わせ対応を仕組みで解決する
PDF
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
PDF
オントロジーとは?
PDF
REBOKを社内展開する際の障壁
PDF
ログについて改めて考えてみた
PPTX
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
PDF
データ基盤グループを支えるチームビルディング
PDF
Kubernetesによる機械学習基盤への挑戦
PDF
心理的安全性の構造 デブサミ2019夏 structure of psychological safety
PDF
インフラエンジニアの綺麗で優しい手順書の書き方
PDF
イミュータブルデータモデル(入門編)
PDF
時系列問題に対するCNNの有用性検証
PDF
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本
PDF
Data-Centric AIの紹介
PPTX
オーバーエンジニアリングって何? #devsumi #devsumiA
PDF
レコメンドアルゴリズムの基本と周辺知識と実装方法
PDF
マッチングサービスにおけるKPIの話
PPTX
AutoGluonではじめるAutoML
心理的安全性と、Veinの紹介 Psychological safety and introduction of Vein
PyConAPAC2023 ワークフローエンジン Apache Airflowを用いた 大規模データパイプライン構築と改善
データ基盤に関わる問い合わせ対応を仕組みで解決する
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
オントロジーとは?
REBOKを社内展開する際の障壁
ログについて改めて考えてみた
ラボラトリーオートメーションのためのソフトウェア思想教育(非プログラマ―が知っておくべきプログラミングの本質)
データ基盤グループを支えるチームビルディング
Kubernetesによる機械学習基盤への挑戦
心理的安全性の構造 デブサミ2019夏 structure of psychological safety
インフラエンジニアの綺麗で優しい手順書の書き方
イミュータブルデータモデル(入門編)
時系列問題に対するCNNの有用性検証
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本
Data-Centric AIの紹介
オーバーエンジニアリングって何? #devsumi #devsumiA
レコメンドアルゴリズムの基本と周辺知識と実装方法
マッチングサービスにおけるKPIの話
AutoGluonではじめるAutoML
Ad

Similar to 【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】 (14)

PDF
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
PDF
データエンジニアと作るデータ文化
PDF
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
PDF
パネルディスカッション資料(公開版)
PDF
Dddをもっと身近に
PPT
Big data harvardbusiessreview20121112
PDF
俺のDX
PDF
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
PDF
オープンセミナー岡山 これから始めるデータ活用
PPTX
データプランナーによるデータ系施策について
PDF
【Hr boss】 ビッグ・データとは?
PDF
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
PDF
S01 t3 data_engineer
PDF
Markezine day 2012 gdo nakazawa
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
データエンジニアと作るデータ文化
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
パネルディスカッション資料(公開版)
Dddをもっと身近に
Big data harvardbusiessreview20121112
俺のDX
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
オープンセミナー岡山 これから始めるデータ活用
データプランナーによるデータ系施策について
【Hr boss】 ビッグ・データとは?
JDMC LT#1 - なぜモノタロウでデータマネジメントが必要になったのか
S01 t3 data_engineer
Markezine day 2012 gdo nakazawa
Ad

More from 株式会社MonotaRO Tech Team (20)

PDF
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
PDF
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
PDF
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
PDF
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
PDF
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
PDF
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
PDF
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
PDF
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
PDF
MonotaRO LT - ESLintの仕組み
PDF
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
PDF
ITPと、その他cookie関連のこと / ITP and cookie
PDF
WSL2使ってみた / Preview for WSL2
PDF
WebApp個人開発のすゝめ / Recommendation of personal web app development
PDF
大規模フロントエンドのクリーンアーキテクチャ化 ~ 年間売上1,000億円企業モノタロウの取組み ~
PPTX
レガシーコードに向き合ってみた話
PDF
モノタロウ AIストアのひみつ #devsumiA
PPTX
社内勉強会を続けるには(2016.10.07 DevLove 関西)
PPTX
Pythonエンジニアの最適なキャリアを考える (PyCon JP 2016 ジョブフェア LT)
PPTX
尼崎から世界へ!モノタロウの海外展開を支えるDevOps基盤 (デブサミ関西2016)
PDF
マイクロサービスを利用する側のパフォーマンス向上策 (PyCon JP 2016)
20240522 Findy Event ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する.pdf
本番環境でやらかしちゃった選手権_MonotaRO社内LT会利用スライド.pdf
この技術書がすごい!2023夏(おすすめの技術書をペライチで紹介する選手権) .pdf
[ITmedia Cloud Native 2023] モノタロウのクラウドネイティブ.pdf
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
信頼性とアジリティを同時に上げろ!モノタロウのカナリアリリース導入.pdf
モノタロウの開発・リリースサイクルを支えるJenkinsの活用事例 - Jenkins Day Japan 2021
MonotaRO LT - ESLintの仕組み
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
ITPと、その他cookie関連のこと / ITP and cookie
WSL2使ってみた / Preview for WSL2
WebApp個人開発のすゝめ / Recommendation of personal web app development
大規模フロントエンドのクリーンアーキテクチャ化 ~ 年間売上1,000億円企業モノタロウの取組み ~
レガシーコードに向き合ってみた話
モノタロウ AIストアのひみつ #devsumiA
社内勉強会を続けるには(2016.10.07 DevLove 関西)
Pythonエンジニアの最適なキャリアを考える (PyCon JP 2016 ジョブフェア LT)
尼崎から世界へ!モノタロウの海外展開を支えるDevOps基盤 (デブサミ関西2016)
マイクロサービスを利用する側のパフォーマンス向上策 (PyCon JP 2016)

Recently uploaded (6)

PDF
ジフェニルホスフィンオキシド市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
高所作業プラットフォーム業界の上位メーカーランキング2025:市場シェアと売上推移の分析レポート
PPTX
Qlik Talend Cloud による RAG パイプライン(検索拡張生成パイプライン - ナレッジマートによるベクトル化とストア連携の紹介 -.pptx
PDF
カメラSOC市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
LEDビジョンレンタル市場規模の成長見通し:2031年には1934百万米ドルに到達へ
PPTX
【Qlik 医療データ活用勉強会】Qlikデータソン医療関連アプリの紹介、DPC分析ツールキットの提供
ジフェニルホスフィンオキシド市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
高所作業プラットフォーム業界の上位メーカーランキング2025:市場シェアと売上推移の分析レポート
Qlik Talend Cloud による RAG パイプライン(検索拡張生成パイプライン - ナレッジマートによるベクトル化とストア連携の紹介 -.pptx
カメラSOC市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
LEDビジョンレンタル市場規模の成長見通し:2031年には1934百万米ドルに到達へ
【Qlik 医療データ活用勉強会】Qlikデータソン医療関連アプリの紹介、DPC分析ツールキットの提供

【TECHTRACKJP】私ってデータエンジニアなんですか?気づいたらデータエンジニアと呼ばれるようになった私がこの職種について考えた【20230725】