SlideShare a Scribd company logo
Re: ゼロから始める監視設計
@zembutsu
運用自動化のための
2
私は誰?
‣ @zembutsu a.k.a. 前佛雅人
- Technology Evangelist  2+ yrs
- Technical Trainer  1 yr
- Data Center Operations Engineer  15+ yrs
興味:運用監視自動化
趣味でOSSやクラウド系の検証・情報発信
- SlideShare http://slideshare.net/zembutsu
- Blog https://pocketstudio.net
Why am I here?
+MasahitoZembutsu
3
‣ ゼロから監視設計できますか?
運用目的を明確化した監視と、非機能要件としてのシステム監視
‣ なぜ私たちは失敗をするのか?
人が介在する以上は不可避なので、手作業を減らしていこう
‣ 「知識×経験」を自動化で更に活かす
自動化は単なるきっかけの1つ
個人は経験の蓄積を、組織は知識の蓄積を
解決したい課題と、対策の提案
4
‣ なぜこの監視項目が入っているのか分からない
‣ いざ監視をしようと思っても、できない
‣ ツール選定の話をすると、職場が荒れる
現場あるある(?)
どうしてこうなった?
運用
監視
Operation
Monitoring
―Don't forget. always, somewhere,
someone is fighting for you.
―As long as you remember her.
you are not alone.
忘れないで、いつもどこかで誰かがあなたの為に戦っている。
彼女を覚えている限り、あなたは一人じゃない。
(出典:魔法少女まどかマギカ最終話「わたしの、最高の友達」)
6
運用を評価する手段が監視
利用者
システム担当
運用
7
運用を評価する手段が監視
システム設計
利用者
システム担当
構築
運用
評価
報告 システム利用
検証
計画
キャパシティ・プランニング
トラブル・シューティング
8
‣ システム管理 ‣ サイト運用技術
00年代~10年代にかけての監視変遷
System Operator, System Administrator Site Reliability Engineering
(出典)総務省「平成23年通信利用動向調査」
http://www.soumu.go.jp/johotsusintokei/statistics/statistics05.html
5,593
6,942
7,730
7,948
8,529
8,754 8,811
9,091
9,408 9,462 9,610
46.3
57.8
64.3 66.0
70.8 72.6 73.0
75.3
78.0 78.2 79.1
0
10
20
30
40
50
60
70
80
90
100
0
1,000
2,000
3,000
4,000
5,000
6,000
7,000
8,000
9,000
10,000
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
普
及
率
(
%
)
利
用
者
数
(
万
人
)
利用者数 人口普及率
インターネット利用者数と普及率の推移
監視第1世代・物理 (~2000年)=死活監視
First Generation Monitoring System, Dead or Alive
監視第2世代・仮想化 (~2009年)=時系列リソース
Second Generation Monitoring System, Time Series and Resource Monitoring
監視第3世代・クラウド対応 (~現在)=時系列サービス
Third Generation Monitoring System, Time Series Service Level
13
ペットから家畜へ
Architectures for open and scalable clouds
http://www.slideshare.net/randybias/architectures-for-open-and-scalable-clouds
ゼロからの監視設計
15
非機能要件としての
システム監視
• プロセス
• システムリソース
• ログ
• ネットワーク
• ハードウェア
サービスレベルの監視
• プロトコル
• 応答速度
• サービス遷移
• セキュリティ
キャパシティ・プランニング
トラブル・シューティング
16
例:とある会社のサイトを運用
17
‣ OSを知ろう、理解しよう、使おう
‣ 基本コマンド群の理解
‣ 自由に扱えるプログラミング言語
知識
18
‣ IT系のエンジニアを名乗るなら(目指すなら)、
インターネットの開かれた環境上に
自分でサーバの1つぐらい運用しませんか?
経験に対する、私からの提案
知識を活かす経験の蓄積
なぜ自動化なのか
私たちは何故失敗するのか
Re: ゼロから始める監視設計
22
運用における失敗とは
23
運用における失敗とは
24
運用における失敗
システム稼働前 システム稼働後
• 不適切な運用フロー
• 監視設定漏れorミス
• 通知設定漏れorミス
• 保守時の作業ミス
• 異常時のリカバリ失敗
• 機能しない運用フロー
事前に対策可能な場合が多い 不可避
失敗の共通要素:人的問題
25
‣ 運用前
適切な設計で回避できる
‣ 運用中
人が介在すると失敗が起こる
• 精神論では回避できない
私たちは何故失敗するのか
26
ラスムッセンのSRKモデル(人間の行動レベルは、知識→規則→熟練)
WEB版「航空と文化」 教育訓練のメカニズム 黒田 勲
http://www.aero.or.jp/web-koku-to-bunka/2006.06.12humanfactor4.htm
余裕がない状態
混乱・パニックで
事故を起こす
マニュアル通りに
事故を起こす
手順省略や
思い込みで
事故を起こす
レベル毎のミス
27
‣ 障害に強い設計
• 障害時のフェイルオーバなど、自動化の仕組み
‣ 手作業の排除≠完全な運用や監視の自動化
• 自動化ツールの導入
• 手作業が入る場合は、自動テストツールを組みあわせる
– 人がミスしても、その場で発見・リカバリできるように
– 人によるダブルチェックを信用しない
人の失敗を避けるには?
28
‣ 局所最適化は意味が無い
その自動化に価値が無い
自動化システムの維持が目的化してしまう(誰が面倒を見るか)
• 例:田んぼの水管理をシステム化しました
‣ 最悪なパターン
• 自動化投資を終えたので使い続けなくてはいけない(使命感)
– でも、手動に拘り続けるよりはましでは
自動化は目的ではないが、手段の1つ
29
‣ 何のための運用なのかを忘れずに
• ツールに運用や監視の幅を既定されるのは本末転倒
‣ 目的を失いがち
• 誰が使うのか
– (自社|他社)開発 ×(自社|他社)運用
• どのレイヤなのか
– インフラ
– プラットフォーム
– サービス
ツール選定の罠
30
‣ 個人
経験を積む
• インターネット上で実サーバを運用して経験値を積もう
効率化(時間短縮・正確さの追求)ツールの導入
‣ 組織
ドキュメント化
• なぜこのような運用設計・監視設計をしているのか
運用でもテスト文化
知識や経験を適切に活かすためには
知識だけでは生きていけない
経験だけでも生きていけない
32
‣ ゼロから監視設計できますか?
‣ なぜ私たちは失敗をするのか?
‣ 「知識×経験」を自動化で更に活かす
まとめ
33
‣ ゼロから監視設計できますか?
運用目的を明確化した監視と、非機能要件としてのシステム監視
‣ なぜ私たちは失敗をするのか?
人が介在する以上は不可避なので、手作業を減らしていこう
‣ 「知識×経験」を自動化で更に活かす
自動化は単なるきっかけの1つ
個人は経験の蓄積を、組織は知識の蓄積を
まとめ

More Related Content

PDF
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
Trainocate Japan, Ltd.
 
PDF
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
Yahoo!デベロッパーネットワーク
 
PDF
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Amazon Web Services Japan
 
PDF
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
Amazon Web Services Japan
 
PDF
Google Cloud で実践する SRE
Google Cloud Platform - Japan
 
PDF
開発速度が速い #とは(LayerX社内資料)
mosa siru
 
PPTX
はじめてのElasticsearchクラスタ
Satoyuki Tsukano
 
PDF
分散トレーシング技術について(Open tracingやjaeger)
NTT Communications Technology Development
 
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
Trainocate Japan, Ltd.
 
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
Yahoo!デベロッパーネットワーク
 
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Amazon Web Services Japan
 
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
Amazon Web Services Japan
 
Google Cloud で実践する SRE
Google Cloud Platform - Japan
 
開発速度が速い #とは(LayerX社内資料)
mosa siru
 
はじめてのElasticsearchクラスタ
Satoyuki Tsukano
 
分散トレーシング技術について(Open tracingやjaeger)
NTT Communications Technology Development
 

What's hot (20)

PPTX
Azure API Management 俺的マニュアル
貴志 上坂
 
PDF
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
Hibino Hisashi
 
PPTX
いまさら、AWSのネットワーク設計
Serverworks Co.,Ltd.
 
PDF
3分でわかるAzureでのService Principal
Toru Makabe
 
PDF
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Toru Makabe
 
PPTX
NTTデータ流Infrastructure as Code~ 大規模プロジェクトを通して考え抜いた基盤自動化の新たな姿~(NTTデータ テクノロジーカンフ...
NTT DATA Technology & Innovation
 
PPTX
KeycloakでAPI認可に入門する
Hitachi, Ltd. OSS Solution Center.
 
PPTX
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
Amazon Web Services Japan
 
PDF
AWSのログ管理ベストプラクティス
Akihiro Kuwano
 
PDF
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
都元ダイスケ Miyamoto
 
PPTX
サポート エンジニアが Azure Networking をじっくりたっぷり語りつくす会
ShuheiUda
 
PPTX
【SQiP2016】楽天のアジャイル開発とメトリクス事例
Kotaro Ogino
 
PPTX
20220409 AWS BLEA 開発にあたって検討したこと
Amazon Web Services Japan
 
PPTX
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
NTT DATA Technology & Innovation
 
PDF
20200212 AWS Black Belt Online Seminar AWS Systems Manager
Amazon Web Services Japan
 
PDF
VPCのアウトバウンド通信を制御するためにおさえておきたい設計ポイント
Takuya Takaseki
 
PDF
ソフトウェア開発における『知の高速道路』
Yoshitaka Kawashima
 
PDF
ドメイン駆動設計のための Spring の上手な使い方
増田 亨
 
PPTX
AWS Organizations連携サービスの罠(Security JAWS 第26回 発表資料)
NTT DATA Technology & Innovation
 
PPTX
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
NTT DATA Technology & Innovation
 
Azure API Management 俺的マニュアル
貴志 上坂
 
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
Hibino Hisashi
 
いまさら、AWSのネットワーク設計
Serverworks Co.,Ltd.
 
3分でわかるAzureでのService Principal
Toru Makabe
 
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Toru Makabe
 
NTTデータ流Infrastructure as Code~ 大規模プロジェクトを通して考え抜いた基盤自動化の新たな姿~(NTTデータ テクノロジーカンフ...
NTT DATA Technology & Innovation
 
KeycloakでAPI認可に入門する
Hitachi, Ltd. OSS Solution Center.
 
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
Amazon Web Services Japan
 
AWSのログ管理ベストプラクティス
Akihiro Kuwano
 
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
都元ダイスケ Miyamoto
 
サポート エンジニアが Azure Networking をじっくりたっぷり語りつくす会
ShuheiUda
 
【SQiP2016】楽天のアジャイル開発とメトリクス事例
Kotaro Ogino
 
20220409 AWS BLEA 開発にあたって検討したこと
Amazon Web Services Japan
 
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
NTT DATA Technology & Innovation
 
20200212 AWS Black Belt Online Seminar AWS Systems Manager
Amazon Web Services Japan
 
VPCのアウトバウンド通信を制御するためにおさえておきたい設計ポイント
Takuya Takaseki
 
ソフトウェア開発における『知の高速道路』
Yoshitaka Kawashima
 
ドメイン駆動設計のための Spring の上手な使い方
増田 亨
 
AWS Organizations連携サービスの罠(Security JAWS 第26回 発表資料)
NTT DATA Technology & Innovation
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
NTT DATA Technology & Innovation
 
Ad

Similar to Re: ゼロから始める監視設計 (20)

PDF
機械学習で導入でつまった3つの事
創史 花村
 
PDF
いまさら聞けないインフラ勉強会Vol.3~システム監視ツールバトル2013開催案内
Shu Takeda
 
PDF
とある情報の超整理術
Masahito Zembutsu
 
PDF
クラウド・コンピューティングの普及に伴うMSPの現状と課題
Masahito Zembutsu
 
PDF
GMOテクノロジーブートキャンプ2015(アジャイル編)
Arata Fujimura
 
PPTX
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
Shunsuke Nakamura
 
PDF
財務分析勉強会挨拶
oranie Narut
 
PDF
クラウド事業者に求めるビジネス要件
雄哉 吉田
 
PPTX
20180925_【サポーターズCoLab勉強会】【営業から運用まで】データサイエンティストという職業
Shunsuke Nakamura
 
PDF
KPTふりかえり実践研修のご紹介
ESM SEC
 
PDF
情報システム部門の組織開発
Kazutaka Sankai
 
PDF
分報PDCA
T K
 
PDF
タレントへ目指せ
Shuncai Zhou
 
PDF
JPC2018[E3]NoOps で進める! Microsoft 365 提案のポイント
MPN Japan
 
PDF
Agile2010とは何だったのか
Dai FUJIHARA
 
PDF
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
Naoyuki Yamada
 
PDF
Office365勉強会 #23 Azure AD のテナント設計(Office365管理者向け)
Genki WATANABE
 
PPT
Ga tracker5_ムラヤマユウスケ_slideshare
yusuke0726
 
PDF
SQiP2016 SIG8
Masanori Kaneko
 
PDF
アドテクを支える人と技術
Ransui Iso
 
機械学習で導入でつまった3つの事
創史 花村
 
いまさら聞けないインフラ勉強会Vol.3~システム監視ツールバトル2013開催案内
Shu Takeda
 
とある情報の超整理術
Masahito Zembutsu
 
クラウド・コンピューティングの普及に伴うMSPの現状と課題
Masahito Zembutsu
 
GMOテクノロジーブートキャンプ2015(アジャイル編)
Arata Fujimura
 
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
Shunsuke Nakamura
 
財務分析勉強会挨拶
oranie Narut
 
クラウド事業者に求めるビジネス要件
雄哉 吉田
 
20180925_【サポーターズCoLab勉強会】【営業から運用まで】データサイエンティストという職業
Shunsuke Nakamura
 
KPTふりかえり実践研修のご紹介
ESM SEC
 
情報システム部門の組織開発
Kazutaka Sankai
 
分報PDCA
T K
 
タレントへ目指せ
Shuncai Zhou
 
JPC2018[E3]NoOps で進める! Microsoft 365 提案のポイント
MPN Japan
 
Agile2010とは何だったのか
Dai FUJIHARA
 
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
Naoyuki Yamada
 
Office365勉強会 #23 Azure AD のテナント設計(Office365管理者向け)
Genki WATANABE
 
Ga tracker5_ムラヤマユウスケ_slideshare
yusuke0726
 
SQiP2016 SIG8
Masanori Kaneko
 
アドテクを支える人と技術
Ransui Iso
 
Ad

More from Masahito Zembutsu (20)

PDF
忙しい人のための Rocky Linux 入門〜Rocky LinuxはCentOSの後継者たり得るか?〜
Masahito Zembutsu
 
PDF
自由検証環境提供宣言+Docker Compose V2 GA
Masahito Zembutsu
 
PDF
CentOS Linux 8 の EOL と対応策の検討
Masahito Zembutsu
 
PDF
さくらインターネットのコミュニティ with COVID-19
Masahito Zembutsu
 
PDF
Docker Chronicle 2021.09
Masahito Zembutsu
 
PDF
ブックトーク@CROSS ~SF編~ 発表資料「攻殻機動隊」「導きの星」
Masahito Zembutsu
 
PDF
インターネットでウェブサイトを表示している裏側の話
Masahito Zembutsu
 
PDF
3分で分かる「プログラミング教育・情報教育」
Masahito Zembutsu
 
PDF
ようこそオンラインの展示会場へ
Masahito Zembutsu
 
PDF
小学校プログラミング教育に対する企業の取り組みと課題 #KOF2020
Masahito Zembutsu
 
PDF
オンライン発表で気を付けているポイント~姿勢編
Masahito Zembutsu
 
PDF
Docker道場オンライン#1 Docker基礎概念と用語の理解
Masahito Zembutsu
 
PDF
Jitsi Meetとは?
Masahito Zembutsu
 
PDF
Docker 9 tips~意外と知られていない日常で役立つ便利技
Masahito Zembutsu
 
PDF
コンテナの作り方「Dockerは裏方で何をしているのか?」
Masahito Zembutsu
 
PDF
クリスマスに工場(Factorio)を作るゲームをしよう
Masahito Zembutsu
 
PDF
Dockerfileを改善するためのBest Practice 2019年版
Masahito Zembutsu
 
PDF
Dockerfile を書くためのベストプラクティス解説編
Masahito Zembutsu
 
PDF
2020年から始まる小学校プログラミング教育の話 #osc19os
Masahito Zembutsu
 
PDF
Docker Compose 徹底解説
Masahito Zembutsu
 
忙しい人のための Rocky Linux 入門〜Rocky LinuxはCentOSの後継者たり得るか?〜
Masahito Zembutsu
 
自由検証環境提供宣言+Docker Compose V2 GA
Masahito Zembutsu
 
CentOS Linux 8 の EOL と対応策の検討
Masahito Zembutsu
 
さくらインターネットのコミュニティ with COVID-19
Masahito Zembutsu
 
Docker Chronicle 2021.09
Masahito Zembutsu
 
ブックトーク@CROSS ~SF編~ 発表資料「攻殻機動隊」「導きの星」
Masahito Zembutsu
 
インターネットでウェブサイトを表示している裏側の話
Masahito Zembutsu
 
3分で分かる「プログラミング教育・情報教育」
Masahito Zembutsu
 
ようこそオンラインの展示会場へ
Masahito Zembutsu
 
小学校プログラミング教育に対する企業の取り組みと課題 #KOF2020
Masahito Zembutsu
 
オンライン発表で気を付けているポイント~姿勢編
Masahito Zembutsu
 
Docker道場オンライン#1 Docker基礎概念と用語の理解
Masahito Zembutsu
 
Jitsi Meetとは?
Masahito Zembutsu
 
Docker 9 tips~意外と知られていない日常で役立つ便利技
Masahito Zembutsu
 
コンテナの作り方「Dockerは裏方で何をしているのか?」
Masahito Zembutsu
 
クリスマスに工場(Factorio)を作るゲームをしよう
Masahito Zembutsu
 
Dockerfileを改善するためのBest Practice 2019年版
Masahito Zembutsu
 
Dockerfile を書くためのベストプラクティス解説編
Masahito Zembutsu
 
2020年から始まる小学校プログラミング教育の話 #osc19os
Masahito Zembutsu
 
Docker Compose 徹底解説
Masahito Zembutsu
 

Re: ゼロから始める監視設計