SlideShare a Scribd company logo
Amazon SageMaker ML Governance
3つの機能紹介
MLプロジェクトを適切に管理する
2022/12/31 第18回勉強会
自己紹介
● 名前: 西岡 賢一郎
○ Twitter: @ken_nishi
○ note: 西岡賢一郎@研究者から経営者へ (https://note.com/kenichiro)
○ YouTube: 【経営xデータサイエンスx開発】西岡 賢一郎のチャンネル
(https://www.youtube.com/channel/UCpiskjqLv1AJg64jFCQIyBg)
● 経歴
○ 東京大学で位置予測アルゴリズムを研究し博士 (学術) を取得
○ 東京大学の博士課程在学中にデータサイエンスをもとにしたサービスを提供する株式会社ト
ライディアを設立
○ トライディアを別のIT会社に売却し、CTOとして3年半務め、2021年10月末にCTOを退職
○ CDPのスタートアップと株式会社データインフォームドの2つに所属
○ 自社および他社のプロダクト開発チーム・データサイエンスチームの立ち上げ経験
今回のお話
● ML Governanceが必要となる背景
● Amazon SageMaker Role Manager
● Amazon SageMaker Model Cards
● Amazon SageMaker Dashboard
● デモ
ML Governanceが必要となる背景
● 権限設定の複雑化
○ 機械学習プロジェクトに関わる人材が多様化し、適切な権限の設定に手間がかかる
○ 例: MLエンジニアとデータサイエンティストで権限を分けたい
● モデル情報の管理コスト
○ モデルの生成プロセスなどの情報が様々なドキュメントで管理されている
● モデルの監視
○ モデルの予測性能が、時間経過とともに劣化することがある (Drift)
○ モデルが期待通り挙動しているか監視し、予期せぬ挙動をした場合にアラートを飛ばす必要
がある
Amazon SageMaker ML Governance
● re:Invent 2022で発表
● アクセスコントロールを簡素化し、MLプロジェクトの透明性を向上
● 3つの機能
○ Amazon SageMaker Role Manager (Demoで紹介)
■ ユーザのカスタム権限を数分で定義
○ Amazon SageMaker Model Cards (Demoで紹介)
■ モデルの情報を文書化
○ Amazon SageMaker Model Dashboard
■ ダッシュボード上でモデルを管理
Amazon SageMaker Role Manager
Amazon SageMaker Role Manager
● IAMの作成を簡素化
● 事前設定されたPersona (後述) を利用して権限を付与
事前設定されたPersona
● Personaとは、事前に設定された権限グル
ープのこと
● Data Scientist, ML Ops, SageMaker
Compute Roleなど必要なML Activity (後
述) を設定されたPersonaが設定されてい
る
ML Activity
● SageMakerを使った機械学習に関連する
一般的なAWSタスク
● ML Jobの管理、モデルの管理、エンドポ
イントの管理など、MLに関係するActivity
が定義されている
● ActivityのためのIAM権限は別途必要とな
るので、Roleを別途用意する必要がある
● Activityに必要なS3のバケットやECRなど
も別途用意しておく必要がある
Persona: Data Scientist
データサイエンティストのPersonaでは、MLジョ
ブ、モデル、S3へのアクセス権限を必要とする
Persona: ML Ops
ML OpsのPersonaでは、モデル、エンドポイント
パイプラインの管理権限を必要とする
Persona: SageMaker Compute Role
SageMaker Compute RoleのS3へのアクセス権限、ECRのレ
ポジトリへのアクセス権限などを必要とする。
Amazon SageMaker Role Managerの所感
● Pros
○ Personaごとに必要なML Activityが設定されているのは便利
○ RoleやPolicy設定の参考にもなる
● Cons
○ モデル管理権限などを持ったRoleを事前に定義しておく必要があるため、事前準備の手間は
大きい
○ TerraformなどスクリプトでIAMを管理している場合、作成されたIAMが別管理となってしま
う
○ 組織構造によっては、Personaの分け方が機能しない
Amazon SageMaker Model Cards
Amazon SageMaker Model Cards
● モデルに関連する情報をCardに集約
● AWSリソース以外のモデルも管理可能だが、AWSリソースのモデルのほうが入力は楽
全体概要
● モデルの詳細
○ Model Artifact: モデルを学習した結果の出力。学習済みパラメータ、推論の計算方法を記述し
たモデル定義、およびその他のメタデータなど。
○ Inference Environment: 推論を実施する環境
○ モデルの説明
○ モデルのバージョン
○ 問題のタイプ: Classification, Regressionなど
○ アルゴリズムタイプ: Linear Regression, Random Forestなど
○ モデルの作者
○ モデルのオーナー
● 想定される用途
○ 想定される用途
○ モデルの有効性に影響を与える要因
○ リスク度合いとその説明
Amazon SageMaker Model Cards
● 使用目的、リスク評価、トレーニングの詳細など、重要なモデル情報を管理
● 主な機能
○ モデル情報の取得
■ 入力データセット、トレーニング環境、トレーニング結果などのトレーニングの詳細を
自動入力
■ モデルの目的やパフォーマンスの目標などの詳細も追加可能
○ 評価結果の可視化
■ バイアスや品質指標などのモデル評価結果をモデルカードに添付
■ グラフなどの視覚化を追加し、モデルのパフォーマンスに関する重要なインサイトを得
ることができます
○ モデルカードの共有
■ モデルカードを PDF 形式にエクスポートして、ビジネス関係者、社内チームや顧客と
簡単に共有できます。
トレーニング詳細
● 目的関数とそのノート
● トレーニングの観察結果
● トレーニングジョブ詳細
○ Job名
○ ARN
○ Input
○ トレーニング環境
● トレーニングの結果
その他情報
● 追加の評価結果
● 倫理的な考慮事項
● 注意点・推奨事項
● カスタムフィールド
PDF Export
● Model CardをPDF ExportしてS3に保存す
ることが可能
● S3に保存されたPDFをダウンロードする
必要があるため、少々使い勝手は悪い
Amazon SageMaker Model Dashboard
Amazon SageMaker Model Dashboard
● モデルの動作の追跡
○ リソースとモデルの動作違反を1か所で追跡
○ データ品質、モデル品質、Bias Drift、Feature Attribution Driftの 4つの次元で監視
○ Amazon SageMaker Model MonitorとAmazon SageMaker Clarifyとの統合を通じて動作を監視
● アラートの自動化
○ モデル動作の逸脱などに対するアラートを設定
● モデル偏差のトラブルシューティング
○ モデルのパフォーマンスに影響を与える要因を時系列で分析
サンプルダッシュボード
● モデルに関する情報が一つの画面に集約
● 各種ステータスがひと目で分かるようになっている
出典: https://aws.amazon.com/jp/blogs/aws/new-ml-governance-tools-for-amazon-sagemaker-simplify-access-control-and-enhance-transparency-over-your-ml-projects/
デモ
● Amazon SageMaker Role Managerを使ったRoleの作成
● Amazon Sage Maker Cardsの作成

More Related Content

PPTX
Amazon SageMakerでカスタムコンテナを使った学習
西岡 賢一郎
 
PDF
なぜ「マイクロサービス“化”」が必要なのか
Yusuke Suzuki
 
PDF
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
Amazon Web Services Japan
 
PPTX
MLOps入門
Hiro Mura
 
PDF
45分間で「ユーザー中心のものづくり」ができるまで詰め込む
Yoshiki Hayama
 
PDF
Amazon SageMaker で始める機械学習
Amazon Web Services Japan
 
PPTX
Amazon AthenaでSageMakerを使った推論
西岡 賢一郎
 
PDF
開発速度が速い #とは(LayerX社内資料)
mosa siru
 
Amazon SageMakerでカスタムコンテナを使った学習
西岡 賢一郎
 
なぜ「マイクロサービス“化”」が必要なのか
Yusuke Suzuki
 
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
Amazon Web Services Japan
 
MLOps入門
Hiro Mura
 
45分間で「ユーザー中心のものづくり」ができるまで詰め込む
Yoshiki Hayama
 
Amazon SageMaker で始める機械学習
Amazon Web Services Japan
 
Amazon AthenaでSageMakerを使った推論
西岡 賢一郎
 
開発速度が速い #とは(LayerX社内資料)
mosa siru
 

What's hot (20)

PDF
Python 3.9からの新定番zoneinfoを使いこなそう
Ryuji Tsutsui
 
PDF
20190129 AWS Black Belt Online Seminar AWS Identity and Access Management (AW...
Amazon Web Services Japan
 
PDF
20190522 AWS Black Belt Online Seminar AWS Step Functions
Amazon Web Services Japan
 
PDF
20190806 AWS Black Belt Online Seminar AWS Glue
Amazon Web Services Japan
 
PDF
Amazon Athena 初心者向けハンズオン
Amazon Web Services Japan
 
PDF
20191112 AWS Black Belt Online Seminar AWS Media Services で始めるライブ動画配信
Amazon Web Services Japan
 
PDF
DDD x CQRS 更新系と参照系で異なるORMを併用して上手くいった話
Koichiro Matsuoka
 
PDF
ドメイン駆動設計のための Spring の上手な使い方
増田 亨
 
PPTX
MLOpsはバズワード
Tetsutaro Watanabe
 
PDF
マルチテナント化で知っておきたいデータベースのこと
Amazon Web Services Japan
 
PDF
Re: ゼロから始める監視設計
Masahito Zembutsu
 
PDF
AWSのログ管理ベストプラクティス
Akihiro Kuwano
 
PDF
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
 
PPTX
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
西岡 賢一郎
 
PDF
Data-centricなML開発
Takeshi Suzuki
 
PPTX
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
NTT DATA Technology & Innovation
 
PDF
3. Vertex AIを用いた時系列データの解析
幸太朗 岩澤
 
PDF
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
NTT DATA Technology & Innovation
 
PDF
インフラCICDの勘所
Toru Makabe
 
PDF
研究発表を準備する(2022年版)
Takayuki Itoh
 
Python 3.9からの新定番zoneinfoを使いこなそう
Ryuji Tsutsui
 
20190129 AWS Black Belt Online Seminar AWS Identity and Access Management (AW...
Amazon Web Services Japan
 
20190522 AWS Black Belt Online Seminar AWS Step Functions
Amazon Web Services Japan
 
20190806 AWS Black Belt Online Seminar AWS Glue
Amazon Web Services Japan
 
Amazon Athena 初心者向けハンズオン
Amazon Web Services Japan
 
20191112 AWS Black Belt Online Seminar AWS Media Services で始めるライブ動画配信
Amazon Web Services Japan
 
DDD x CQRS 更新系と参照系で異なるORMを併用して上手くいった話
Koichiro Matsuoka
 
ドメイン駆動設計のための Spring の上手な使い方
増田 亨
 
MLOpsはバズワード
Tetsutaro Watanabe
 
マルチテナント化で知っておきたいデータベースのこと
Amazon Web Services Japan
 
Re: ゼロから始める監視設計
Masahito Zembutsu
 
AWSのログ管理ベストプラクティス
Akihiro Kuwano
 
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
 
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
西岡 賢一郎
 
Data-centricなML開発
Takeshi Suzuki
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
NTT DATA Technology & Innovation
 
3. Vertex AIを用いた時系列データの解析
幸太朗 岩澤
 
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
NTT DATA Technology & Innovation
 
インフラCICDの勘所
Toru Makabe
 
研究発表を準備する(2022年版)
Takayuki Itoh
 
Ad

Similar to Amazon SageMaker ML Governance 3つの機能紹介 (20)

PPTX
機械学習の特徴量を管理するAmazon SageMaker Feature Store
西岡 賢一郎
 
PPTX
Amazon SageMakerのNotebookからJobを作成する
西岡 賢一郎
 
PPTX
Amazon SageMaker JumpStart
西岡 賢一郎
 
PPTX
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
西岡 賢一郎
 
PPTX
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
西岡 賢一郎
 
PPTX
Amazon SageMaker Canvasを使ったノーコード機械学習
西岡 賢一郎
 
PPTX
Amazon SageMaker Studio Lab紹介
西岡 賢一郎
 
PPTX
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
西岡 賢一郎
 
PPTX
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
西岡 賢一郎
 
PPTX
H2Oを使ったノーコードのAutoML
西岡 賢一郎
 
PPTX
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
西岡 賢一郎
 
PPTX
AutoGluonではじめるAutoML
西岡 賢一郎
 
PPTX
TorchDataチュートリアル解説
西岡 賢一郎
 
PPTX
H2O Waveを使ったAIアプリケーション作成入門
西岡 賢一郎
 
PPTX
機械学習の技術的負債
西岡 賢一郎
 
PPTX
XAI (説明可能なAI) の必要性
西岡 賢一郎
 
PDF
実践的なUXデザインとグロースハック
Takahiro Ishiyama
 
PDF
身近なところからはじめるマーケットデザイン
YojiTomita
 
PPTX
未来のカタチ x AI
西岡 賢一郎
 
PDF
実践的なUXデザインとインタラクションデザインの考え方
Takahiro Ishiyama
 
機械学習の特徴量を管理するAmazon SageMaker Feature Store
西岡 賢一郎
 
Amazon SageMakerのNotebookからJobを作成する
西岡 賢一郎
 
Amazon SageMaker JumpStart
西岡 賢一郎
 
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
西岡 賢一郎
 
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
西岡 賢一郎
 
Amazon SageMaker Canvasを使ったノーコード機械学習
西岡 賢一郎
 
Amazon SageMaker Studio Lab紹介
西岡 賢一郎
 
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
西岡 賢一郎
 
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
西岡 賢一郎
 
H2Oを使ったノーコードのAutoML
西岡 賢一郎
 
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
西岡 賢一郎
 
AutoGluonではじめるAutoML
西岡 賢一郎
 
TorchDataチュートリアル解説
西岡 賢一郎
 
H2O Waveを使ったAIアプリケーション作成入門
西岡 賢一郎
 
機械学習の技術的負債
西岡 賢一郎
 
XAI (説明可能なAI) の必要性
西岡 賢一郎
 
実践的なUXデザインとグロースハック
Takahiro Ishiyama
 
身近なところからはじめるマーケットデザイン
YojiTomita
 
未来のカタチ x AI
西岡 賢一郎
 
実践的なUXデザインとインタラクションデザインの考え方
Takahiro Ishiyama
 
Ad

More from 西岡 賢一郎 (10)

PPTX
リモートワークで知っておきたい コミュニケーション時の過大な期待
西岡 賢一郎
 
PPTX
リモートワークで意識すべき7つのこと
西岡 賢一郎
 
PPTX
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
西岡 賢一郎
 
PPTX
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点
西岡 賢一郎
 
PPTX
ストリートビューから地域の豊かさを推定
西岡 賢一郎
 
PPTX
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
西岡 賢一郎
 
PPTX
人間の意思決定を機械学習でモデル化できるか
西岡 賢一郎
 
PPTX
協力ゲーム理論でXAI (説明可能なAI) を目指すSHAP (Shapley Additive exPlanation)
西岡 賢一郎
 
PPTX
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
 
PPTX
表形式データで高性能な予測モデルを構築する「DNNとXGBoostのアンサンブル学習」
西岡 賢一郎
 
リモートワークで知っておきたい コミュニケーション時の過大な期待
西岡 賢一郎
 
リモートワークで意識すべき7つのこと
西岡 賢一郎
 
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
西岡 賢一郎
 
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点
西岡 賢一郎
 
ストリートビューから地域の豊かさを推定
西岡 賢一郎
 
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
西岡 賢一郎
 
人間の意思決定を機械学習でモデル化できるか
西岡 賢一郎
 
協力ゲーム理論でXAI (説明可能なAI) を目指すSHAP (Shapley Additive exPlanation)
西岡 賢一郎
 
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
 
表形式データで高性能な予測モデルを構築する「DNNとXGBoostのアンサンブル学習」
西岡 賢一郎
 

Recently uploaded (8)

PDF
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
PDF
20250729_Devin-for-Enterprise
Masaki Yamakawa
 
PDF
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
PPTX
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
PDF
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
PDF
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
PDF
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
PPTX
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
20250729_Devin-for-Enterprise
Masaki Yamakawa
 
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 

Amazon SageMaker ML Governance 3つの機能紹介

  • 1. Amazon SageMaker ML Governance 3つの機能紹介 MLプロジェクトを適切に管理する 2022/12/31 第18回勉強会
  • 2. 自己紹介 ● 名前: 西岡 賢一郎 ○ Twitter: @ken_nishi ○ note: 西岡賢一郎@研究者から経営者へ (https://note.com/kenichiro) ○ YouTube: 【経営xデータサイエンスx開発】西岡 賢一郎のチャンネル (https://www.youtube.com/channel/UCpiskjqLv1AJg64jFCQIyBg) ● 経歴 ○ 東京大学で位置予測アルゴリズムを研究し博士 (学術) を取得 ○ 東京大学の博士課程在学中にデータサイエンスをもとにしたサービスを提供する株式会社ト ライディアを設立 ○ トライディアを別のIT会社に売却し、CTOとして3年半務め、2021年10月末にCTOを退職 ○ CDPのスタートアップと株式会社データインフォームドの2つに所属 ○ 自社および他社のプロダクト開発チーム・データサイエンスチームの立ち上げ経験
  • 3. 今回のお話 ● ML Governanceが必要となる背景 ● Amazon SageMaker Role Manager ● Amazon SageMaker Model Cards ● Amazon SageMaker Dashboard ● デモ
  • 4. ML Governanceが必要となる背景 ● 権限設定の複雑化 ○ 機械学習プロジェクトに関わる人材が多様化し、適切な権限の設定に手間がかかる ○ 例: MLエンジニアとデータサイエンティストで権限を分けたい ● モデル情報の管理コスト ○ モデルの生成プロセスなどの情報が様々なドキュメントで管理されている ● モデルの監視 ○ モデルの予測性能が、時間経過とともに劣化することがある (Drift) ○ モデルが期待通り挙動しているか監視し、予期せぬ挙動をした場合にアラートを飛ばす必要 がある
  • 5. Amazon SageMaker ML Governance ● re:Invent 2022で発表 ● アクセスコントロールを簡素化し、MLプロジェクトの透明性を向上 ● 3つの機能 ○ Amazon SageMaker Role Manager (Demoで紹介) ■ ユーザのカスタム権限を数分で定義 ○ Amazon SageMaker Model Cards (Demoで紹介) ■ モデルの情報を文書化 ○ Amazon SageMaker Model Dashboard ■ ダッシュボード上でモデルを管理
  • 7. Amazon SageMaker Role Manager ● IAMの作成を簡素化 ● 事前設定されたPersona (後述) を利用して権限を付与
  • 8. 事前設定されたPersona ● Personaとは、事前に設定された権限グル ープのこと ● Data Scientist, ML Ops, SageMaker Compute Roleなど必要なML Activity (後 述) を設定されたPersonaが設定されてい る
  • 9. ML Activity ● SageMakerを使った機械学習に関連する 一般的なAWSタスク ● ML Jobの管理、モデルの管理、エンドポ イントの管理など、MLに関係するActivity が定義されている ● ActivityのためのIAM権限は別途必要とな るので、Roleを別途用意する必要がある ● Activityに必要なS3のバケットやECRなど も別途用意しておく必要がある
  • 11. Persona: ML Ops ML OpsのPersonaでは、モデル、エンドポイント パイプラインの管理権限を必要とする
  • 12. Persona: SageMaker Compute Role SageMaker Compute RoleのS3へのアクセス権限、ECRのレ ポジトリへのアクセス権限などを必要とする。
  • 13. Amazon SageMaker Role Managerの所感 ● Pros ○ Personaごとに必要なML Activityが設定されているのは便利 ○ RoleやPolicy設定の参考にもなる ● Cons ○ モデル管理権限などを持ったRoleを事前に定義しておく必要があるため、事前準備の手間は 大きい ○ TerraformなどスクリプトでIAMを管理している場合、作成されたIAMが別管理となってしま う ○ 組織構造によっては、Personaの分け方が機能しない
  • 15. Amazon SageMaker Model Cards ● モデルに関連する情報をCardに集約 ● AWSリソース以外のモデルも管理可能だが、AWSリソースのモデルのほうが入力は楽
  • 16. 全体概要 ● モデルの詳細 ○ Model Artifact: モデルを学習した結果の出力。学習済みパラメータ、推論の計算方法を記述し たモデル定義、およびその他のメタデータなど。 ○ Inference Environment: 推論を実施する環境 ○ モデルの説明 ○ モデルのバージョン ○ 問題のタイプ: Classification, Regressionなど ○ アルゴリズムタイプ: Linear Regression, Random Forestなど ○ モデルの作者 ○ モデルのオーナー ● 想定される用途 ○ 想定される用途 ○ モデルの有効性に影響を与える要因 ○ リスク度合いとその説明
  • 17. Amazon SageMaker Model Cards ● 使用目的、リスク評価、トレーニングの詳細など、重要なモデル情報を管理 ● 主な機能 ○ モデル情報の取得 ■ 入力データセット、トレーニング環境、トレーニング結果などのトレーニングの詳細を 自動入力 ■ モデルの目的やパフォーマンスの目標などの詳細も追加可能 ○ 評価結果の可視化 ■ バイアスや品質指標などのモデル評価結果をモデルカードに添付 ■ グラフなどの視覚化を追加し、モデルのパフォーマンスに関する重要なインサイトを得 ることができます ○ モデルカードの共有 ■ モデルカードを PDF 形式にエクスポートして、ビジネス関係者、社内チームや顧客と 簡単に共有できます。
  • 18. トレーニング詳細 ● 目的関数とそのノート ● トレーニングの観察結果 ● トレーニングジョブ詳細 ○ Job名 ○ ARN ○ Input ○ トレーニング環境 ● トレーニングの結果
  • 19. その他情報 ● 追加の評価結果 ● 倫理的な考慮事項 ● 注意点・推奨事項 ● カスタムフィールド
  • 20. PDF Export ● Model CardをPDF ExportしてS3に保存す ることが可能 ● S3に保存されたPDFをダウンロードする 必要があるため、少々使い勝手は悪い
  • 22. Amazon SageMaker Model Dashboard ● モデルの動作の追跡 ○ リソースとモデルの動作違反を1か所で追跡 ○ データ品質、モデル品質、Bias Drift、Feature Attribution Driftの 4つの次元で監視 ○ Amazon SageMaker Model MonitorとAmazon SageMaker Clarifyとの統合を通じて動作を監視 ● アラートの自動化 ○ モデル動作の逸脱などに対するアラートを設定 ● モデル偏差のトラブルシューティング ○ モデルのパフォーマンスに影響を与える要因を時系列で分析
  • 23. サンプルダッシュボード ● モデルに関する情報が一つの画面に集約 ● 各種ステータスがひと目で分かるようになっている 出典: https://aws.amazon.com/jp/blogs/aws/new-ml-governance-tools-for-amazon-sagemaker-simplify-access-control-and-enhance-transparency-over-your-ml-projects/
  • 24. デモ ● Amazon SageMaker Role Managerを使ったRoleの作成 ● Amazon Sage Maker Cardsの作成

Editor's Notes

  • #3: こちらが私のプロフィールとなります。 機械学習には、大学時代の研究から携わっており、自分で立ち上げたスタートアップでも機械学習を使ったサービスを提供していました。 プロダクト開発チームやデータサイエンスチームの立ち上げなどもやっています。
  • #5: ML Governanceがなぜ必要となってきたのかについて説明します。 機械学習プロジェクトは、データサイエンティストやMLエンジニア、インフラエンジニアなど様々な職種の人が関わってきます。 その際にデータの閲覧権限やデータパイプラインやエンドポイントの管理権限など、誰にどの権限を付与するかを考える必要があります。 それぞれの権限に合わせてIAMを作成したりと、権限の設定が複雑化してきています。 次に、学習済みのモデルがどのように生成されたかなどの情報を適切に管理しておく必要があります。 機械学習プロジェクトあるあるとして、どんな環境で、どのバージョンのスクリプト・いつのデータを使ったのかがわからなくなってしまい、モデルがどのように生成されたかわからなくなってしまうことがあります。 モデルの生成プロセスや、モデルで推論するための情報が文書化されていないと、適切な環境での予測が実施できなくなってしまいます。 最後に、モデル自体が適切に動いているかどうかを監視する必要性があります。 適切に管理されたモデルであっても、時間経過とともに性能が劣化することがあります。 性能の劣化は、モデルが期待通り動いているかどうかを監視し続けて、予期せぬ挙動となった場合に知らせてくれる必要があります。