Copyright © TIS Inc. All rights reserved.
ESG評価を支える自然言語処理基盤の構築
戦略技術センター
久保隆宏
Copyright © TIS Inc. All rights reserved. 2
Agenda
 ESG投資とは
 ESG評価の課題
 自然言語処理による支援
 課題
Copyright © TIS Inc. All rights reserved. 3
久保隆宏
TIS株式会社 戦略技術センター
 化学系メーカーの業務コンサルタント出身
 既存の技術では業務改善を行える範囲に限界があるとの実感から、戦
略技術センターへと異動
 現在は会計/投資の現場で使える要約の実現を目指し、主にESG投資へ
の活用をテーマに研究中。
自己紹介
チュートリアル講演:深層学習
の判断根拠を理解するための研
究とその意義(@PRMU 2017)
機械学習をシステムに組み込む
際の依存性管理について
(@MANABIYA 2018)
あるべきESG投資の評価に向け
た、自然言語処理の活用
(@CCSE 2019)
Copyright © TIS Inc. All rights reserved. 4
ESG投資とは (1/4)
 E: Environment
 S: Social
 G: Governance
年金積立金管理運用独立行政法人: ESG投資より
売上や利益だけでなく、ESG(=環境/社会/ガバナンス)に関する取り組み
を評価する投資。
Copyright © TIS Inc. All rights reserved. 5
ESG投資とは (2/4)
80兆ドルを超える資産がESGを加味して運用されている(2019年)。
日本の国家予算の約84年分
About the PRI
日本の年金(厚生年金/国民年金)の運用を担うGPIF(年金積立金管理運用独
立行政法人)でもESGを考慮している (参考)。
あなたの年金も、(部分的には)ESG投資で運用されている
ESGを考慮します
という運用機関
ESGが考慮され
た資産運用残高
Copyright © TIS Inc. All rights reserved. 6
ESG投資とは (3/4)
「ESGを考慮する」とは具体的に?
Copyright © TIS Inc. All rights reserved. 7
ESG投資とは (4/4)
 7つの手法がある。
手法名 概要
ネガティブ・スクリーニング ESG評価が低い企業を除外する
ポジティブ・スクリーニング ESG評価が高い企業を組み入れたり、比率を上げる
規範に基づくスクリーニング 国際的な規範に反する企業を除外する
インテグレーション 通常の投資基準(経営方針、財務etc)に+ESGを考慮する
エンゲージメント 投資先との対話/議決権行使でESG活動を促す
テーマ投資 ESGの特定テーマ(気候変動etc)に投資する
インパクト投資 ESに貢献する技術/サービス開発企業へ投資する
手法としてはスクリーニング、イ
ンテグレーションが多い。
いずれにしてもなんらかの「ESG評価」をベースとしている。
Copyright © TIS Inc. All rights reserved. 8
ESG評価の課題 (1/4)
 様々な評価機関がスコアを算出し、公開している。
 MSCI ESG Ratings
 FTSE Russells ESG ratings
 Thomson Reuters Asset4
 これらのスコアをベースにESG投資が行われている。
 (各投資会社が、独自に企業のESGを評価する体力はない。)
 投資パフォーマンスとの関係も、スコアを基に検証されているが・・・
Copyright © TIS Inc. All rights reserved. 9
ESG評価の課題 (2/4)
 各評価機関のスコアに、相関がない(上図はFTSE/MSCIのスコア相関)。
 もちろん評価機関ごとに評価基準は異なる。
 しかし、評価の属人性も見過ごせない要因となっている。
ESG 開示スコアとパフォーマンス
Copyright © TIS Inc. All rights reserved. 10
ESG評価の課題 (3/4)
ESGの取り組みについて書かれた文書(統合報告書)の例(弊社)
数十~百ページ近くあるところもある(×会社数)
これを人が読んで評価(ダブルチェックを行う場合もある)
Copyright © TIS Inc. All rights reserved. 11
ESG評価の課題 (4/4)
 マンパワーのみでESG評価をこなすには限界がある。
 各評価会社には大きな負荷がかかっている。
 企業側も評価のチェックが負担になっている。
 評価漏れなどが多く含まれるため。
 評価のばらつきは、ESG投資自体の存続意義にも関わる。
 機械化により、低コストで一定レベルの評価をできないか?
文書評価のサポート
=自然言語処理の出番!
Copyright © TIS Inc. All rights reserved. 12
自然言語処理による支援
自然言語処理による支援として、以下3点を実施する。
 文書データの収集
 評価対象となる文・段落の絞り込み
 自動評価
支援アプローチの全体像
CSR/統合報告書
有価証券報告書等
文書データの
収集
文書データの
整形・整理
テキスト・データ項目の抽出
PDFのテキスト化等
自然言語処理
モデル
文書データと、フィー
ドバックから学習
+ルール
評価担当者からの
フィードバック
Copyright © TIS Inc. All rights reserved. 13
自然言語処理による支援: 文書データの収集 (1/3)
文書リスト取得
文書取得
XBRL/PDF
メタデータ
年次報告書(有価証券報告書)
の抽出
一覧の取得
文書取得
CSRポータル
サイト
Lambdaで一覧を取得、
各文書はSQSを使い並列で取得、
が基本の流れ(StepFunctionでJOB化)。
Copyright © TIS Inc. All rights reserved. 14
自然言語処理による支援: 文書データの収集 (2/3)
決算書情報・CSR報告書・統合報告書
のメタデータと、決算書数値・株価の
情報をすべて合わせてビュー化。一覧
で見られるように加工。
S3のテーブル化にはGlue Crawler、
ビュー作成にはAthenaを使用。
年次報告書 年次報告書
ビュー
CSR報告書 CSR報告書
ビュー
統合ビュー
決算数値データ
株価データ 年集計株価データ
作成したデータ5年分を、
近日無償公開予定です!
Copyright © TIS Inc. All rights reserved. 15
自然言語処理による支援: 文書データの収集 (3/3)
AWSによるデータ収集基盤構築のあれこれ
 StepFunction or Glue
 データを集める場合はSQSからのLambdaが便利。
 データを見る場合はAthenaが便利。
 S3のファイルを直で見られるが、パーティションでデータを区切りたい
場合、データ型を付与したい場合、Glueのデータカタログが必要。
 Lambdaを呼び出せるStepFunctionか公式ETLのGlueか?
 基本はStepFunctionで構築してGlue Crawlerを呼ぶ方式を採用。
 Crawlerを起動するジョブをStepFunctionから起動する。
 Lambda or ECS
 処理の軽重、使用ライブラリの重さで切り分け。
 稼働監視
 AthenaとCloudWatchを統合できないのが不便(ダブルで見る)。
Copyright © TIS Inc. All rights reserved. 16
自然言語処理による支援:評価対象となる文・段落の絞り込み
プロトタイプを作成し、評価会社様と共同で検証予定。
対象セクターなどを絞り込み中。
Copyright © TIS Inc. All rights reserved. 17
課題 (1/2)
 CSR報告書・統合報告書の収集。
 ESG評価におけるメインの情報源。
 各社各様の場所・仕様で公開しており集めにくい・解析しにくい。
綺麗なレポートよりも解析しやすいレポートを書きましょう!
(ESG評価はレポートの見た目では変わりません!)。
評価担当者はあなたの会社だけ見てるわけではないのです。
Copyright © TIS Inc. All rights reserved. 18
課題 (2/2)
自然言語処理登場までの道のりは長い。
 データ収集
 営業
 プロトタイプ開発
 評価実験(まずルール)
 自然言語処理!!
その辺に転がっているデータで価値が出ることはほぼない。
専門知識なしにアノテーションできることで価値が出ることもあまりない。
自社内にデータがなければ、端正にデータを集めることがスタート地点?
THANK YOU

More Related Content

PDF
財務・非財務一体型の企業分析に向けて
PDF
企業におけるデータ分析プロジェクトと求められるスキル
PDF
Time intelligence - その概念と機能について
PDF
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
PDF
SSII2022 [OS3-02] Federated Learningの基礎と応用
PDF
ナレッジグラフとオントロジー
PDF
ブレインパッドにおける機械学習プロジェクトの進め方
PDF
自然言語処理で読み解く金融文書
財務・非財務一体型の企業分析に向けて
企業におけるデータ分析プロジェクトと求められるスキル
Time intelligence - その概念と機能について
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
SSII2022 [OS3-02] Federated Learningの基礎と応用
ナレッジグラフとオントロジー
ブレインパッドにおける機械学習プロジェクトの進め方
自然言語処理で読み解く金融文書

What's hot (20)

PDF
研究発表を準備する(2022年版)
PPTX
フックを使ったPostgreSQLの拡張機能を作ってみよう!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)
PPTX
ITコミュニティと情報発信に共通する成長と貢献の要素
PDF
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
PDF
PowerAppsの導入効果と運用化を阻む壁
PDF
ChatGPTは思ったほど賢くない
PDF
屋内測位技術の応用事例とPDRベンチマーク標準化委員会の活動概要
PDF
協働ロボットCOROの開発における形式的仕様記述KMLの開発と適用
PDF
UXデザイン概論 2019
PPTX
「機械学習:技術的負債の高利子クレジットカード」のまとめ
PPTX
xrmtg20210317
PDF
研究発表のためのプレゼンテーション技術
PDF
Tableau Map Hands-on Guide
PDF
ドメイン駆動設計のための Spring の上手な使い方
PDF
リクルートライフスタイル流!分析基盤との賢い付き合い方
PPTX
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
PDF
Marp Tutorial
PDF
Linked Dataとオントロジーによるセマンティック技術の実際
PDF
データサイエンティストの仕事とデータ分析コンテスト
PDF
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
研究発表を準備する(2022年版)
フックを使ったPostgreSQLの拡張機能を作ってみよう!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)
ITコミュニティと情報発信に共通する成長と貢献の要素
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
PowerAppsの導入効果と運用化を阻む壁
ChatGPTは思ったほど賢くない
屋内測位技術の応用事例とPDRベンチマーク標準化委員会の活動概要
協働ロボットCOROの開発における形式的仕様記述KMLの開発と適用
UXデザイン概論 2019
「機械学習:技術的負債の高利子クレジットカード」のまとめ
xrmtg20210317
研究発表のためのプレゼンテーション技術
Tableau Map Hands-on Guide
ドメイン駆動設計のための Spring の上手な使い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
ネットストーカー御用達OSINTツールBlackBirdを触ってみた.pptx
Marp Tutorial
Linked Dataとオントロジーによるセマンティック技術の実際
データサイエンティストの仕事とデータ分析コンテスト
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
Ad

Similar to ESG評価を支える自然言語処理基盤の構築 (20)

PDF
モデルではなく、データセットを蒸留する
PDF
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
PPT
オープンソースカンファレンスBi勉強会20141018
PPTX
中小企業におけるSDGsの活用方法~国内外の動向と活用に向けたステップ・活用事例紹介~
PDF
Machine learning 15min TensorFlow hub
PDF
EMNLP2018 Overview
PDF
あるべきESG投資の評価に向けた、自然言語処理の活用
PDF
TIS 戦略技術センター AI技術推進室紹介
PDF
【チの共有】スタートアップの知財戦略, #スタートアップ, #知財戦略, #拡張知財
PDF
PMI日本フォーラム2019 講演資料 iti奥田智洋
PDF
【産業技術総合研究所】平成19年環境報告書2007
PPT
110518_本気で考える! I T人財育成研究部会 討議資料
PDF
事例から見る人工知能の現在と、企業における活用方法
PDF
Machine learningbootstrap For Business
PPTX
【株式会社グローバル・パートナーズ・テクノロジー】26卒_新卒採用説明会_資料(要約版)
PDF
デブサミ2013【14-B-1】 3つの世界:エンタープライズ、ソーシャル/ゲーム、スタートアップ(三谷慶一郎氏)
PDF
[G-Tech2015]攻めのIT経営銘柄に選ばれたアサヒグループホールディングス様の基幹刷新への取り組み ~MCFrameによる基幹システム刷新事例 F...
PPTX
「人工知能」との正しい付き合い方
PDF
Open Innovation -Driving the next wave of growth-
モデルではなく、データセットを蒸留する
言葉のもつ広がりを、モデルの学習に活かそう -one-hot to distribution in language modeling-
オープンソースカンファレンスBi勉強会20141018
中小企業におけるSDGsの活用方法~国内外の動向と活用に向けたステップ・活用事例紹介~
Machine learning 15min TensorFlow hub
EMNLP2018 Overview
あるべきESG投資の評価に向けた、自然言語処理の活用
TIS 戦略技術センター AI技術推進室紹介
【チの共有】スタートアップの知財戦略, #スタートアップ, #知財戦略, #拡張知財
PMI日本フォーラム2019 講演資料 iti奥田智洋
【産業技術総合研究所】平成19年環境報告書2007
110518_本気で考える! I T人財育成研究部会 討議資料
事例から見る人工知能の現在と、企業における活用方法
Machine learningbootstrap For Business
【株式会社グローバル・パートナーズ・テクノロジー】26卒_新卒採用説明会_資料(要約版)
デブサミ2013【14-B-1】 3つの世界:エンタープライズ、ソーシャル/ゲーム、スタートアップ(三谷慶一郎氏)
[G-Tech2015]攻めのIT経営銘柄に選ばれたアサヒグループホールディングス様の基幹刷新への取り組み ~MCFrameによる基幹システム刷新事例 F...
「人工知能」との正しい付き合い方
Open Innovation -Driving the next wave of growth-
Ad

More from Takahiro Kubo (20)

PDF
自然言語処理による企業の気候変動対策分析
PDF
国際会計基準(IFRS)適用企業の財務評価方法
PDF
自然言語処理で新型コロナウィルスに立ち向かう
PDF
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
PDF
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
PDF
Reinforcement Learning Inside Business
PDF
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
PDF
Curiosity may drives your output routine.
PPTX
2018年12月4日までに『呪術廻戦』を読む理由
PDF
Graph Attention Network
PDF
ACL2018の歩き方
PDF
機械学習で泣かないためのコード設計 2018
PDF
TISにおける、研究開発の方針とメソッド 2018
PDF
感情の出どころを探る、一歩進んだ感情解析
PDF
機械学習の力を引き出すための依存性管理
PDF
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
PDF
技術文書を書く際の、心技体<改訂版>
PDF
kintone evangelist meetup 2017
PDF
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
PPTX
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~
自然言語処理による企業の気候変動対策分析
国際会計基準(IFRS)適用企業の財務評価方法
自然言語処理で新型コロナウィルスに立ち向かう
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
Reinforcement Learning Inside Business
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
Curiosity may drives your output routine.
2018年12月4日までに『呪術廻戦』を読む理由
Graph Attention Network
ACL2018の歩き方
機械学習で泣かないためのコード設計 2018
TISにおける、研究開発の方針とメソッド 2018
感情の出どころを探る、一歩進んだ感情解析
機械学習の力を引き出すための依存性管理
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
技術文書を書く際の、心技体<改訂版>
kintone evangelist meetup 2017
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
機械学習を活用するための、3本の柱~教育型の機械学習ツールの必要性~

ESG評価を支える自然言語処理基盤の構築

  • 1. Copyright © TIS Inc. All rights reserved. ESG評価を支える自然言語処理基盤の構築 戦略技術センター 久保隆宏
  • 2. Copyright © TIS Inc. All rights reserved. 2 Agenda  ESG投資とは  ESG評価の課題  自然言語処理による支援  課題
  • 3. Copyright © TIS Inc. All rights reserved. 3 久保隆宏 TIS株式会社 戦略技術センター  化学系メーカーの業務コンサルタント出身  既存の技術では業務改善を行える範囲に限界があるとの実感から、戦 略技術センターへと異動  現在は会計/投資の現場で使える要約の実現を目指し、主にESG投資へ の活用をテーマに研究中。 自己紹介 チュートリアル講演:深層学習 の判断根拠を理解するための研 究とその意義(@PRMU 2017) 機械学習をシステムに組み込む 際の依存性管理について (@MANABIYA 2018) あるべきESG投資の評価に向け た、自然言語処理の活用 (@CCSE 2019)
  • 4. Copyright © TIS Inc. All rights reserved. 4 ESG投資とは (1/4)  E: Environment  S: Social  G: Governance 年金積立金管理運用独立行政法人: ESG投資より 売上や利益だけでなく、ESG(=環境/社会/ガバナンス)に関する取り組み を評価する投資。
  • 5. Copyright © TIS Inc. All rights reserved. 5 ESG投資とは (2/4) 80兆ドルを超える資産がESGを加味して運用されている(2019年)。 日本の国家予算の約84年分 About the PRI 日本の年金(厚生年金/国民年金)の運用を担うGPIF(年金積立金管理運用独 立行政法人)でもESGを考慮している (参考)。 あなたの年金も、(部分的には)ESG投資で運用されている ESGを考慮します という運用機関 ESGが考慮され た資産運用残高
  • 6. Copyright © TIS Inc. All rights reserved. 6 ESG投資とは (3/4) 「ESGを考慮する」とは具体的に?
  • 7. Copyright © TIS Inc. All rights reserved. 7 ESG投資とは (4/4)  7つの手法がある。 手法名 概要 ネガティブ・スクリーニング ESG評価が低い企業を除外する ポジティブ・スクリーニング ESG評価が高い企業を組み入れたり、比率を上げる 規範に基づくスクリーニング 国際的な規範に反する企業を除外する インテグレーション 通常の投資基準(経営方針、財務etc)に+ESGを考慮する エンゲージメント 投資先との対話/議決権行使でESG活動を促す テーマ投資 ESGの特定テーマ(気候変動etc)に投資する インパクト投資 ESに貢献する技術/サービス開発企業へ投資する 手法としてはスクリーニング、イ ンテグレーションが多い。 いずれにしてもなんらかの「ESG評価」をベースとしている。
  • 8. Copyright © TIS Inc. All rights reserved. 8 ESG評価の課題 (1/4)  様々な評価機関がスコアを算出し、公開している。  MSCI ESG Ratings  FTSE Russells ESG ratings  Thomson Reuters Asset4  これらのスコアをベースにESG投資が行われている。  (各投資会社が、独自に企業のESGを評価する体力はない。)  投資パフォーマンスとの関係も、スコアを基に検証されているが・・・
  • 9. Copyright © TIS Inc. All rights reserved. 9 ESG評価の課題 (2/4)  各評価機関のスコアに、相関がない(上図はFTSE/MSCIのスコア相関)。  もちろん評価機関ごとに評価基準は異なる。  しかし、評価の属人性も見過ごせない要因となっている。 ESG 開示スコアとパフォーマンス
  • 10. Copyright © TIS Inc. All rights reserved. 10 ESG評価の課題 (3/4) ESGの取り組みについて書かれた文書(統合報告書)の例(弊社) 数十~百ページ近くあるところもある(×会社数) これを人が読んで評価(ダブルチェックを行う場合もある)
  • 11. Copyright © TIS Inc. All rights reserved. 11 ESG評価の課題 (4/4)  マンパワーのみでESG評価をこなすには限界がある。  各評価会社には大きな負荷がかかっている。  企業側も評価のチェックが負担になっている。  評価漏れなどが多く含まれるため。  評価のばらつきは、ESG投資自体の存続意義にも関わる。  機械化により、低コストで一定レベルの評価をできないか? 文書評価のサポート =自然言語処理の出番!
  • 12. Copyright © TIS Inc. All rights reserved. 12 自然言語処理による支援 自然言語処理による支援として、以下3点を実施する。  文書データの収集  評価対象となる文・段落の絞り込み  自動評価 支援アプローチの全体像 CSR/統合報告書 有価証券報告書等 文書データの 収集 文書データの 整形・整理 テキスト・データ項目の抽出 PDFのテキスト化等 自然言語処理 モデル 文書データと、フィー ドバックから学習 +ルール 評価担当者からの フィードバック
  • 13. Copyright © TIS Inc. All rights reserved. 13 自然言語処理による支援: 文書データの収集 (1/3) 文書リスト取得 文書取得 XBRL/PDF メタデータ 年次報告書(有価証券報告書) の抽出 一覧の取得 文書取得 CSRポータル サイト Lambdaで一覧を取得、 各文書はSQSを使い並列で取得、 が基本の流れ(StepFunctionでJOB化)。
  • 14. Copyright © TIS Inc. All rights reserved. 14 自然言語処理による支援: 文書データの収集 (2/3) 決算書情報・CSR報告書・統合報告書 のメタデータと、決算書数値・株価の 情報をすべて合わせてビュー化。一覧 で見られるように加工。 S3のテーブル化にはGlue Crawler、 ビュー作成にはAthenaを使用。 年次報告書 年次報告書 ビュー CSR報告書 CSR報告書 ビュー 統合ビュー 決算数値データ 株価データ 年集計株価データ 作成したデータ5年分を、 近日無償公開予定です!
  • 15. Copyright © TIS Inc. All rights reserved. 15 自然言語処理による支援: 文書データの収集 (3/3) AWSによるデータ収集基盤構築のあれこれ  StepFunction or Glue  データを集める場合はSQSからのLambdaが便利。  データを見る場合はAthenaが便利。  S3のファイルを直で見られるが、パーティションでデータを区切りたい 場合、データ型を付与したい場合、Glueのデータカタログが必要。  Lambdaを呼び出せるStepFunctionか公式ETLのGlueか?  基本はStepFunctionで構築してGlue Crawlerを呼ぶ方式を採用。  Crawlerを起動するジョブをStepFunctionから起動する。  Lambda or ECS  処理の軽重、使用ライブラリの重さで切り分け。  稼働監視  AthenaとCloudWatchを統合できないのが不便(ダブルで見る)。
  • 16. Copyright © TIS Inc. All rights reserved. 16 自然言語処理による支援:評価対象となる文・段落の絞り込み プロトタイプを作成し、評価会社様と共同で検証予定。 対象セクターなどを絞り込み中。
  • 17. Copyright © TIS Inc. All rights reserved. 17 課題 (1/2)  CSR報告書・統合報告書の収集。  ESG評価におけるメインの情報源。  各社各様の場所・仕様で公開しており集めにくい・解析しにくい。 綺麗なレポートよりも解析しやすいレポートを書きましょう! (ESG評価はレポートの見た目では変わりません!)。 評価担当者はあなたの会社だけ見てるわけではないのです。
  • 18. Copyright © TIS Inc. All rights reserved. 18 課題 (2/2) 自然言語処理登場までの道のりは長い。  データ収集  営業  プロトタイプ開発  評価実験(まずルール)  自然言語処理!! その辺に転がっているデータで価値が出ることはほぼない。 専門知識なしにアノテーションできることで価値が出ることもあまりない。 自社内にデータがなければ、端正にデータを集めることがスタート地点?