Upgrade to Pro — share decks privately, control downloads, hide ads and more …

NLPでESG評価をはじめるための、15分間イントロダクション

 NLPでESG評価をはじめるための、15分間イントロダクション

金融業界でESG評価は欠かせないプロセスとなっています。一方で企業のESG評価は労働集約的な作業で行われていることが多く、評価の公平性も問題となっています。自然言語処理を用いることで、ある程度機械的かつ自動的に評価業務を支援することでより公正・効率的なESG評価に貢献できます。

Takahiro Kubo

March 26, 2022
Tweet

More Decks by Takahiro Kubo

Other Decks in Technology

Transcript

  1. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. NLPでESG評価をはじめるための 15分間イントロダクション
  2. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. このセッションでお伝えしたいこと1つ 企業のテキスト情報を自然言語処理で分析する研究をはじめるのに、 AWS SageMaker Studio Labが役立ちます。
  3. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. Cybozu Days 2016 Takahiro Kubo / 久保 隆宏 DevRel Engineer, Machine Learning Career 1. SAPコンサルタント(10年) + kintone エヴァンジェリスト 業務要件定義から開発、運用保守まで一貫した導入支援を実施。 SaaS連携による効率的な業務アプリケーションの開発を模索 している時にkintoneと出会い、エヴァンジェリストとして活動。 2. 機械学習エンジニア (5年) 自然言語処理の研究に従事。対話アプリケーションのプロトタイプ作成、 自然言語処理による企業の非財務情報評価に取り組む。研究部署在籍中、 「Pythonで学ぶ強化学習」「直感 Deep Learning」などを執筆。arXivTimes やNLP若手の会といったコミュニティ活動にも参加。 3. プロダクトマネージャー(2年) プロダクトマネージャーとして非財務情報参照・点検サービスの開発に携わる。 研究開発をプロダクト化する険しい道を泥まみれで進む経験をする。 非財務開示に携わる方、評価する方双方が使えるサービスです! 4. Developer Relation (0年~) + お父さん0年生 機械学習を活用したプロダクトの開発を学び普及させるためにAWSへ。 Product Manager for Software 2.0 を目指す。
  4. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. Takahiro Kubo / 久保 隆宏 DevRel Engineer, Machine Learning 企業評価、ESG開示に関する記事を書いたりしています。 有価証券報告書のデータセットを公開しています。
  5. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. ESGの評価とは ガバナンス Governance 環境 Environmental ▪ 炭素排出量 ▪ 水の使用 ▪ 廃棄物管理方針 ▪ ボードの構造 ▪ 役員報酬 ▪ 税務戦略 社会 Society ▪ 労働力の多様性 ▪ 同一賃金の方針 ▪ 健康と安全の方針 自然環境の保全および保護 従業員、サプライヤー、クライアント コミュニティとの関係 会社のリーダーシップ、リスク管理 および株主の権利に関する基準
  6. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 40% 専門的に管理されている世界の金融資産110兆USDのうち40%がESGを考慮 — Financial Times: Wall Street’s New Mantra: Green is Good 資産運用業界ではESG評価の重要性が増しています 5億5000万USD ESGデータに最も多額の投資をしている資産運用会社は、2021年に ESG データに 5 億5000万USDを投資すると推定されている — Opimas: ESG Data Market: No Stopping Its Rise Now 2,880億USD 2020年1月から11月までに、投資信託とETFの投資家は、持続可能な資産に 世界全体で2,880億USDを投資。これは2019年に比べて96%の増加 — BlackRock: Larry Fink の 2021 年 CEO へのレター 81% 2020年、世界を代表する持続可能インデックスの 81%が、親インデックスの ベンチマークを上回る — BlackRock: Larry Fink の 2021 年 CEO へのレター
  7. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 資産運用会社ではESG評価の実施が当然となりつつあります Schrodersは、すべての投資の 財務分析にESG要因を完全に 統合。 2021 年 1 月 UBSは現在、グローバルのプラ イベートクライアントに対して 従来のソリューションよりも持 続可能なソリューションを推奨。 2020 年 9 月 JP Morgan Asset Managementは、すべての投資 でグローバルなESG統合ポリ シーを展開する予定。 2020 年 7 月 Amundiは、マネージドファン ドにベンチマークインデックス よりも高いESGスコアを持たせ ることを求める予定。 2018 年 10 月 BlackRockは、リスク管理、 ポートフォリオ構築に持続可 能性を考慮することを確約。 2020 年 1 月 Credit Suisseは、すべての投 資にわたる持続可能性を統合す るためのサステナビリティ ・ ファンクションをローンチ。 2020 年 7 月
  8. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 現在の業界によるESG評価のアプローチには限界があります スコアリングモデルは独自のものである ため透明性が欠如しており、スコアの推 進要因を特定するのが困難 多くの場合、更新頻度が低く、スコ アは毎年の企業による開示によって 提供されるため、リアルタイムの ニュースフローは考慮されていない サードパーティのESG スコア カスタムESGスコアリングモデル プロバイダー間の相関関係がないため、 資産運用会社は多くの場合、複数のベ ンダーからスコアをソーシングする必 要がある 何百もの異なるデータポイントを業界の フレームワークにマッピングするには、複 雑でカスタマイズされたデータインフラス トラクチャが必要 顧客の義務や、変化する顧客や規制当 局の報告ニーズを満たすために、柔軟 性と強力なデータ系統を持つシステムを 要求。 データの調達、クリーニング、処理、統 合、分析をサポートする、データサイエ ンス専門家の大規模なチームが必要
  9. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 金融庁でもESG評価・データ提供機関に対し、期待される行動規 範の議論を始めています。 https://www.fsa.go.jp/news/r3/singi/20220203-2.html
  10. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. ESG評価に不可欠な非定型・非金融のデータの扱いが困難です。 ESGデータを報告するための単一 の基準がないため、多様で不完全 で相関がないデータセットが生成 される 資産運用会社と機関投資家の66%がESG評価の障壁はデータであると報告1 ESGデータのソーシング、クリーニング、処理、統合、分析には多大な手作業が必要。 ESGレポートの頻度が低く 高品質でタイムリーなデータに アクセスするのが困難 ESGスコアリングモデルは ESG要因に 異なる加重評価を使用するため ESG データから投資に関するインサイ トを明らかにするのが難しい 1.BNP Paribas (2019): ESG グローバル調査
  11. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. AWSは非定型・非金融のデータを扱うテクノロジーを提供できます データの 調達と購入 データのクリーン アップ、処理、統合 データ分析と 機械学習の適用 独自のESGスコアリ ングモデルを構築 クラス最高のデータの調達や アクセスを簡素化 高品質データの基盤を 速やかに確立 幅広い種類の分析ツールの セットを適用して、スコア推進 要因を特定し、クライアントの 義務を満たす 高度なMLモデルを使用して、 アルファを特定し、差別化さ れたESG提案を構築 AWS Data Exchange Registry of Open Data on AWS Amazon S3 AWS Lake Formation Amazon SageMaker/ Amazon SageMaker Studio Lab Amazon Redshift Amazon Comprehend Amazon Athena AWS Glue データの分析と予測 データの収集と管理 Amazon Textract 課題を解決するためのAWSのサービス 無料の データ セット有
  12. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 本日はIRテキストからESG評価を行う業務を、自然言語処理に より効率化する方法をデモします。 画像処理 自然言語処理 音声処理 動画処理 時系列データ処理 予測精度向上 業務効率化 顧客サポート IRテキスト 記者会見動画 News 企業財務情報 株式注文情報 金融統計 速報値 気象情報 衛星写真 船舶航行情報 特許情報 POS売上データ 企業統計 交通量 カード利用情報 非定型 定型 金融 非金融 Data Process Benefit 色付きの範囲が、いわゆる 「オルタナティブデータ」 Amazon SageMaker Studio Lab
  13. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. Amazon SageMaker Studio Labは、メールアドレスだけでデー タサイエンスの学習をはじめられます。無料で利用が可能です。
  14. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. • JupyterLab を基盤とした環境。 • セットアップ不要。 • ユーザーセッションごと12時間のCPUか4時間の GPUを選択可能。セッション数は無制限。 • 15GBのストレージ。 • GitHubと連携可能。 • Jupyter Notebook以外にターミナルも利用可能。 機械学習・自然言語処理のモデルを学習し、実行するのに十分な GPUとストレージが利用可能です。
  15. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 大規模なデータ処理や本格的な学習を行う場合、シームレスに SageMakerへ移行が可能です。 Learning Experimenting Building Deploying Scaling Prototyping SageMaker Studio Lab SageMaker 大規模なデータ作成や前処理 Enterpriseレベルのセキュリティ 長時間の学習/分散学習 MLOps/CI/CD モデルの監視/本番稼働
  16. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. デモ: 企業の統合報告書から気候変動に関する取り組みを評価 する業務を支援するため、自然言語処理モデルを用います。 統合報告書 (PDF) 自然言語処理 (単語ベース/ ベクトルベース) 気候変動に関する記述 https://github.com/icoxfog417/esg-evaluation-by-nlp Preprocess Retrieve Prepare
  17. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 終わりに 本セッションを通じて、ESG評価と自然言語処理に興味を持っ ていただけたら嬉しいです。 AWS SageMaker Studio Labのアカウント登録はこちらからです。 https://studiolab.sagemaker.aws/
  18. © 2021, Amazon Web Services, Inc. or its Affiliates. All

    rights reserved. 参考資料 1. 東海林 正賢.リレーコラム データサイエンスの新地平~オルタナティブデータ活用最前線~ 第1回 オルタナティブ データの基礎知識. 2021. 2. 徳山 相賢, 神田 裕樹. 金融市場における機械学習の活用について. 2021.