Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

AI/データサイエンス勉強会

sre_holdings
March 28, 2022

 AI/データサイエンス勉強会

2022年3月28日に実施された、SRE Holdings 社外向け勉強会の 資料です。

内容:
様々な領域で活用が進むデータサイエンスやAIについて、最近の状況を踏まえた概要をご紹介します。またこれら新しい領域のプロジェクトの成功率は十数%と言われる中で、より成功につながるプロセスやアプローチを二百件以上のプロジェクトや実装の経験からお話しします。

講師:泉晃 / Izumi, Akira
日本IBM、リクルート、デロイトトーマツ、BCGを経て、SREホールディングスに常務執行役員CDOとして参加。AI・DXを専門とし、医療・製薬・製造・通信・官公庁などの各産業で250件以上のデータ活用・プラットフォーム構築や組織立ち上げを主導した。データサイエンス人材育成(経産省・京都大学・琉球大学等)やデータエコシステム/コンソーシアムの形成等により、社会におけるデータ活用の価値向上に取り組んでいる。

sre_holdings

March 28, 2022
Tweet

More Decks by sre_holdings

Other Decks in Business

Transcript

  1. 3 ⾃⼰紹介 泉 晃(Akira IZUMI) SREホールディングス株式会社 常務執⾏役員CDO アナリティクス&コンサルティング事業本部⻑ DX推進事業部⾨⻑ 琉球⼤学医学部先端医学研究センター

    特命准教授 学歴︓ 2002年 早稲⽥⼤学教育学部英語英⽂科 卒業 2016年 東京⼤学医学部付属病院 企画情報運営部 登録研究員 2018年 筑波⼤学⼤学院ビジネス科学研究(MBA) 卒業 2021年 京都⼤学⼤学院医学研究科 ⼈間健康科学専攻 総合医療科学コース 博⼠後期過程 主な経験: デジタル・AI領域の先端技術の開発・産業応⽤とコンサルティングが専⾨ 医療・製薬を中⼼に、製造・通信・⾦融・防衛などの各産業において、データサイエンス/AIを活⽤した先進的 な案件を数多く主導し、複数のデータプラットフォームやCoE組織やコンソーシアムを⽴ち上げた。 略歴: 2022年1⽉〜 SREホールディングス株式会社︓ 常務執⾏役員CDO 兼 アナリティクス&コンサルティング事業本部⻑ 兼 DX推進部⾨⻑ 不動産・ヘルスケア・各産業においてAI/DXとデジタルソリューションの構築・展開の推進 2021年6⽉〜現在 琉球⼤学 医学部先端医学研究センター ︓特命准教授 RWD・ゲノム情報活⽤による産学連携の推進、オープインイノベーションプラットフォームの構築 2022年1⽉〜 株式会社Tenne ︓取締役CDO ゲノムを中⼼とした3000万⼈のRWDのBC Platformの推進、ヘルスケアデータプラットフォームの構築 2019年7⽉〜2021年12⽉ 株式会社ボストン コンサルティング グループ ︓アソシエイトディレクター AI、データサイエンス、デジタルを活⽤した企業のトランスフォーメーションを⽀援。製薬におけるDXや、医療データの業界の標準 ルール形成。地域・⼤学・病院・⺠間企業を巻き込んだ、沖縄、関⻄等のRWDイニシアチブを主導 2018年11⽉〜2021年3⽉ 京都⼤学⼤学院医学研究科⼈間健康科学系専攻 ︓特命准教授 医療領域における社会を変⾰できるデータ活⽤⼈材の育成を⽬指した、DS講座を企画・⽴ち上げ、および実際の講義を担当 2014年12⽉〜2019年6⽉ 有限責任監査法⼈トーマツ ︓シニアマネージャー デロイトアナリティクスR&Dチームのリーダとして、データ分析やAIについて業界横断で新技術の研究・開発とそれをビジネスコンサル ティングへの適⽤を200件以上のプロジェクトで主導 2011年 3⽉〜2014年11⽉ 株式会社リクルート(リクルートテクノロジーズ) ︓グループマネージャ 数千万会員の全社ビッグデータイニシアチブを⽴ち上げ、プラットフォームの企画・構築・運⽤および数百のサービスへの導⼊をリード 2008年 7⽉〜2011年 2⽉ ⽇本アイ・ビー・エム株式会社 ︓主任スペシャリスト エンジニア・PMとして⼤規模な企業システムの構築・運⽤を担当
  2. 4 ⾃⼰紹介︓主な業務経験等 4 主な業務経験 ü 2012年 9⽉ ⽇本⾏動計量学会に論⽂(共著)提出 、「広域周遊観光促進のための宿 泊履歴とGPSデータを活⽤した観光⾏動分析」

    ü 2013年12⽉ ITメディアエンタープライズに記事掲載 http://www.itmedia.co.jp/enterprise/articles/1401/07/news007.html ü 2015年 8⽉ リスクマネジメントセミナーにて講演、「個⼈情報保護法改正に向けたデータ・ガ バナンスと利活⽤戦略」 ü 2015年 9⽉ ⽇本⾏動計量学会全国⼤会にて発表、「パーソナルデータにおける匿名化⼿ 法の研究」 ü 2016年 6⽉ ⼈⼯知能学会全国⼤会にて発表、「パーソナルテータ⼆次利⽤の有効性向上 を⽬的とした統計的匿名加⼯⼿法の研究」 ü 2016年 7⽉ ⼈⼯知能学会誌 ⼈⼯知能研究拠点紹介 寄稿 ü 2018年 9⽉ 医療⽩書2018年度版に寄稿 「療新時代を切り拓くデジタル⾰命の衝撃」 ü 2019年 3⽉ Insight 4 Dに寄稿「社会変⾰型データサイエンティストを育成せよ ―医療業 界の課題とは」 2019年 8⽉ ⽇本バイオインフォマティクス学会にて講演 「データサイエンス、実務の視点か ら」 ü 2019年 9⽉ JASISコンファレンスにて講演 「次世代ヘルスケアへの移⾏を加速する〜D2K サイエンスの視点から」 ü 2019年10⽉ SAS Life Science Forum Japan 2019にて講演 「製薬領域におけるAI とデータサイエンス活⽤の現状と課題」 ü 2020年11⽉ LINK-Jにて記事記載 「医学・医療への貢献から、健康⾏動の促進まで 医療 情報の利活⽤で、新しい価値創造を」 ü 2021年3⽉17⽇ Digital Shift Summit にて登壇 「AIの社会普及への挑戦者たち、 最前線に迫る」 ü 2021年10⽉ ⽇本⼈類遺伝学会にて 論⽂発表 「Research on Secure computation techniques for integrated and secure analysis of genomic and Real World Data」 n ヘルスケア/ライフサイエンス領域 ü 医療 病院グループの総合研究所⽴ち上げ⽀援 ü 医療 総合診断⽀援AI開発⽀援 ü 医療 AIの共同開発における知財/権利関係の検討 ü 製薬 次世代デジタルマーケティング ü 製薬 ウェアラブルとPHRアプリによる健康介⼊分析・施策⽴案 ü 製薬 AIコンソーシアムの事務局⽀援 ü 製薬 デジタルチャネを活⽤した新CRMシステム実証 ü 介護 IoTによる⾒守りサービスの⽴ち上げと実⾏⽀援 ü 介護 IoTによるADL測定の実証実験⽀援 n その他領域 ü 官公庁 AI⼈材育成プログラム(AI Quest) ü 官公庁 防衛装備品のSCM分析基盤構築構築 ü 官公庁 総合特区におけるAI/IoT/ビッグデータによる実証実験⽀援 ü 運輸 配送ネットワーク最適化 ü 製造業 IoTによるビジネスイノベーションに向けた 戦略策定および、⼤規模PoC実⾏⽀援 ü 製造業 アナリティクス組織⽴ち上げ⽀援 ü 製造業 パーソナルデータ匿名化ガイドライン策定 ü 電⼒ アナリティクス組織⽴ち上げ⽀援 ü 電⼒ パーソナルデータ活⽤戦略⽴案 ü 電⼒ 個⼈情報取り扱い環境整備/ガイドライン策定 ü 通信 データマネジメントプラットフォーム構築⽀援 ü ⼩売り データマネジメント体制の確⽴ ü ⼤学 アナリティクスコンペティション共催 主な執筆・講演等
  3. 6 事例紹介︓医療データによるオープンイノベーション推進 6 データ 提供元 久⽶島 LHR 那覇市 LHR 先島

    ネット 健幸PJ ⼋重島 ネット やんばる 健康ネット てだこ ネット RWD (150万⼈の データ) ⼤学 ⼤学院 地元企業 ⾃治体 医師会 住⺠・ 患者 沖縄RWDコンソーシアム 地元 ⼤学 特任研究員 企業・ベンチャー 医師会・⾃治体 データサイエンス &AI⼈材育成 先端⼈材育成 採⽤ 受講 ü 琉球⼤学 ü OIST ü 地元/他地域の⼤学 ü 臨床医 ü 企業の研究者 ü 学⽣ ü 那覇市医師会 ü 県・市町村医師会 ü 県庁・市町村 DS講座提供・ 研究⽀援 教育コンテンツ 提供 研究指導 共同研究 ü 製薬企業(武⽥薬品) ü ベンチャー(DG,アイリス) ü ベンチャーファンド 沖縄県の約 3割の検診 データ + 久⽶島のヘ ルスデータ 沖縄の医療データ活⽤による地域医療課題の解決と産業育成を⽬指し、2020年11⽉よりコンソーシアムを⽴ち上げ。武⽥薬品や 医療ベンチャー等の企業、那覇市医師会や琉球⼤学等の地域医療の担い⼿、ベンチャーファンドやJIPDEC等の第三者機関も参加 2022年1⽉より、⼀般財団法⼈ 医療情報共有機構に運営を移管
  4. 8 SREホールディングスの創業からの歩み 2014年設⽴、2020年東証⼀部上場 【概要】 主要株主 ソニー(39%出資) Zホールディングス(22%出資) 時価総額 1,299億円(2021/12/13時点) PER

    155倍 PSR 11倍 役職員数 179名 ※ 2021年7⽉30⽇時点 (役職員数は2021年4⽉30⽇時点) ※ PER, PSRは2022年3⽉期連結業績予想を基に算出 ※ 役職員数は受け⼊れ出向や契約/派遣社員を含む 2014年4⽉ ソニー不動産 設⽴ Ø テクノロジーを活⽤したスマートな不動産業を創業 2015年10⽉ AIを活⽤した不動産価格推定エンジンを開発 2018年10⽉ SRE AI Partners 設⽴、⾦融機関提携開始 Ø リアルビジネスの知⾒を活かしたテック外販を開始 2019年6⽉ SREホールディングスに社名を変更 2019年12⽉ 東証マザーズ上場 2020年12⽉ 東証市場第⼀部への市場変更 Ø 不動産/⾦融以外の領域への事業拡⼤を開始 2021年6⽉ DX銘柄2021・DXグランプリ2021に選定 2014 2020 2015 2016 2017 2019 2018 2021
  5. 9 AIクラウド SREホールディングスご紹介 l ソニーグループが有する世界最⾼⽔準の先端技術(投資先ベンチャー含む)と、SREの持つ独⾃のAI技術を活⽤し、 クラウドとコンサルティングテングのサービスを提供 l リアル領域の不動産(仲介・開発)事業で蓄積した・磨き込んだソリューションを外部にもサービス提供 ソニーグループの年間約5,000億円の研究開発投資によっ て培われた先端技術と投資先のベンチャーの技術

    R&D先端技術 / 投資先ベンチャー技術 リアルを包含したテック&コンサルティングカンパニー ソニーグループの情報技術と独⾃のAI技術をベースにした DXとAIに関するコンサルティングとクラウドサービスを提供 AI査定(価格・賃料) 不動産⼀括査定 契約重説クラウド パーソナライズ追客 × SRE Holdings 不動産事業 コンサルティング × × 不動産仲介 IoTマンション “AIFLAT ⼤型施設運営 (太陽光、介護施設) DX戦略コンサル GX戦略コンサル AIコンサル
  6. 10 SREホールディングスご紹介 l 2021年3⽉期︓売上 7,355百万円(前年の約2.5倍)、営業利益 977百万円(前年の約2.6倍) l 営業利益としては、66% AI・コンサル領域 不動産テック

    AIクラウド 戦略・AI コンサルティング 不動産仲介 スマートホーム 事業概要 ▶ 不動産仲介事業者や⾦融機関向けに、パッケージ化 された業務⽀援型クラウドツールの提供 ⁃ AI不動産査定ツール ⁃ 不動産売買契約書類作成クラウド 等 ▶ 様々な業界向けに、企業の課題や⽬的、予算等に 応じたテーラーメイド型のアルゴリズム開発、提供 ⁃ ⾦融業界向け潜在富裕層判定 ⁃ 物流業界向け倉庫充填率可視化 等 ▶ テクノロジー活⽤とエージェント制※1を特徴とした不動産 売買仲介 ▶ IoT技術等を活⽤したマンション“AIFLAT”を 中⼼とした投資⽤不動産の開発、オフバランス化/ 売却、およびアセットマネジメント事業 営業利益シェア※3 収益モデル ツール利⽤料 PoC※2/システム開発費 ツール利⽤料/システム保守運⽤費 フロー収⼊ ストック収⼊ 仲介⼿数料 不動産売却益 アセットマネジメントフィー オフバランスビークルからの収⼊ 66% 34% ※1 売⼿側と買⼿側に別々のエージェントがつく⽚⼿取引 ※2 Proof of Conceptの略称で、試作開発の前段階における検証やデモンストレーションを指す ※3 2021年3⽉期の各セグメントの営業利益をセグメントの営業利益合計で除した⽐率。なお、セグメント間の調整額は考慮していない コンサルティングフィー
  7. 12 DX・AIコンサルティングと⾃社の不動産事業と社会貢献を組み合わせ、相乗効果を創出 スマー トシティ 推進 不動産 ・物流 • 不動産企業部⾨の個別課題解決、コンサル ティング、テーマ開発

    • スマートシティの調査・コンサルティング • 製薬やHC関連企業のDX・AI化のコンサル ティング • RWDプラットフォーム構築⽀援 • 病院経営・オペレーションDX化(将来) • スマートシティ事業の参加 • デジタルヘルス最先端特区リード (補助⾦獲得) • SREのリレーションを活⽤したスマー トシティ案件の開発 ⾦融 • フィンテック領域のコンサルティングテーマの開 発 • レコメンド/デジタルマーケティングのテーマ推 進 ヘルス ケア • 全社DX推進・AI案件コンサルティング • データプラットフォーム構築⽀援、CoE組織 構築 • 官公庁案件の調査案件等の獲得 その他 データ エコシス テム • 沖縄におけるRWDプラットフォーム の推進 • データエコシステム構築によるビジネ スオポチュニティの開発 不動産事業 • 不動産事業(仲介流通・開発・投資) • 不動産デジタルソリューションの開発・展開 → 不動産案件の価値向上、SREとしてのアセット化 コ ン サ ル テ ィ ン グ 事 業 社 会 貢 献 アセット展開 ノウハウFB アセット・ノウハ ウ展開 リレーション強化・ 案件獲得 ア セ ッ ト 展 開 オ ポ チ ュ ニ テ ィ カーボ ンニュー トラル • オフセットソリューションの開発・提供 • コンサルティングを含めた統合プラッ トフォーム・ソリューションの提供
  8. 13 ソリューションまとめスライド(泉) 最先端のAI・DXソリューション(例) つながり表現 ⼼地よい距離感 縦型⼤画⾯ 等⾝⼤の相⼿と対⾯ 臨場感 気配 気配

    環境⾳イコライザ ⽿障りなノイズを除去 臨場感 ステレオエコー キャンセル技術 双⽅向同時のハンズフリー通話 臨場感 低遅延伝送技術 ⾃然なコミュニケーション 気配 省エネ・省帯域 つながり続けるための処理 QAを⾃ 動⽣成 AIが⽂書 解析・知識 構造化 l 距離の制約を超えて、⼈と空間を つなぎ、“あたかも同じ空間にいるよ うな⾃然なコミュニケーション l ソニーの映像・⾳声の複数技術に より実現 l 3Dキャラクター + 無⼈AIチャット ボットで、⾃動対話・シナリオ対話 を組み合わせて問い合わせ対応 を実施 最先端の映像認識ソリューション l 多様な産業向けの3次元空間 認識エンジンを開発 l 物流/⼩売り/ヘルスケア等の幅 広い実環境への映像認識ソ リューション・ツールを提供 テレプレゼンスシステム「窓」 AIチャットボット DX(Digital Transformation) 戦略コンサルティング GX(Green Transformation) コンサルティング AIコンサルティング・PoC・実装
  9. 14 最先端の映像認識ソリューション l 多様な産業向けの3次元空間認識エンジンをソニーネットワークコミュニケーションズスマートプラットフォーム(SNCSP)と共同 開発 l 物流/⼩売り/ヘルスケア等の幅広い実環境への映像認識ソリューション・ツールを提供 庫内のカメラ撮影 (固定・ドローン・フォークリフト) リアルタイム

    3次元空間認識エンジン 空間の堆積・ 充填率 倉庫内スーペースの利⽤率を可視化 カメラ搭載フォークリフト を⽤いた画像取得 Utilization: 96% Utilization: 75% Utilization: 23% Utilization: 93% Utilization: 51% Utilization: 95% SLAMカメラ搭載フォークリフトが⾛⾏ ラック内/平置きの充填率を取得 25% 充填率 97% 36%
  10. 15 テレプレゼンスシステム「窓」 l 距離の制約を超えて、⼈と⼈、⼈と空間をつなぎ、“あたかも同じ空間にいるような⾃然なコミュニケーション”ができるソニー のテレプレゼンス システム「窓」 l ソニーの映像・⾳声の複数技術により実現 つながり表現 ⼼地よい距離感

    縦型⼤画⾯ 等⾝⼤の相⼿と対⾯ 臨場感 気配 気配 環境⾳イコライザ ⽿障りなノイズを除去 臨場感 ステレオエコー キャンセル技術 双⽅向同時のハンズフリー通話 臨場感 低遅延伝送技術 ⾃然なコミュニケーション 気配 省エネ・省帯域 つながり続けるための処理 既に様々なシーンで活⽤されている
  11. 16 AIチャットボット l SONYが保持するチャット・回答シナリオ作成アプリケーション l 3Dキャラクター + 無⼈チャットボットで、⾃動対話・シナリオ対話を組み合わせて問い合わせ対応を実施 l ⽂書の論理構造と表記パターンを分析し、要素の関係性を表す知識構造を半⾃動で抽出、Q&Aペアを⾃動⽣成

    ⾼品質なAIによる無⼈対話 ・ソニー独⾃の意味解析エンジンを活⽤ ・曖昧な回答への候補の提⽰ ・イラスト・図を交えた説明 ・関連する質問の提⽰ ビジネスに合わせたチューニング ・データを活⽤した⾃動対話の作成 ・KPI最⼤化に向けた対話シナリオの作成 対話者データの蓄積 ・動的に動くキャラクターとの対話により、 従来取得しづらかった対話者の趣味嗜好・ スキル情報を収集 QAを⾃動⽣成 AIが⽂書解析・知 識構造化
  12. 17 オンライン商談⽀援ソリューション 顧客 Customer センシング Sensing コンサルタント Consultant センシング Sensing

    画面 Screen ※画面は例です リモートコンサル Remote Consulting コンサルタントが見ている画面に 顧客の視線や状態を可視化 → コンサルタントの判断をアシスト 表情 視線 / 瞬き 姿勢/ジェスチャ 指差し 声の⼤きさ/⾼さ 声の速さ/発話量 声の明るさ カーソル移動 キー⼊⼒ 表⽰領域 頷き/⾸振り 相槌,ため息 映像 Vision 操作 Operation 音声 Sound センシング 可視化 顧客 コンサルタント ノンバーバル情報の例 リモート ノンバーバル データ そのまま可視化 ・視線位置 ・アイコン or グラフ 推定処理をして可視化 ・顧客の理解度 ・ポジティブ/ネガティブ l オンライン商談時に,顧客側のノンバーバル情報(表情,しぐさ,声の様⼦ etc.)をAIで分析し、営業マン側に有益な 情報を可視化することで,相⼿の状態の把握をアシスト l ソニー研究所が開発している技術になります
  13. 18 ノンプログラミングの⾃動データ解析ツール l Prediction Oneは、データからビジネスに有⽤な予測を算出するGUIソフトウェア l 専⾨性を要する部分を⾃動化するので、必ずしも専⾨家でなくても導⼊を進めることが可能、予測モデル構築の作業が⾶ 躍的に効率化 l 利⽤申し込み企業数21,000社を突破

    ノンプログラミングの予測サービス Prediction One ・データからAIで予測を⾏えるGUIソフトウェア ・専⾨家でなくても導⼊を進めることが可能 ⾼い予測精度 ・ソニーが開発しているDeep Learning 「Neural Network Libraries」を活⽤ ・予測精度の評価結果と予測理由を⾃動作成 格安の利⽤費⽤ ・1ライセンスあたり年間 21.8万円 ・30⽇間は無料
  14. 19 不動産AIクラウドソリューション IT化 (おうちダイレクトによる 買⼿集客/AI追客) 買⼿集客 売⼿集客 (おうちダイレクトによる 売⼿集客/AI追客) 購⼊仲介業務

    IT化 IT化 IT化 売却仲介業務 (AIによる⾃動査定/ ITを活⽤した反響・媒介管理) 契約業務 (ITによる契約・重要事項説明 業務のサポート) 売却集客⽀援 サービス 不動産AI 査定ツール 不動産AI マーケティング オートメーションツール 契約重説クラウド (ContraNavi) +1700社のご活⽤実績 AI/ITを活⽤した⼀気通貫のワンストップサービスを提供し、仲介業務をサポート
  15. 21 データサイエンス、AI、ビッグデータの関係性 Source: Towards Data Science, ”Role of Data Science

    in Artificial Intelligence” https://towardsdatascience.com/role-of-data-science-in-artificial-intelligence-950efedd2579 Big Data Processing データサイエンス/AI (⼈⼯知能) /ビッグデータは重なり合う部分も多く、お互いに強い関連性を有す。もしくは、同じことを単 に⾔い換えているだけの場合も多い 機械学習 • 記述統計 学(頻度、 平均、分散 ⾮線形 リニア ビジネス・イン テリジェンス 従来のアナリテ ィクス ⾮構造化データ • 相関関係 • 回帰分析 • クラスタリン グ • ポートフォリ オ理論 • 画像処理 • ⾳声・テキスト 処理 • … • 疎なデータに 基づく推薦エ ンジン • 学習したデー タ構造からの 異常検知 • 複雑な時系 列を予測する サンプルアプリケーション 構造化 ⾮構造 化 データ 基礎となる関係
  16. 23 AI (⼈⼯知能) とは AIのパターン (例) 汎⽤⼈⼯知能 (Artificial General Intelligence

    (AGI) ) ≒ 強いAI 特化型⼈⼯知能 (Narrow AI) ≒ 弱いAI AIの類型例 ルールベース 確率的 アプローチ 機械(深層)学習 様々な定義があるが、⼀つの定義として「これまで⼈間にしかできなかった知的な⾏為 を、アルゴリズム とデータによって機械的 に実⾏すること」 (⽇本⼤百科全書より)
  17. 24 データサイエンス、AI、ビッグデータの関係性の歴史的経緯 1956年にAIが⽣まれ、命名された ビッグデータと処理能⼒の爆発的向上を背景に、4つの重要なイベントが存在 チェス王者の敗北。 カスパロフの敗北は、ディープブルーによるものだった ワトソンが勝つのは Jeopardy︕コンテスト 「コンピュータと⼈間、⼀体どちらが強いのか︖」 「⼈間を絶対的に凌ぐことは可能なのか…︖」

    チューリングテストのように 質疑応答が⾮常に得意 1996 2011 グーグルのデモンストレーションによる ⾃動運転⾞ "New Divison of Labor" (Murnane/Levy) 極めて複雑な環境 ⼗分に進化した技術 <-> 魔法 2012 アルファ碁が世界トップ棋⼠に全勝 "このはしごはとても⾼く、何段あるか わからない。ただ、AIの歴史は 誤ったはしごに登っては下りるの 繰り返しだった。『正しいはしご』に たどり着いたのは、⼤きい" (デミス・ハサビス) 2017
  18. 25 データサイエンス、AI、ビッグデータの関係性の歴史的経緯 1956 1970 1980 1995 2010 2015 機械学習・ ニューラルネットワーク

    MYCIN デントラル エクスパートシステム タスクオントロジー ワトソン オントロジー LOD(Linked Open Data) イライザ Siri bot CALOプロジェクト 探索 迷路・ハノイの塔 プランニング チェス 将棋 囲碁 Googleのネコ ディープマインドの買収 ⾃動運転、Pepper 統計的⾃然⾔語処理 検索エンジンへの活⽤ ディープラーニング 第1次AIブーム(推論・探索) 第2次AIブーム(知識) 第3次AIブーム(機械学習・特徴表現学習) 対話システム研究 • 代表例︓MYCIN • 代表例︓STRIPS • 代表例︓Googleのネコ認識研究 ▼Data Science ▼Big Data ⼤規模分散処理 Source: 松尾豊「⼈⼯知能は⼈間を越えるか〜ディープラーニングの先にあるもの」 (⾓川EPB選書) より作成
  19. 26 AIの理論のお話し 決定⽊分析 線形回帰 (単回帰、重回帰) 階層的クラスター分析 U 1000⼈ A 200⼈

    B 120⼈ A∩B 80⼈ アソシエーション分析 学習データ 予測モデル 予測モデル • ⼊⼒データはあるが、そのデータの正解はない • データから特徴を⾒出してモデル化する • クラスタリング • パターン抽出 • 正解付きのデータを⽤いて予測モデルを作成 • その予測モデルより予測や判別を⾏う • 回帰分析 • クラス分類 教師あり学習 教師なし学習 学習データ 特 徴 ⼿ 法 例
  20. 27 AIの理論のお話し︓教師なし学習 教師なし学習では答えのないデータから、データに含まれる特徴的な性質を数値化・描画して抽出する。 ⽬的に応じて、どのような特徴に注⽬するかが異なる。また、データの全体的な性質を⾒るためにも使⽤する ⼿段 分布を観察する 典型パターンを⾒る 分類する 低次元化する ⼿法の例

    • グラフ • 表 • 統計量 • アソシエーションルール (バスケット分析) • K-Meansクラスタリング • 階層クラスタリング • ⾃⼰組織化マップ • 主成分分析 • 対応分析 特徴 • 少数変数を⽤いたグ ラフや表によって、デー タの特徴を把握する • 頻度が⾼い組合せを特徴的 なパターンとして抽出する • 頻度が低い組合せを特徴的 なパターンから外れる異常だと みなす • データを複数のグループに分割し、 「グループ的な」特徴を抽出する • ⾼次元データを再現するの に適した低次元の表現を ⾒つける 例) 100変数のデータを2次 元の絵で表す場合、元デー タの情報を失われないように 2次元の取り⽅を決める × × × × × × × × × × × × • ⼊⼒データはあるが、そのデータの正解はない • データの特徴を抽出する × × × × × × × × × × × × & ' ( ) 例
  21. 28 AIの理論のお話し︓教師あり学習 応⽤例 予測するもの ⼊⼒ ターゲット (予測対象) 売上⾼予測 商品の(将来の)売上⾼ •

    前⽉の売上⾼ • 株価等の経済指標 • 気温等の天候 • 今⽉の売上⾼ レコメンデーション あるユーザーが(将来的に) ある商品を購⼊するか 否か • 年齢、性別、居住地等のユーザー のプロファイル • ユーザーの購⼊履歴 • ユーザーが指定された商品を 買うか買わないか クレジット スコアリング 債務者の将来の返済 状況 • 年齢、性別、居住地等の債務者の プロファイル • 債務者の資産状況 • 債務者の過去の返済状況 • 債務者が完済できるかできな いか • 債務者の最終的な返済⾦額 教師あり学習では、答え付きのデータから答えを予測するモデルをつくることで、将来の値を予測する
  22. 29 AIの理論のお話し︓深層学習(DeepLearning) 従来のコンピュータプログラム • 演繹的 • 決定論的 ⼈⼯知能システム • 誘導性

    • 反復最適化 "プログラムと展開" "Train" W 1 W 2 W 0 i1 i2 i0 × × × 0 例︓ニューラルネットワーク 重みを持つエッジのシステム フィードバックバックプロパゲーション 出⼒誤差をネットワークに バックプロパッグすることで、 重みを最も段階的に変化 させることができる ⼈⼯ニューロン ... i0 i1 i2 h10 h11 h12 h21 h22 h23 o0 o1 t0 t1 =? ターゲット 出⼒ 層 ⼊⼒ 層 隠された の層 ニューロン h13 アクティブ インアクティブ 学習された重みによって線形的に集 約された⼊⼒を、⾮線形的な出⼒に 変換する。 ⾮線形性( "ReLU 直線的に重み付けされた⼊⼒
  23. 30 DeepLearningの出現(猫、CNN)2012年 • Googleの研究開発によってコンピュータが猫を認識できるようになった、俗に⾔う「キャッ トペーパー」論⽂ • Youtubeから抽出した、1000万枚の画像 そのうち顔画像は3%程度で猫が含まれ る画像もあった •

    16コアのGPUマシンを1000台使って学習に3⽇間 • その結果、⼈間の顔、猫の顔、⼈間の体の写真に反応するニューロンができた 2012年6⽉頃、世の中を騒がせたのが、Googleのディープラーニングの研究。元はトロント⼤学のHinton先⽣という⽅がけん 引。(更に遡ると⽇本の研究者︓福島 邦彦がNeocognitronというテーマで1980年代から研究していた) (参考文献)Building High-level Features Using Large Scale Unsupervised Learning ICML2012Quoc V. Le@google, Andrew Y. Ng@Stanford 他 より
  24. 31 初期3年の進化 ・2012年10⽉ 画像認識コンテストILSVRC 2012でDLを使った チームが優秀 Hintonらのチーム 2015年 2016年 2017年

    ・2012年6⽉ GoogleがYoutube画像から猫や⼈の顔 を認識する ICML ・マルチモーダルの本格的な提案(2014 くらいから) ・GANの提案(2014 IanGoodfellow) ・アーティスト⾵フィルター(2015) ・アルファ碁 ・アルファ碁ゼロ ・ATARI2600 ・PRISMA(2016年6⽉にC/O) ・Google Research ⼈⼯知能が書いた絵(2015) ・Facebook 顔画像でのGAN(2016) 2014年以前 ・Word2Vecの提案(2013 @NIPS) (出典) https://research.googleblog.com/2015/06/i nceptionism-going-deeper-into-neural.html 画像解析・合成・マルチモーダルなど、⾳声を含めより多品種データソースへ関⼼が移っている
  25. 32 AIによる画像処理(⽬)の進化︓物体検出テクノロジー 2015〜2018 元論⽂など アルゴリズム 演算処 理 R-CNN系 ・R-CNN (CVPR

    2014) ・SPPnet(ECCV 2014) ・Fast R-CNN(ICCV 2015) ・Faster R- CNN(NIPS 2015) 3つの別々のモデルが機能。 物体検出: CNNのFine-tune クラス分類︓複数のSVM (Classification) 物体の詳細 位置推定︓回帰 (Bounding Box Regression) 遅い (後期 のものは 速い) YOLO系 ・YOLO(CVPR 2016) ・ YOLOv2(arXiv2016 ) ・YOLOv3 (arXiv2017) ⼀度に多オブジェクトを検出可 能(V3) 画像全体を1つのCNNで検出 するので、背景の排除などに強 い ⼩さな物体検出には弱い 速い、 ⾼精度 (特に V3) SSD系 ・SSD(ECCV2016) ・DSSD(arXiv2017) Yolo同様に⼀度に多オブジェク トを検出可能(本家はこちら)、 マルチスケールで畳み込みを⾏っ ている 速度はYoloよりも遅いため、精 度をトレードオフとしてとっている 速い、 ⾼精度 学⽣だったJoseph Redmonが提案したYolo(you only look once)v3 や、ミシガン⼤学から提案されたSSD (Single shot detector)など、さらに新しいアルゴリズムが複数提案されている
  26. 33 AIによる⽂章処理(⼝)の進化︓GPT-3 2020年 https://twitter.com/hturan/status/12822617831479582 72 Figure 3.14: The GPT-3 generated

    news article that humans had the greatest difficulty distinguishing from a human written article (accuracy: 12%). https://arxiv.org/pdf/2005.14165.pdf • ⾔語⽣成モデルGenerative Pretrained Transformer︓膨⼤なテキストデータを学習したモデル • 精度が⾼く、⼈が作成したテキストとの区別ができないレベルの⽂章も作成可 • 下図はGPT-3によって⽣成されたエッセイ、機械で書かれたものであるとわかる⼈間は12%未満。
  27. 34 AIによる会話デモ • 発話 (発せられたテキスト) から、応答する テキストを⽣成するモデルを指す – 対話ロボットの裏で使⽤されている技術 –

    not ルールベースの対話ロボット • 機械学習の⼿法を使った会話モデルとして、 Seq2seqを使⽤ • 2016/11にGoogle翻訳の精度が劇的に向上 しましたが、対話モデルのひとつであるSeq2Seq が使⽤されている (らしい) 会話モデルとは 今⽇はあたたかいね はい、そうですね お出かけ⽇和ですね あたたかいと嬉しいですよね https://colab.research.google.com/drive/1FyOwUsBqsShj4tHRYgjSWeNWHFQfUpY-
  28. 35 データサイエンス、AI、ビッグデータが今なぜ重要になってきているのか︖ 爆発的な データの増加 スマートな アルゴリズム 処理スピードの向上 毎年約50%データ量増加 2020年には44ゼタバイト と推測(1ゼタバイト=10億

    テラバイト) ディープラーニングが 簡易に使えるライブラリ が成熟 2023年までに国内のクラ ウドは4.5兆円に成⻑と 予測 データ量の増加、アルゴリズムの発展、処理スピードの向上はデータサイエンスとAIをゲームチェンジャーへと変えつつある
  29. 37 データサイエンス、AI、ビッグデータが今なぜ重要になってきているのか︖ 企業 データ マーケットデータ IoTデータ System of Engagement System

    of Record System of Insight データ量 データ種別 システム種別 企業が持つデータの統合的な活⽤も進んできているのに加え、今まで取れていなかったデータをIoTなどにより取得できる様にな りつつある、2020年には約300億個のIoTデバイスが存在すると推定。今後データ量の爆発的な伸びとなると予想されている
  30. 38 AI⼈材・データサイエンティストの状況 国内外とものデータサイエンティストの需要は⾼く、⼈材の不⾜が深刻化している 海外(主に⽶国)では、 • 2019年のLinked inのレポートではDSの求⼈はこの1年で約30%の伸び (6年間では344%) であるに も関わらず、求職者は14%の伸びに留まり、⼈材の需要ギャップは15万⼈を超えると報告されています

    (Linked inより) • ⽶国の求⼈/企業レビューサイトであるGlassdoorでは、2018年にデータサイエンティストは3年連続で最 ⾼の職業に位置付けられました (Forbesより) Source: Forbes https://www.forbes.com/sites/louiscolumbus/2018/01/29/data-scientist-is-the-best-job-in-america-according-glassdoors- 2018-rankings
  31. 39 ⽇本におけるAI⼈材・データサイエンティストの状況は ⼤学/学部/学科/コース 設置年 東京⼤学医療リアルワールドデータ活⽤⼈材育成事業 2020 京都⼤学⼤学院医学研究科 社会変⾰型医療データサイエンティスト育成コース 2019 広島⼤学情報科学部データサイエンスコース

    2018 京都産業⼤学情報理⼯学科データサイエンスコース 2018 横浜市⽴⼤学データサイエンス学部 2018 滋賀⼤学データサイエンス学部 2017 データサイエンティスト育成コースが近年設置された⼤学 経産省主催の題解決型のAI⼈材育成プログラム「AI Quest」 ⽇本国内においても、データサイエンティストの⼈材の不⾜が深刻化しており、2020年には4.8万⼈不⾜する⾒込みである。 データサイエンス⼈材の育成は産官学をあげての重要なトピックになりつつある
  32. 40 AIの⺠主化 2018年〜 テーマ設 定 データ準 備 モデル開 発 モデル検

    証 本番環境 Deploy 実務稼働 運用 ノンコード ≒ Drag&Drop • Google, DataRobot, Sonyなど、AI開発をノンコード⾏えるソリューションを提供 • 例としてGoogle Auto MLの” Vision object detection”が物体認識のAIではmラベル付画像データがあればGCPの コンソール上でほぼドラッグ&ドロップで完結、開発環境から、API作成まで⼀気通貫し開発できる
  33. 42 AIに関する現状のまとめ ⼀般化・コモディティ化 • AI技術領域ではGoogleを始めとするプラットフォーマーが先⾏(GAFA) • 3DGAN(2019) やBERT(2018年10⽉)、GPT-3などの新しい技術 も出てくる •

    ⼀⽅で、全体としてはそこまで⼤きな進化はない • DeepLearningという⾔葉もバズらなくなっている • 多くのニュースや最新動向が溢れ、それ⾃体がニュース性がなくなってきた ⺠主化 • 機械学習やDeepLearing⽤のオープンソース等がメジャーVerUp • 安定的に使えるライブラリが出来てきた(pytorch1.0、tensorflow2.0 など) • DataRobotやAutoMLなどの⾃動ツールやGCP(Google)を始めとす る、ライト/ノーコーディングで使えるツールが増えつつある ↓ 実際に社会実装するフェーズに⼊ってきた 各産業領域で実務応⽤可能なAI・データサイエンスが求められる
  34. 44 AI・データサイエンスのプロジェクトのフェーズ AIやデータサイエンスのプロジェクトではステップごとに、求められるアウトプットや品質が異なり、それに適した実⾏体制も異なるた め、PJ開始時における明確なフェーズの認識合わせと、アウトプット/品質の定義が必要 ⓪構想 潜在的な”ユニコー ン”を模索しビジネ スにおける価値を 定義し、優先順位 を設定する。各施

    策の⽬標設定や 全体的なロードマッ プを策定する ①調査・分析 (コンセプト化) ステークホルダーを 巻き込み、、構想 フェーズで定義した 価値の検証し、コ ンセプトを策定する ②試験版構 築(プロト) ビジネスケースおよ び、実現可能性を モック等を作成し、 コンセプトを検証す る ③初期版構 築(MVP) 初期版AIを構築し ビジネスパイロットを 限られた現場にて 展開。価値実証と 改善点抽出につな げる ④正式版構 築・本格展開 要件定義した内容 を元に、全社や外 部に展開できるス ケーラブルで⾼い品 質のプロダクトを開 発し導⼊する ⑤運⽤・保守 導⼊したプロダクト を、定義した品質 レベルに保ちながら サービスの提供を 継続する ⑥プラットフォーム構築 データを収集し、AI・モデルが実装可能なプラットフォームを構築し、 継続的な改善とサービス提供を実現する 3〜6ヶ⽉ 6〜12ヶ⽉ 3〜12ヶ⽉ 継続 1〜3ヶ⽉ 1〜2ヶ⽉ 1〜2ヶ⽉
  35. 45 標準的なAI・データサイエンスの実施プロセス︓CRISP-DM ⽬的 理解 データ 理解 データ 準備 モデリング 評価

    展開 データ ⽬的 理解 データ 理解 データ 準備 モデリング 評価 展開 PJ企画 分析実施 報告評価 CRISP-DMの標準的なデータサイエンス・プロジェクトのステップ(主に調査・分析〜PoCフェーズ)
  36. 46 各ステップで使うべきAI・データサイエンスの技術も異なる ⽬的理解 データ理解 データ準備 モデリング 評価 展開 単変量解析 データの分布はどうなっているのか︖

        過㖇♳ 䫎♷剣׶ 䫎♷搀׃ 違いがあると⾔えるのか︖ ⽬的を達成するためのモデルは︖ データはそのまま使えるのか︖ 多変量解析 教師なし学習 Ÿ 次元削減: PCA, NMF, … Ÿ クラスタリング: k-means, … Ÿ ⽣成 … 教師あり学習 Ÿ 回帰: ロジスティック回帰, … Ÿ 分類: SVM, RF, … 強化学習 データハンドリング Ÿ 外れ値・⽋損値補完 Ÿ 正規化 … モデルは適切なのか︖ モデルの選択・評価 Ÿ 交差検定 Ÿ 情報量基準 Ÿ クラスタ数選択 Ÿ パラメータ推定: 最尤法 … 基礎統計量 Ÿ 平均・分散 Ÿ 相関 … 統計的推論 Ÿ 確率・確率分布・確率変数 仮説検定 Ÿ T検定 Ÿ カイ⼆乗検定 … データの可視化 確率モデル Ÿ ⽣成モデル Ÿ 識別モデル Ÿ Infographics Ÿ InfoVis 機械学習
  37. 48 AI・データサイエンス テーマ例 個別テーマ パーソナライゼーション 顧客プロファイリング/ク ラスタリング ライフイベント予測 オープンデータによる 新規ターゲティング

    解約予測による リテンション率向上 IoTデータや認識/ 予測技術による 新商品/サービス開発 商品スペック最適化 品揃え最適化 ダイナミック/カスタム プライシング 販促投資配分の 最適化 需要予測による在庫/ 機会ロス削減 購買最適化 ⽣産プロセス最適化 エネルギー効率 最適化 予知予防メンテナンス 営業リソース最適化 顧客とサービス・担当 者等のベストマッチング 店舗配置最適化 エリア別⽣産計画 最適化 配送ルート最適化 クチコミ・紹介ネット ワークの可視化 リスクモデルの⾼度化 審査/査定プロセスの ⾃動化・精度向上 プロジェクトリスク管理 不正/異常検知 ⾳声・⾔語認識による クレームリスク評価 Dx推進⽀援 業績シナリオシミュレー ション 配置⼈員の最適化 最適採⽤者・退職者 予測 画像・⾔語認識による 事務⼿作業の⾃動化 質問応答⾃動化 顧客 製品 オペレーション ネットワーク リスク 企業 デジタル・データプラットフォーム デジタル・データプラットフォーム 分析・BI基盤 AIプラットフォーム(MLOPS) データマネジメント メタデータ管理 個⼈情報管理・匿名化 組織・⼈材育成 データサイエンス・AI⼈材育成 Dx・CoE組織⽴ち上げ 組織・⼈材アセスメント 教育・採⽤プログラム デリバリーエクセレンス(DevEx) プロセス管理
  38. 49 ソリューションの魅力度 実現に必要 なエフォート 取引実績/マチュリティ/インダストリと の親和性を勘案して決定 以下勘案して 決定 • 投資費用

    • 収益化迄の 期間 小 大 小 大 緑:優先度高 青:優先度中 灰色:優先度低 黒字:すでに取り組み済み 青字:今後開発が必要 赤字:実現性が不明 取り組みの優先度定義の例 ユーザー・事業ニーズ起点 • 顧客のカスタマージャーニー • 事業戦略/事業⽅針 • 既存事業との相乗効果 テクノロジー・シーズ起点 ユースケース リスト ユースケース幅出しの観点 • 世の中の新規技術 • DX/GXによる⾰新 • ⾃社の得意技術、領域
  39. 50 ロードマップを策定し、優先度に従い案件を進めると共に社内環境を整備 2M 3M 4M 5M 6M 7M 8M 9M

    10M 11M 12M 1M 案件 アナリティクス アナリティクスの環境準備 アナリティクスデータ運⽤と環境保守 データ データ連携 データプラットフォーム構築 組織・ ⼈材 社内デジタル⼈材の選抜・育成 CoE組織化 デジタル⼈材採⽤⽀援 環境 ITインフラ環境整備 戦略 現状診断 現状診断/ ロードマップ策定 案件のリス ト化 営業での1PoCの実施 社内展開 営業PJ Ph1 営業PJ Ph2 コーポレートPJ Ph1 営業PJ Ph3 コーポレートPJ Ph2 創薬PJ Ph1 image
  40. 従来のデータガバナンスを超えた、データの⺠主化 これまでのデータガバナンス • 組織体制 • 設計権限 • 意思決定の仕組み データ ガバナンス

    • 操作モデル • 役割と責任 • データ管理⽅針 データ マネジメント データの⺠主化を実現するために Data Platform as a Service • データプラットフォームサービスを可能な限り 定義し、実現し、⾃動化する。 サービスとしてのデータリポジトリ • メタデータ、モデル、フロー、アルゴリズムの発⾒ を可能にする • オリジンからデスティネーションまでのフルライン テージを表⽰ • 分類とカタログ化の実現 商品としてのデータ • キュレーションされたデータをサービスとして提 供し、さまざまな成果をもたらす データディスカ バリー データ メッシュ
  41. 53 外部リソースの活⽤ 現時点では必ずしも⾃社単独でリソースを⽤意する必要はなく、⾃社に⽋けているアセット/ケイパビリティに応じて、外部協業に よる補完を検討する 協業形態 パートナリング コンサルティング アウトソーシング ケイパビリティ/アセット 想定シチュエーション

    • ⼀時期的な機能補完ではなく、中⻑期的な事業化も含めて検討 • 何をすればよいか (What) /どうやれば実⾏できるか (How) が明 確化されておらず、外部の知⾒がほしい • 社内機能が未成熟な際に、経験豊かなデータサイエンティストと ⼆⼈三脚で取り組み、外部ノウハウを社内に移転させたい • データ分析や加⼯、基盤構築などを実⾏するためのリソースがほしい (マネジメントは社内) Strategy Process Resource Data/Infra Strategy Process Resource Data/Infra Strategy Process Resource Data/Infra Strategy Process Data/Infra Resource
  42. AI・データサイエンス組織の成功のための5つのキーポイント 明確な戦略と優先順 位付け • デジタル戦略を定義し、優先順位をつける • グループ全体のデジタルビジョンと戦略 • 部⾨・機能・グループごとのロードマップ •

    最優先事項を⽰すコミュニケーション計画 • より多くのパイロットを計画的に実施 • ⾃ら⼿を動かしてパイロットを実施出来る • 外部と連携したパイロットの実施 • 新規投資に充当する専⽤予算 迅速なパイロット (PoC)の実施体制 • データ・AI専⾨組織の⽴ち上げ • 多すぎる意思決定層や委員会などを持たせず、 可能な限りシンプルなガバナンス • AI・DS⼈材の要件と仕事を明確にし採⽤する ガバナンスの確⽴ デジタル⽂化の育成 • トライアンドエラーを重視する⽂化(失敗してピボット) • デジタル⽂化を刺激を与えながら継続的に育成する • 最初は具体的かつ⾝近な業務から変⾰する • ⾃らデジタルアイデアを企画推進・実⾏する • ハイリスク回避と不良ゼロ • 伝統的な企業の働き⽅ デジタルと連携したIT • デジタルとITで⼀体的なアーキテクチャ(構造)を可能に する(データレイク等) • デジタルとITで⼀体となったガバナンスの構造 • ITは新しいアプリのための柔軟性とスピードを ⽋いている • リスク回避&セキュリティを重視しすぎ • AI・DSのアイデアが実現するプラットフォームが ない • 企業内での決定層・委員会が多すぎる • パイロットを外部任せにする • 机上の計画ばかりで実際のパイロットに進まな い • デジタルビジョンも戦略もない • ⾏動計画(ロードマップ)の⽋如 キーポイント 実現すべき⾏動/状態 回避すべき⾏動/状態
  43. 56 DX・データサイエンス⼈材研修 © 2021 SRE Holdings Corporation • 理解度確認テストにより受講者の学習状況を把握し、講義の進度や深さを最適化 •

    講義後は、講義動画を用いた復習や、任意課題への取組など自学を推奨 研修の進め方 ~ 座学・ハンズオン研修プログラム(1-6日目) 座学 ハンズオン 課題 講義 自学 理解度確認テスト 講義動画を 用いた復習/ 任意課題への 取組 1日目 理解度確認テスト 講義動画を 用いた復習/ 任意課題への 取組 2日目 理解度確認テスト 講義動画を 用いた復習/ 任意課題への 取組 3日目 理解度確認テスト 講義動画を 用いた復習/ 任意課題への 取組 4-6日目 理解度確認テスト 講義動画を 用いた復習/ 任意課題への 取組 ガイダンス データサイエンス概論 データ操作 データ可視化 機械学習概論 回帰分析 二値分類 分類問題 金融データへの機械 学習の応用 金融への応用 • 学習目標の理解 • 講義(座学、ハンズオン演習)の受講 • 理解度確認テストへの回答 • 講義評価アンケートへの回答 研修受講の流れ • 講義動画を用いた復習 • 任意課題への取組 • 講師陣による補習サポート 実施時間:1回3時間 例:隔週月曜日 18:00-21:00 回帰分析 データ操作 © 2021 SRE Holdings Corporation • 研修生各人で簡易なテーマを設定 • 講師サポートの元、データ収集・分析・発表という一連の実務を体験 • 各受講生の実務にとって有益な課題解決を実施することで、組織のDXを支援 研修の進め方 ~個人課題研修プログラム(7-11日目) 7日目 テーマ決定・ データ取得 8日目 データ可視化・ モデル作成 9日目 モデル評価・改善 10日目 モデル評価・改善 発表資料作成 11日目 成果発表 講師陣の指導のもと、テーマを選定 用意されたデータへアクセスできるようにする 選定したテーマでデータ分析 Pythonでデータの整形や可視化、モデル学習を実行 データ分析の結果を資料にまとめて、 研修生一人一人が成果報告 研修生+部署関係者 データ整形 可視化 評価 モデル 作成・改善 研修生 講師陣 研修生 講師陣 テーマ 選定 データ アクセス l データサイエンスを⽤いて実務上の課題解決 を⾏うためのスキルを学ぶ l 前半はデータハンドリング・可視化・機械学習をハンズオンコーディングを通して学習 l 後半は実務上のデータサイエンス課題に取り組む演習。実践的な学びを通し分析レポートを作成 座学・ハンズオン研修の内容 データサイエンス 概論 データ操作 データ可視化 機械学習概論 回帰 分類 金融データへの 機械学習の応用 テーマ 内容 • データサイエン スの成り立ち • 金融分野におけ るデータサイエ ンスの重要性 • 実務における データ利活 • プロジェクトの 進め方と組織体 制 • 人工知能と機械 学習の関連 • 教師あり学習・ 教師なし学習・ 強化学習 • 回帰と分類の概 念 • Pandasを用い てテーブルデー タを扱う目的 • データ構造と型 変換 • データの読み込 みと書き出し • 欠損値処理 • 結合と連結 • 集計と集約 • One-Hotエン コーディング • データを可視化 する目的 • Matplotlibを 用いたグラフ描 画 • ヒストグラム • 散布図 • 線グラフ • seaborn • 最小二乗法 • 線形単回帰 • 非線形単回帰 • 平均二乗誤差・ 決定係数 • Sci-kit learn • 学習不足・過学 習 • 正則化・リッジ回 帰 • 決定木・ランダム フォレスト • ロジスティック 回帰 • 精度・再現率・適 合率・F値 • 交差検定 • 多値分類とその 評価指標 • 分類アルゴリズ ムの種類 • 決定木・ランダム フォレスト • 財務テーブル データの探索 • 可視化による データ理解 • 分類問題の設計 • 精度評価と精度 向上手法
  44. 57 DX・AI活⽤アセスメントサービスで、御社のDXとAIの活⽤領域を明確にし、実現のために必要なデータや技術の ⾒極めを⾏い、必要なデジタルやAI実導⼊までの具体的な計画を策定致します。 DX。AIに対する 知⾒の底上げ AI活⽤の ユースケース作成 AI活⽤診断実施 実⾏計画⽴案 プロト開発/実証検証

    システム構築 運⽤⽀援 DX・AI活⽤アセスメントサービスの内容 DX・AI活⽤ アセスメント DX・AI活⽤に向けた 進め⽅ DX・AIについての理解向上 セミナー(技術特性など) 業界内のAI活⽤事例調査/ 共有 御社のDX・AIに対する理解を向 上し、次のステップの議論をしやす い環境を構築します 御社の現状分析/あるべき姿の 確認 DX・AI活⽤ユースケース作成の ワークショップ実施 現状からあるべき姿を確認し、あ るべき姿を実現するためのAI活⽤ ユースケース作成を⾏います ユースケースに対する DX・AI活⽤診断 データ棚卸/有⽤度診断 作成したユースケースについて 様々な観点から分析し、実⾏す べきものを明らかにします DX・AI活⽤実現⽅針策定 DX・AI開発の実⾏計画⽴案 実現⽅針や具体的な実⾏計画 を⽴案 DX・AI活⽤アセスメントサービス
  45. 58 AI技術やリアルアセットをベースしたコンサルティングをご提案します DX・AIコンサルティング AI技術⽀援 業務に必要なコア技術をSREとSonyがすることで、クライアントの コア技術開発投資を不要にし、ビジネスへの適⽤に向けた応⽤ 分のみ開発 A社で必要な技術範囲 A社が技術投資すれば良い範囲 SRE・SonyのコアAI技術

    AIやDX技術を、クライアントの状況に合わせて計画・導⼊・ビジ ネス実装・オペレーション変⾰までをコンサルティングとして⽀援 B社で必要な技術範囲 B社が技術投資すれば良い範囲 l SRE・ソニー研究所で開発した最先端技術をコアとし、お客様に必要な部分だけをカスタマイズして提供するモデルを採⽤ l リアルなアセットも活⽤し、クライアントのDXやAIの計画から、ビジネスへの導⼊・実⾏までをご⽀援 グリーンエネルギー、医療関連施設などのリアルアセット
  46. 59 GX戦略コンサルティング / カーボンニュートラルプラットフォーム(CNPF) GHG排出量算定を含む、「GX戦略コンサルティ ング」から「削減/オフセットソリューション」の事業化 まで⼀気通貫のソリューション提供体制(CNPF) 構築を推進 初期的には、オペレーションの知⾒と パイプラインでアドバンテージを発揮できる不動

    産・建築・物流業界にFY22/1Qよりサービス提 供を始め、さらに他業界へ順次拡⼤を⽬指す またオフセットアセットをオフバランスビークルに⼊れ ることでの収益獲得モデルの複線化と財務健全 性の両⽴を図る GX専⾨コンサルタントによる ゴール設定・ロードマップ作成 ・PDCA⽀援 ⾃助努⼒削減のサポート・ オフセットソリューション提供 GHG排出量⾃動算定・ 将来シミュレーション提供 GX戦略⽴案 Consulting 排出量算定 Measuring 削減/オフセット ソリューション Reducing & Offsetting 例)EMS等を搭載したスマートビル 例)再⽣エネルギー稼働のデータセンター 例)物流オペレーション⾼度化ソリューション 59 CNPFの全体像 +不動産オフバランスビークルの活⽤と AMフィーの獲得 + 外部クラウド型植林ソリューション 2022年4⽉以降