Slide 1

Slide 1 text

© NTT Communications Corporation All Rights Reserved. 1 2024年6⽉13⽇ NTTコミュニケーションズ株式会社 SKYWAY推進室 これからのビデオ・⾳声通話はどう変わる? AI×WebRTCで実現する新時代のコミュニケーションのカタチ

Slide 2

Slide 2 text

© NTT Communications Corporation All Rights Reserved. 2 早稲⽥⼤学にて⼈⼯知能(対話システム)の研究 SkyWayにDevOpsエンジニアとして参画 WebRTC R&Dチームの⽴ち上げ WebRTC R&Dチームの拡⼤・リーダー 次世代のWebRTCに関する技術調査 SkyWay推進室 WebRTC Researcher 内⽥ 裕貴 2017.03 2019.04 2020.09 2022.11 2024.01 WebRTC歴: 5年over WebRTC Research歴: 3年over 機械学習エンジニア歴: 7年over Podcast出演: fukabori.rm #43 (2021) イベント登壇: Web24プロトコルセッション (2021) Yuki Uchida X: @yuki_wtz

Slide 3

Slide 3 text

© NTT Communications Corporation All Rights Reserved. 3 WebRTCのご紹介 AIの現在地 AIよって実現する次世代コミュニケーション SkyWayにおける AIの取り組み まとめとご提案 4 23 47 104 111 ⽬次

Slide 4

Slide 4 text

© NTT Communications Corporation All Rights Reserved. 4 WebRTCの紹介 INTRODUCTION

Slide 5

Slide 5 text

© NTT Communications Corporation All Rights Reserved. 5 WebRTCの紹介 普段の⽣活で、映像・⾳声通話使ってますか?

Slide 6

Slide 6 text

© NTT Communications Corporation All Rights Reserved. 6 WebRTCの紹介 Zoom Microsoft Teams Google Meet Cisco WebEx Skype Discord 普段の⽣活で、映像・⾳声通話使ってますか?

Slide 7

Slide 7 text

© NTT Communications Corporation All Rights Reserved. 7 WebRTCの紹介 Zoom Microsoft Teams Google Meet Cisco WebEx Skype Discord WebRTCを活⽤している 普段の⽣活で、映像・⾳声通話使ってますか?

Slide 8

Slide 8 text

© NTT Communications Corporation All Rights Reserved. 8 WebRTCの紹介 WebRTCの歴史 2011 WebRTCの技術仕様が提案

Slide 9

Slide 9 text

© NTT Communications Corporation All Rights Reserved. 9 WebRTCの紹介 WebRTCの歴史 2011 2017 WebRTCの技術仕様が提案 ブラウザサポート完了

Slide 10

Slide 10 text

© NTT Communications Corporation All Rights Reserved. 10 WebRTCの紹介 WebRTCの歴史 2011 2017 2020 WebRTCの技術仕様が提案 ブラウザサポート完了 コロナ禍により利⽤者数増

Slide 11

Slide 11 text

© NTT Communications Corporation All Rights Reserved. 11 WebRTCの紹介 WebRTCの歴史 2011 2017 2020 2021 WebRTCの技術仕様が提案 ブラウザサポート完了 コロナ禍により利⽤者数増 IETFにより標準化

Slide 12

Slide 12 text

© NTT Communications Corporation All Rights Reserved. 12 WebRTCの紹介 WebRTCの歴史 2011 2017 2020 2021 WebRTCの技術仕様が提案 ブラウザサポート完了 コロナ禍により利⽤者数増 SkyWayは10年以上に渡り、技術仕様策定の協⼒やWebRTCプラットフォームの提供 IETFにより標準化

Slide 13

Slide 13 text

© NTT Communications Corporation All Rights Reserved. 13 WebRTCの紹介 WebRTCの市場

Slide 14

Slide 14 text

© NTT Communications Corporation All Rights Reserved. 14 WebRTCの紹介 出典:Global Industry Analysts, Inc.「Webリアルタイム通信(WebRTC)の世界市場 2022年に67億⽶ドルと推計されたWebリアルタイム通信(WebRTC)の世界市場は 2030年には817億⽶ドルに達すると予測される WebRTCの市場

Slide 15

Slide 15 text

© NTT Communications Corporation All Rights Reserved. 15 WebRTCの紹介 出典:Global Industry Analysts, Inc.「Webリアルタイム通信(WebRTC)の世界市場 2022年に67億⽶ドルと推計されたWebリアルタイム通信(WebRTC)の世界市場は 2030年には817億⽶ドルに達すると予測される 2022~2030年 成⻑⾒込 12.2 倍 WebRTCの市場

Slide 16

Slide 16 text

© NTT Communications Corporation All Rights Reserved. 16 WebRTCの紹介 出典:Global Industry Analysts, Inc.「Webリアルタイム通信(WebRTC)の世界市場 2022~2030年 成⻑⾒込 12.2 倍 2022年に67億⽶ドルと推計されたWebリアルタイム通信(WebRTC)の世界市場は 2030年には817億⽶ドルに達すると予測される 2022~2030年 年成⻑率(CAGR) 36.7 % WebRTCの市場

Slide 17

Slide 17 text

© NTT Communications Corporation All Rights Reserved. 17 WebRTCの紹介 オンライン商談システム市場規模

Slide 18

Slide 18 text

© NTT Communications Corporation All Rights Reserved. 18 WebRTCの紹介 オンライン商談システム市場規模推移および予測 (2019〜2025年度予測) 出典:ITR「ITR Marhet View:SFA/統合型マーケティング⽀援市場2022」※ベンダーの売上⾦額を対象とし、3⽉期ベースで換算。2021年 度以降は予測値。 0 10 20 30 40 50 60 70 2019 2020 2021 2022 2023 2024 2025 (年度) (単位:億円) 13 26 33 40 48 55 62 オンライン商談システム市場規模

Slide 19

Slide 19 text

© NTT Communications Corporation All Rights Reserved. 19 WebRTCの紹介 2019~2025年 成⻑⾒込 4.7 倍 オンライン商談システム市場規模推移および予測 (2019〜2025年度予測) 出典:ITR「ITR Marhet View:SFA/統合型マーケティング⽀援市場2022」※ベンダーの売上⾦額を対象とし、3⽉期ベースで換算。2021年 度以降は予測値。 0 10 20 30 40 50 60 70 2019 2020 2021 2022 2023 2024 2025 (年度) (単位:億円) 13 26 33 40 48 55 62 オンライン商談システム市場規模

Slide 20

Slide 20 text

© NTT Communications Corporation All Rights Reserved. 20 WebRTCの紹介 今後もオンライン接客・ 商談システムを導⼊する企業が 増えていくと予測 2019~2025年 成⻑⾒込 4.7 倍 オンライン商談システム市場規模推移および予測 (2019〜2025年度予測) 出典:ITR「ITR Marhet View:SFA/統合型マーケティング⽀援市場2022」※ベンダーの売上⾦額を対象とし、3⽉期ベースで換算。2021年 度以降は予測値。 0 10 20 30 40 50 60 70 2019 2020 2021 2022 2023 2024 2025 (年度) (単位:億円) 13 26 33 40 48 55 62 オンライン商談システム市場規模

Slide 21

Slide 21 text

© NTT Communications Corporation All Rights Reserved. 21 WebRTCの紹介 WebRTCの今後

Slide 22

Slide 22 text

© NTT Communications Corporation All Rights Reserved. 22 WebRTCの紹介 WebRTCの今後 2021年にIETFにより標準化が完了

Slide 23

Slide 23 text

© NTT Communications Corporation All Rights Reserved. 23 WebRTCの紹介 WebRTCの今後 2021年にIETFにより標準化が完了 → WebRTCを「より良くするためにどうするか」に議論が集中

Slide 24

Slide 24 text

© NTT Communications Corporation All Rights Reserved. 24 WebRTCの紹介 WebRTCの今後 2021年にIETFにより標準化が完了 → WebRTCを「より良くするためにどうするか」に議論が集中 WebRTCとAIの連携に注⽬が集まる

Slide 25

Slide 25 text

© NTT Communications Corporation All Rights Reserved. 25 WebRTCの紹介 WebRTCの今後 2021年にIETFにより標準化が完了 → WebRTCを「より良くするためにどうするか」に議論が集中 WebRTCとAIの連携に注⽬が集まる 以前のAIは処理速度に課題

Slide 26

Slide 26 text

© NTT Communications Corporation All Rights Reserved. 26 AIの現在地 INTRODUCTION

Slide 27

Slide 27 text

© NTT Communications Corporation All Rights Reserved. 27 AIの現在地 AIの歴史

Slide 28

Slide 28 text

© NTT Communications Corporation All Rights Reserved. 28 AIの現在地 AIの歴史 1950 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界

Slide 29

Slide 29 text

© NTT Communications Corporation All Rights Reserved. 29 AIの現在地 AIの歴史 1950 1990 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界

Slide 30

Slide 30 text

© NTT Communications Corporation All Rights Reserved. 30 AIの現在地 AIの歴史 1950 1990 2010 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム

Slide 31

Slide 31 text

© NTT Communications Corporation All Rights Reserved. 31 AIの現在地 AIの歴史 1950 1990 2010 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム 2006: 深層学習(by Geoffrey Everest Hinton)

Slide 32

Slide 32 text

© NTT Communications Corporation All Rights Reserved. 32 AIの現在地 AIの歴史 1950 1990 2010 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム 2006: 深層学習(by Geoffrey Everest Hinton) 2012: AlexNetが画像認識コンペで優勝

Slide 33

Slide 33 text

© NTT Communications Corporation All Rights Reserved. 33 AIの現在地 AIの歴史 1950 1990 2010 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム 2006: 深層学習(by Geoffrey Everest Hinton) 2012: AlexNetが画像認識コンペで優勝 2014: GAN(by Ian goodfellow)

Slide 34

Slide 34 text

© NTT Communications Corporation All Rights Reserved. 34 AIの現在地 AIの歴史 1950 1990 2010 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム 2006: 深層学習(by Geoffrey Everest Hinton) 2012: AlexNetが画像認識コンペで優勝 2014: GAN(by Ian goodfellow) 2017: DeepL(翻訳)

Slide 35

Slide 35 text

© NTT Communications Corporation All Rights Reserved. 35 AIの現在地 AIの歴史 1950 1990 2010 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム 2006: 深層学習(by Geoffrey Everest Hinton) 2012: AlexNetが画像認識コンペで優勝 2014: GAN(by Ian goodfellow) 2017: DeepL(翻訳) 2022: ChatGPT(⾔語⽣成)/Stable Diffusion(画像⽣成)

Slide 36

Slide 36 text

© NTT Communications Corporation All Rights Reserved. 36 AIの現在地 AIの歴史 1950 1990 2010 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム 2006: 深層学習(by Geoffrey Everest Hinton) 2012: AlexNetが画像認識コンペで優勝 2014: GAN(by Ian goodfellow) 2017: DeepL(翻訳) 2022: ChatGPT(⾔語⽣成)/Stable Diffusion(画像⽣成) 2024: Sora(映像⽣成)

Slide 37

Slide 37 text

© NTT Communications Corporation All Rights Reserved. 37 AIの現在地 AIの歴史 1950 1990 第⼀次AIブーム ⼈⼯知能という単語の登場 コンピュータの性能限界 第⼆次AIブーム エキスパートシステムの研究 データ量の限界 第三次AIブーム 2006: 深層学習(by Geoffrey Everest Hinton) 2012: AlexNetが画像認識コンペで優勝 2014: GAN(by Ian goodfellow) 2017: DeepL(翻訳) 2022: ChatGPT(⾔語⽣成)/Stable Diffusion(画像⽣成) 2024: Sora(映像⽣成) さらなる性能向上と速度向上へ… 2010

Slide 38

Slide 38 text

© NTT Communications Corporation All Rights Reserved. 38 AIの現在地 AIのパフォーマンス向上の具体例1: Groq

Slide 39

Slide 39 text

© NTT Communications Corporation All Rights Reserved. 39 AIの現在地 AIのパフォーマンス向上の具体例1: Groq 1秒間に500⽂字テキスト⽣成ができるGroqが登場(ChatGPT-4の5~10倍)

Slide 40

Slide 40 text

© NTT Communications Corporation All Rights Reserved. 40 https://github.com/ray-project/llmperf-leaderboardより引⽤

Slide 41

Slide 41 text

© NTT Communications Corporation All Rights Reserved. 41 https://github.com/ray-project/llmperf-leaderboardより引⽤ 他社のLLMサービスと⽐較して3~10倍のトークン出⼒数

Slide 42

Slide 42 text

© NTT Communications Corporation All Rights Reserved. 42 AIの現在地 AIのパフォーマンス向上の具体例1: Groq 1秒間に500⽂字テキスト⽣成ができるGroqが登場(ChatGPT-4の5~10倍) GPUではなくLLM専⽤のLanguage Processing Unitを開発することで、10xの速度を実現

Slide 43

Slide 43 text

© NTT Communications Corporation All Rights Reserved. 43 AIの現在地 AIのパフォーマンス向上の具体例2: SDXL Lightning

Slide 44

Slide 44 text

© NTT Communications Corporation All Rights Reserved. 44 AIの現在地 AIのパフォーマンス向上の具体例2: SDXL Lightning 1秒間に10枚の画像を⽣成できるSDXL Lightningの登場

Slide 45

Slide 45 text

© NTT Communications Corporation All Rights Reserved. 45 https://www.uisdc.com/sdxl-lightningより引⽤

Slide 46

Slide 46 text

© NTT Communications Corporation All Rights Reserved. 46 AIの現在地 AIのパフォーマンス向上の具体例2: SDXL Lightning 1秒間に10枚の画像を⽣成できるSDXL Lightningの登場 画像を⽣成するためのステップ数を削減することで⾼速化を実現

Slide 47

Slide 47 text

© NTT Communications Corporation All Rights Reserved. 47 AIの現在地 AIのパフォーマンス向上の具体例2: SDXL Lightning 1秒間に10枚の画像を⽣成できるSDXL Lightningの登場 画像を⽣成するためのステップ数を削減することで⾼速化を実現 他にも、⽣成モデル⾃体の最適化⼿法など、さまざまなアプローチが存在

Slide 48

Slide 48 text

© NTT Communications Corporation All Rights Reserved. 48 AIの現在地 AIのパフォーマンス向上の具体例3: ultravox

Slide 49

Slide 49 text

© NTT Communications Corporation All Rights Reserved. 49 AIの現在地 AIのパフォーマンス向上の具体例3: ultravox ⼈間の⾳声を理解できるマルチモーダルLLM ultravox の登場

Slide 50

Slide 50 text

© NTT Communications Corporation All Rights Reserved. 50 AIの現在地 AIのパフォーマンス向上の具体例3: ultravox ⼈間の⾳声を理解できるマルチモーダルLLM ultravox の登場 従来の仕組みでは、⾳声→⽂字→LLMと2段階の処理を⾏う必要があったが、⾳声→LLMとなり更に⾼速化

Slide 51

Slide 51 text

© NTT Communications Corporation All Rights Reserved. 51 AIによって実現する 次世代コミュニケーション FUTURE

Slide 52

Slide 52 text

© NTT Communications Corporation All Rights Reserved. 52 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする

Slide 53

Slide 53 text

© NTT Communications Corporation All Rights Reserved. 53 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする Web会議や電話対応などで幅広い活躍が期待されている

Slide 54

Slide 54 text

© NTT Communications Corporation All Rights Reserved. 54 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする Web会議や電話対応などで幅広い活躍が期待されている 1. 社内⽂書を学習しリアルタイムに回答する対話Bot

Slide 55

Slide 55 text

© NTT Communications Corporation All Rights Reserved. 55 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする Web会議や電話対応などで幅広い活躍が期待されている 1. 社内⽂書を学習しリアルタイムに回答する対話Bot 2. 社内システムと連携した旅⾏代理店Bot

Slide 56

Slide 56 text

© NTT Communications Corporation All Rights Reserved. 56 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする Web会議や電話対応などで幅広い活躍が期待されている 1. 社内⽂書を学習しリアルタイムに回答する対話Bot 2. 社内システムと連携した旅⾏代理店Bot 3. ファシリテーションを⾏なってくれる議事進⾏Bot

Slide 57

Slide 57 text

© NTT Communications Corporation All Rights Reserved. 57 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする Web会議や電話対応などで幅広い活躍が期待されている 1. 社内⽂書を学習しリアルタイムに回答する対話Bot 2. 社内システムと連携した旅⾏代理店Bot 3. ファシリテーションを⾏なってくれる議事進⾏Bot 4. 採⽤サポートBot

Slide 58

Slide 58 text

© NTT Communications Corporation All Rights Reserved. 58 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする Web会議や電話対応などで幅広い活躍が期待されている 1. 社内⽂書を学習しリアルタイムに回答する対話Bot 2. 社内システムと連携した旅⾏代理店Bot 3. ファシリテーションを⾏なってくれる議事進⾏Bot 4. 採⽤サポートBot

Slide 59

Slide 59 text

© NTT Communications Corporation All Rights Reserved. 59 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする Web会議や電話対応などで幅広い活躍が期待されている 1. 社内⽂書を学習しリアルタイムに回答する対話Bot 2. 社内システムと連携した旅⾏代理店Bot 3. ファシリテーションを⾏なってくれる議事進⾏Bot 4. 採⽤サポートBot これらの例はtoB ユースケースの極⼀部

Slide 60

Slide 60 text

© NTT Communications Corporation All Rights Reserved. 60 オンラインコミュニケーション×⽣成AI ⽣成AIは幅広い対応が期待できユースケースも多様 オンラインコミュニケーションとも相性が良い

Slide 61

Slide 61 text

© NTT Communications Corporation All Rights Reserved. 61 オンラインコミュニケーション×⽣成AI ⽣成AIは幅広い対応が期待できユースケースも多様 オンラインコミュニケーションとも相性が良い 従来の AI (⽤途特化型) 商品名や 商品コードなど 商品名や エラーコードなど ⽬的地名称や 住所など 価格、販売店、 在庫情報 対応策 修理窓⼝情報 最短ルートや 旅費 〇〇という商品に ついて教えて 〇〇が壊れて 動きません ⼤⼿町へ⾏きたい 観光名所も教えて 価格、販売店、在庫情 報、その他商品に関連 した情報は〇〇です。 故障の確認点は〇〇です。 エラーコードは何ですか? 対応策は〇〇です。 最短ルートや旅費は〇 〇、観光名所は〇〇で す。 ⽣成 AI 製品問合せ カスタマー サポート 道案内 従来の AI(⽤途特化型) ⽣成 AI

Slide 62

Slide 62 text

© NTT Communications Corporation All Rights Reserved. 62 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする toC ユースケースも様々な活⽤⽅法が予想される

Slide 63

Slide 63 text

© NTT Communications Corporation All Rights Reserved. 63 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする toC ユースケースも様々な活⽤⽅法が予想される 1. AI英会話(ELSA Speak)

Slide 64

Slide 64 text

© NTT Communications Corporation All Rights Reserved. 64 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする toC ユースケースも様々な活⽤⽅法が予想される 1. AI英会話(ELSA Speak) 2. おしゃべりAI(Cotomo)

Slide 65

Slide 65 text

© NTT Communications Corporation All Rights Reserved. 65 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする toC ユースケースも様々な活⽤⽅法が予想される 1. AI英会話(ELSA Speak) 2. おしゃべりAI(Cotomo) 3. AIキャラクターとの交流(ai.town)

Slide 66

Slide 66 text

© NTT Communications Corporation All Rights Reserved. 66 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする toC ユースケースも様々な活⽤⽅法が予想される 1. AI英会話(ELSA Speak) 2. おしゃべりAI(Cotomo) 3. AIキャラクターとの交流(ai.town) コンセプトごとにカスタマイズされたLLMを利⽤するサービスが増えていく

Slide 67

Slide 67 text

© NTT Communications Corporation All Rights Reserved. 67 AIによって実現する次世代コミュニケーション 従来のシステムでは、LLMのレスポンス速度が課題となっていた ユースケース1: LLMとリアルタイムに対話をする

Slide 68

Slide 68 text

© NTT Communications Corporation All Rights Reserved. 68 AIによって実現する次世代コミュニケーション 従来のシステムでは、LLMのレスポンス速度が課題となっていた そのためにLLMの⾼速化の研究が進んできた ユースケース1: LLMとリアルタイムに対話をする

Slide 69

Slide 69 text

© NTT Communications Corporation All Rights Reserved. 69 AIによって実現する次世代コミュニケーション LLMの速度の課題が解消されたら次の課題は? ユースケース1: LLMとリアルタイムに対話をする

Slide 70

Slide 70 text

© NTT Communications Corporation All Rights Reserved. 70 AIによって実現する次世代コミュニケーション LLMの速度の課題が解消されたら次の課題は? ユーザーとLLMを繋げる通信部分が課題になりうる ユースケース1: LLMとリアルタイムに対話をする

Slide 71

Slide 71 text

© NTT Communications Corporation All Rights Reserved. 71 AIによって実現する次世代コミュニケーション LLMの速度の課題が解消されたら次の課題は? ユーザーとLLMを繋げる通信部分が課題になりうる 現在の仕組みでは、録⾳したボイスメモをやりとりしているようなもの ユースケース1: LLMとリアルタイムに対話をする

Slide 72

Slide 72 text

© NTT Communications Corporation All Rights Reserved. 72 AIによって実現する次世代コミュニケーション LLMの速度の課題が解消されたら次の課題は? ユーザーとLLMを繋げる通信部分が課題になりうる 現在の仕組みでは、録⾳したボイスメモをやりとりしているようなもの より⾼速化するためにはリアルタイムに⾳声をやりとりする必要がある ユースケース1: LLMとリアルタイムに対話をする

Slide 73

Slide 73 text

© NTT Communications Corporation All Rights Reserved. 73 AIによって実現する次世代コミュニケーション LLMの速度の課題が解消されたら次の課題は? ユーザーとLLMを繋げる通信部分が課題になりうる 現在の仕組みでは、録⾳したボイスメモをやりとりしているようなもの より⾼速化するためにはリアルタイムに⾳声をやりとりする必要がある これを実現して初めて、⼈と⼈が喋るようなUXで、LLMとコミュニケーションができるようになる ユースケース1: LLMとリアルタイムに対話をする

Slide 74

Slide 74 text

© NTT Communications Corporation All Rights Reserved. 74 AIによって実現する次世代コミュニケーション LiveKitがChatGPTと対話するアプリケーションを公開 ユースケース1: LLMとリアルタイムに対話をする

Slide 75

Slide 75 text

© NTT Communications Corporation All Rights Reserved. 75 AIによって実現する次世代コミュニケーション 出典: LiveKit https://blog.livekit.io/meet-kitt/ WebRTC でChatGPT と対話するアプリケーション LiveKitがChatGPTと対話するアプリケーションを公開 ユースケース1: LLMとリアルタイムに対話をする

Slide 76

Slide 76 text

© NTT Communications Corporation All Rights Reserved. 76 AIによって実現する次世代コミュニケーション LiveKitがChatGPTと対話するアプリケーションを公開 OpenAIも、ChatGPT-VoiceのUX向上のために WebRTC技術者を採⽤している ユースケース1: LLMとリアルタイムに対話をする

Slide 77

Slide 77 text

© NTT Communications Corporation All Rights Reserved. 77 AIによって実現する次世代コミュニケーション LiveKitがChatGPTと対話するアプリケーションを公開 OpenAIも、ChatGPT-VoiceのUX向上のために WebRTC技術者を採⽤している ユースケース1: LLMとリアルタイムに対話をする https://openai.com/careers/real-time-communications-engineer/ より引⽤

Slide 78

Slide 78 text

© NTT Communications Corporation All Rights Reserved. 78 AIによって実現する次世代コミュニケーション 取り組む内容として以下を挙げている ユースケース1: LLMとリアルタイムに対話をする https://openai.com/careers/real-time-communications-engineer/ より引⽤

Slide 79

Slide 79 text

© NTT Communications Corporation All Rights Reserved. 79 AIによって実現する次世代コミュニケーション 取り組む内容として以下を挙げている 1. AIとRTCを統合する技術を⾰新し、モデル操作と I/O配信の遅延を最⼩限に抑えます。 ユースケース1: LLMとリアルタイムに対話をする https://openai.com/careers/real-time-communications-engineer/ より引⽤

Slide 80

Slide 80 text

© NTT Communications Corporation All Rights Reserved. 80 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする 取り組む内容として以下を挙げている 1. AIとRTCを統合する技術を⾰新し、モデル操作と I/O配信の遅延を最⼩限に抑えます。 2. ユーザーとモデル間のオーディオとビデオの⼊出⼒ をストリーミングするための新しい標準を確⽴する。 https://openai.com/careers/real-time-communications-engineer/ より引⽤

Slide 81

Slide 81 text

© NTT Communications Corporation All Rights Reserved. 81 AIによって実現する次世代コミュニケーション ユースケース1: LLMとリアルタイムに対話をする 取り組む内容として以下を挙げている 1. AIとRTCを統合する技術を⾰新し、モデル操作と I/O配信の遅延を最⼩限に抑えます。 2. ユーザーとモデル間のオーディオとビデオの⼊出⼒ をストリーミングするための新しい標準を確⽴する。 3.製品チームと緊密に連携して、API と ChatGPT の 新しいリアルタイム機能を開発します。 https://openai.com/careers/real-time-communications-engineer/ より引⽤

Slide 82

Slide 82 text

© NTT Communications Corporation All Rights Reserved. 82 AIによって実現する次世代コミュニケーション LLMと映像や⾳声でコミュニケーションをする限り ユースケース1: LLMとリアルタイムに対話をする

Slide 83

Slide 83 text

© NTT Communications Corporation All Rights Reserved. 83 AIによって実現する次世代コミュニケーション LLMと映像や⾳声でコミュニケーションをする限り 映像や⾳声を最も⾼速にやりとりできるWebRTCは必要不可⽋ ユースケース1: LLMとリアルタイムに対話をする

Slide 84

Slide 84 text

© NTT Communications Corporation All Rights Reserved. 84 AIによって実現する次世代コミュニケーション ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 85

Slide 85 text

© NTT Communications Corporation All Rights Reserved. 85 AIによって実現する次世代コミュニケーション 汎⽤的なLLM以外にも、特化型のAIも重要性が増していく ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 86

Slide 86 text

© NTT Communications Corporation All Rights Reserved. 86 AIによって実現する次世代コミュニケーション 汎⽤的なLLM以外にも、特化型のAIも重要性が増していく なぜか? ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 87

Slide 87 text

© NTT Communications Corporation All Rights Reserved. 87 AIによって実現する次世代コミュニケーション 汎⽤的なLLM以外にも、特化型のAIも重要性が増していく なぜか? 精度・汎⽤性と速度はトレードオフだから ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 88

Slide 88 text

© NTT Communications Corporation All Rights Reserved. 88 AIによって実現する次世代コミュニケーション WebRTCは、デバイスを問わず、映像・⾳声通話ができるのがウリ ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 89

Slide 89 text

© NTT Communications Corporation All Rights Reserved. 89 AIによって実現する次世代コミュニケーション WebRTCは、デバイスを問わず、映像・⾳声通話ができるのがウリ 映像は30fpsにもなる ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 90

Slide 90 text

© NTT Communications Corporation All Rights Reserved. 90 AIによって実現する次世代コミュニケーション WebRTCは、デバイスを問わず、映像・⾳声通話ができるのがウリ 映像は30fpsにもなる つまりAIも1秒間に30枚処理できる速度が求められる ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 91

Slide 91 text

© NTT Communications Corporation All Rights Reserved. 91 AIによって実現する次世代コミュニケーション WebRTCは、デバイスを問わず、映像・⾳声通話ができるのがウリ 映像は30fpsにもなる つまりAIも1秒間に30枚処理できる速度が求められる これに⾳声のAI処理も加わる ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 92

Slide 92 text

© NTT Communications Corporation All Rights Reserved. 92 AIによって実現する次世代コミュニケーション WebRTCは、デバイスを問わず、映像・⾳声通話ができるのがウリ 映像は30fpsにもなる つまりAIも1秒間に30枚処理できる速度が求められる これに⾳声のAI処理も加わる 更に、サーバー側でAI処理をすると通信遅延が発⽣するためローカルCPUでAIを動かしたい ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 93

Slide 93 text

© NTT Communications Corporation All Rights Reserved. 93 AIによって実現する次世代コミュニケーション WebRTCは、デバイスを問わず、映像・⾳声通話ができるのがウリ 映像は30fpsにもなる つまりAIも1秒間に30枚処理できる速度が求められる これに⾳声のAI処理も加わる 更に、サーバー側でAI処理をすると通信遅延が発⽣するためローカルCPUでAIを動かしたい 特定の⽤途に特化した超軽量なAIが求められる ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 94

Slide 94 text

© NTT Communications Corporation All Rights Reserved. 94 AIによって実現する次世代コミュニケーション WebRTCは、デバイスを問わず、映像・⾳声通話ができるのがウリ 映像は30fpsにもなる つまりAIも1秒間に30枚処理できる速度が求められる これに⾳声のAI処理も加わる 更に、サーバー側でAI処理をすると通信遅延が発⽣するためローカルCPUでAIを動かしたい 特定の⽤途に特化した超軽量なAIが求められる こういったケースに対応するためにも、WebブラウザはWebAssemblyのサポートがされている ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 95

Slide 95 text

© NTT Communications Corporation All Rights Reserved. 95 WebAssembly(WASM)とは

Slide 96

Slide 96 text

© NTT Communications Corporation All Rights Reserved. 96 WebAssembly(WASM)とは W3Cが2019年に標準化したブラウザで動作する第4のフォーマット

Slide 97

Slide 97 text

© NTT Communications Corporation All Rights Reserved. 97 WebAssembly(WASM)とは W3Cが2019年に標準化したブラウザで動作する第4のフォーマット C++, Rustなどの⾔語で実装されたコードをブラウザで動かすための機能

Slide 98

Slide 98 text

© NTT Communications Corporation All Rights Reserved. 98 WebAssembly(WASM)とは W3Cが2019年に標準化したブラウザで動作する第4のフォーマット C++, Rustなどの⾔語で実装されたコードをブラウザで動かすための機能 暗号処理やAI処理は⾮常に重い処理となるためJavaScriptでは限界がある

Slide 99

Slide 99 text

© NTT Communications Corporation All Rights Reserved. 99 WebAssembly(WASM)とは W3Cが2019年に標準化したブラウザで動作する第4のフォーマット C++, Rustなどの⾔語で実装されたコードをブラウザで動かすための機能 暗号処理やAI処理は⾮常に重い処理となるためJavaScriptでは限界がある ⾼度なAI処理を動かすための機能として、WebRTC界隈では重宝されている

Slide 100

Slide 100 text

© NTT Communications Corporation All Rights Reserved. 100 AIによって実現する次世代コミュニケーション AIによる加⼯・解析機能は幅広い適⽤が予想される ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 101

Slide 101 text

© NTT Communications Corporation All Rights Reserved. 101 AIによって実現する次世代コミュニケーション AIによる加⼯・解析機能は幅広い適⽤が予想される 1. Web会議ツールで使われる仮想背景・背景ぼかし ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 102

Slide 102 text

© NTT Communications Corporation All Rights Reserved. 102 AIによって実現する次世代コミュニケーション AIによる加⼯・解析機能は幅広い適⽤が予想される 1. Web会議ツールで使われる仮想背景・背景ぼかし 2. Web会議ツールで使われるノイズキャンセリング ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 103

Slide 103 text

© NTT Communications Corporation All Rights Reserved. 103 AIによって実現する次世代コミュニケーション AIによる加⼯・解析機能は幅広い適⽤が予想される 1. Web会議ツールで使われる仮想背景・背景ぼかし 2. Web会議ツールで使われるノイズキャンセリング 3. ⾳声や映像を解析してMTGや商談の質を解析 ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する 出典: EnableX https://www.enablex.io/hire/

Slide 104

Slide 104 text

© NTT Communications Corporation All Rights Reserved. 104 AIによって実現する次世代コミュニケーション AIによる加⼯・解析機能は幅広い適⽤が予想される 1. Web会議ツールで使われる仮想背景・背景ぼかし 2. Web会議ツールで使われるノイズキャンセリング 3. ⾳声や映像を解析してMTGや商談の質を解析 4. ⾳声を書き起こして議事録やカルテを⾃動⽣成 ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する 出典: Daily.co https://www.daily.co/use-cases/telehealth/

Slide 105

Slide 105 text

© NTT Communications Corporation All Rights Reserved. 105 AIによって実現する次世代コミュニケーション AIによる加⼯・解析機能は幅広い適⽤が予想される 1. Web会議ツールで使われる仮想背景・背景ぼかし 2. Web会議ツールで使われるノイズキャンセリング 3. ⾳声や映像を解析してMTGや商談の質を解析 4. ⾳声を書き起こして議事録やカルテを⾃動⽣成 5. ⾳声・テキスト・⼿話を相互に翻訳 ユースケース2: 映像や⾳声をリアルタイムに加⼯・解析する

Slide 106

Slide 106 text

© NTT Communications Corporation All Rights Reserved. 106 SkyWayにおける AIの取り組み FUTURE

Slide 107

Slide 107 text

© NTT Communications Corporation All Rights Reserved. 107 SkyWayにおけるAIの取り組み AI技術の調査検証

Slide 108

Slide 108 text

© NTT Communications Corporation All Rights Reserved. 108 SkyWayにおけるAIの取り組み AI技術の調査検証 • 海外を含めたAI×WebRTCの事例調査

Slide 109

Slide 109 text

© NTT Communications Corporation All Rights Reserved. 109 SkyWayにおけるAIの取り組み AI技術の調査検証 • 海外を含めたAI×WebRTCの事例調査 • 感情分析AIの技術検証

Slide 110

Slide 110 text

© NTT Communications Corporation All Rights Reserved. 110 SkyWayにおけるAIの取り組み AI技術の調査検証 • 海外を含めたAI×WebRTCの事例調査 • 感情分析AIの技術検証 • ⾔語⽣成AI(ChatGPT)を利⽤したリアルタイム回答Botの技術検証

Slide 111

Slide 111 text

© NTT Communications Corporation All Rights Reserved. 111 SkyWayにおけるAIの取り組み AI技術の調査検証 • 海外を含めたAI×WebRTCの事例調査 • 感情分析AIの技術検証 • ⾔語⽣成AI(ChatGPT)を利⽤したリアルタイム回答Botの技術検証 • 画像⽣成AI(Stable Diffusion)を利⽤したリアルタイム映像⽣成の技術検証

Slide 112

Slide 112 text

© NTT Communications Corporation All Rights Reserved. 112 SkyWayにおけるAIの取り組み AI技術の調査検証 • 海外を含めたAI×WebRTCの事例調査 • 感情分析AIの技術検証 • ⾔語⽣成AI(ChatGPT)を利⽤したリアルタイム回答Botの技術検証 • 画像⽣成AI(Stable Diffusion)を利⽤したリアルタイム映像⽣成の技術検証 WebRTCプラットフォームとしての連携機能も検討

Slide 113

Slide 113 text

© NTT Communications Corporation All Rights Reserved. 113 まとめとご提案 FUTURE

Slide 114

Slide 114 text

© NTT Communications Corporation All Rights Reserved. 114 まとめとご提案 まとめ

Slide 115

Slide 115 text

© NTT Communications Corporation All Rights Reserved. 115 まとめとご提案 まとめ • AI・WebRTCの市場規模は拡⼤中

Slide 116

Slide 116 text

© NTT Communications Corporation All Rights Reserved. 116 まとめとご提案 まとめ • AI・WebRTCの市場規模は拡⼤中 • AI・WebRTCの組み合わせが技術の進歩によって可能に

Slide 117

Slide 117 text

© NTT Communications Corporation All Rights Reserved. 117 まとめとご提案 まとめ • AI・WebRTCの市場規模は拡⼤中 • AI・WebRTCの組み合わせが技術の進歩によって可能に • AI・WebRTCの組み合わせによってコミュニケーションは進化する

Slide 118

Slide 118 text

© NTT Communications Corporation All Rights Reserved. 118 まとめとご提案 まとめ • AI・WebRTCの市場規模は拡⼤中 • AI・WebRTCの組み合わせが技術の進歩によって可能に • AI・WebRTCの組み合わせによってコミュニケーションは進化する 従来のコミュニケーションサービスでは実現できなかったUXの向上や⽣産性の向上が実現 コミュニケーションサービスの差別化はAIの応⽤によって⾏われる

Slide 119

Slide 119 text

© NTT Communications Corporation All Rights Reserved. 119 まとめとご提案 ご提案 次世代のコミュニケーションサービスを⼀緒に作りませんか?

Slide 120

Slide 120 text

© NTT Communications Corporation All Rights Reserved. 120