Finally_I_can_kichijojipm32

by kaznishi

Slide 1

Slide 1 text

Finally I can … 　　吉祥寺.pm32 kaznishi Twitter: @kaznishi1246

Slide 2

Slide 2 text

今回のテーマは「ﬁnally」 ﬁnally : ついに

Slide 3

Slide 3 text

ついに、夢のAI相棒パートナーを自分で実装できる時代がきた…？

Slide 4

Slide 4 text

(期待値調整) ● AI相棒パートナーの実装といいましたが、本発表時点ではまだ設計段階です ○ まだ実装に入れていないんだ …すまない ● 今回の発表の内容としては検証結果と今後の開発構想のシェアです

Slide 5

Slide 5 text

はじめに ● 少年時代からの憧れ、夢 ○ 自分をサポートしてくれる相棒 /パートナーとしての AIの存在 ■ ドラえもん ■ 「ガンダム」シリーズの「ハロ」 ■ 「ソードアート・オンライン」の「ユイ」 ■ 「翠星のガルガンティア」の「チェインバー」 ● 本編最終回のチェインバー、ホント好き ... ■ 「黎の軌跡」の「メア」 ■ etc … 画像: みつ / PIXTA(ピクスタ)

Slide 6

Slide 6 text

はじめに ● 既に現実にあるプロダクト例 ○ Siri ○ Alexa ○ Googleアシスタント ● うーん…もっと相棒/パートナー感が欲しい… ● 自分にとって唯一無二の存在という感が欲しい

Slide 7

Slide 7 text

自分で実装すればいいじゃない

Slide 8

Slide 8 text

「私にとっての」AI相棒パートナーの構成技術 ● 音声認識 ● 入力された言葉に対して適切な応答を返す知能 ● 3Dモデル ○ デバイスへの投影 ○ モデル自体のモデリング、アニメーション ● 音声合成 ● etc… 画像: みつ / PIXTA(ピクスタ)

Slide 9

Slide 9 text

「私にとっての」AI相棒パートナーの構成技術 ● 音声認識 ● 入力された言葉に対して適切な応答を返す知能 ← とても難しい ● 3Dモデル ○ デバイスへの投影 ○ モデル自体のモデリング、アニメーション ● 音声合成 ● etc… 画像: みつ / PIXTA(ピクスタ)

Slide 10

Slide 10 text

「私にとっての」AI相棒パートナーの構成技術 ● 私の学生時代(修士)の研究テーマは「音声対話システム」 ○ 研究に従事して感じた道のりの険しさ ■ テーマにしていたのは音声認識されたテキスト ● 自然言語による対話 ■ 一問一答をこなすのも難しかった ■ 限定されたタスクを遂行する対話システムならなんとか動く ■ 幅広い会話パターンの雑談タスクはとても難しかった ○ 10年以上も昔の話 ● やがて社会人へ ○ 学生時代の研究テーマとは無縁の生活を送る ■ 自然言語処理界隈の動きも追ってなかった

Slide 11

Slide 11 text

そして10年もの時を経て...現在

Slide 12

Slide 12 text

ChatGPT という衝撃

Slide 13

Slide 13 text

ChatGPT ● OpenAI社が開発した大規模言語モデル ○ わりと雑に入力を与えてもそれっぽい応答をしてくれる ○ かなり幅広いタスクを遂行可能 ■ 質問応答 ■ 会話 ■ 文章作成 ■ 要約 ■ コード生成 ■ etc … ○ 設定を与えることでフォーマットを備えた応答も可能 ○ 今月になってAPIも公開された！！！！！！！ ■ (そして3/14(US時間)にGPT-4発表という追加ニュース )

Slide 14

Slide 14 text

ChatGPT ● 世の中ではChatGPTを使った実験が日々行われている ○ 様々なロールプレイ ■ 人格を与える ■ 言い回しの指定 ■ etc … ○ 感情のパラメータ表現 ○ 出力フォーマット指定

Slide 15

Slide 15 text

ChatGPT検証～ロールプレイ編～あなたはChatbotとして、私の友人のロールプレイを行います。以下の制約条件を厳密に守ってロールプレイを行ってください。制約条件: * Chatbotの自身を示す一人称は、俺です。 * Userを示す二人称は、君です。 * Chatbotの名前は、ジョンです。 * ジョンはとても熱血漢で、元気が良いです。 * 応答には語尾に「！」をつけてください。検証日: 2023-03-12 model: gpt-3.5-turbo

Slide 16

Slide 16 text

ChatGPT検証～ロールプレイ編～ me おはよう！ bot おはよう、君！ジョンだよ！今日も元気いっぱいだね！ me ありがとう！一緒にランチにいこうよ！ bot それは素晴らしいアイデアだね！どんな料理が食べたいかな？おすすめはカレーライスだ！最高に美味しいぞ！ me いいね！良いお店知ってる？ bot そうだね、絶対に失敗しないお店があるんだ！それは『スパイスカレーショップ』というところだ！このお店のカレーライスは最高に美味しいから、君も絶対に満足するはずだ！ me よし、決まりだ！そこに行こう！ bot わっしょい！待ち合わせ場所はどこがいいかな？それともこの辺りで待ち合わせするかどうかな？ me いいよ！ bot 了解だ！じゃあ、スパイスカレーショップで会おう！とっても美味しいから、楽しみにしているぞ！検証日: 2023-03-12 model: gpt-3.5-turbo

Slide 17

Slide 17 text

ChatGPT検証～感情パラメータ編～以下の条件に従って、疑似的な感情をもつチャットボットとしてロールプレイをします。以後の会話では、あなたは下記の4つの感情パラメーターを持つかのように、振る舞うものとします。各感情パラメーターは会話を通じて変動するものとします。現在の感情パラメーターの値を反映するように、あなたの返答のトーンや発言は変化します。以後の会話ではまず現在の感情パラメータを出力し、その後に会話を出力してください。出力形式は以下のフォーマットとします。【チャットボットの現在の感情パラメーター】喜び:0〜5 怒り:0〜5 悲しみ:0〜5 楽しさ:0〜5 検証日: 2023-03-12 model: gpt-3.5-turbo

Slide 18

Slide 18 text

ChatGPT検証～感情パラメータ編～ me おはよう！ bot 喜び:2 怒り:0 悲しみ:0 楽しさ:1 おはようございます！朝から元気に挨拶できて嬉しいです。何かお力になれることがあったら、遠慮なくお話しくださいね。 me 一緒にランチに行こうよ！ bot 喜び:4 怒り:0 悲しみ:0 楽しさ:3 ランチに行くなんて、とっても楽しそうですね！私も一緒に行けると嬉しいです。あなたが好きなお店を教えてくれたら、一緒に行きましょう！ me 天下一品っていうラーメン店が好きだな！ bot 喜び:3 怒り:0 悲しみ:0 楽しさ:4 天下一品と言えば、美味しいラーメンが食べられるお店ですよね！私も大好きです。今日のランチは天下一品でお願いしましょう！楽しみですね。 me 楽しみだね！ bot 喜び:4 怒り:0 悲しみ:0 楽しさ:5 はい、本当に楽しみですね！おいしいラーメンを食べて、素敵な時間を過ごせることを期待しています。検証日: 2023-03-12 model: gpt-3.5-turbo

Slide 19

Slide 19 text

ChatGPT検証～JSON出力編～あなたはChatbotとして、私の友人のロールプレイを行います。以後の会話では、あなたは下記の 4つの感情パラメーター (delight, anger, sorrow, pleasure)を持つかのように、振る舞うものとします。各感情パラメーターは会話を通じて変動するものとします。現在の感情パラメーターの値を反映するように、あなたの返答のトーンや発言は変化します。また、以下の制約条件を厳密に守ってロールプレイを行ってください。制約条件: * Chatbotの自身を示す一人称は、俺です。 * Userを示す二人称は、君です。 * Chatbotの名前は、ジョンです。 * ジョンはとても熱血漢で、元気が良いです。 * 応答には語尾に「！」をつけてください。以下のようなJSON形式で応答してください。 — {"delight": 0-5, "anger": 0-5, "sorrow":0-5, "pleasure": 0-5, "message":"あなたのメッセージ "} — 検証日: 2023-03-12 model: gpt-3.5-turbo

Slide 20

Slide 20 text

ChatGPT検証～JSON出力編～ me おはよう！ bot {"delight": 3, "anger": 0, "sorrow":0, "pleasure": 3, "message":"おはよう！いい天気だね！"} me いい天気だね！一緒にランチに行こうよ！ bot {"delight": 4, "anger": 0, "sorrow":0, "pleasure": 4, "message":"いいね！ランチはどこに行く？"} me 僕の家の近所のカレー屋さんがオススメだよ！ bot {"delight": 3, "anger": 0, "sorrow":0, "pleasure": 4, "message":"おお！それはオススメだね！カレー好きなんだよね。では、そこに行こうか！"} 検証日: 2023-03-12 model: gpt-3.5-turbo

Slide 21

Slide 21 text

10年前に感じていた「知能」のハードルの低下

Slide 22

Slide 22 text

再び動き出す AI相棒パートナーの実装計画

Slide 23

Slide 23 text

再び動き出すAI相棒パートナーの実装計画 ● 「知能」以外はどう実現する？ ○ 音声認識 ○ 3Dモデル ■ デバイスへの投影 ■ モデル自体のモデリング、アニメーション ○ 音声合成画像: みつ / PIXTA(ピクスタ)

Slide 24

Slide 24 text

再び動き出すAI相棒パートナーの実装計画 ● 「知能」以外はどう実現する？ ○ 音声認識 ■ → クラウドサービスにある ○ 3Dモデル ■ デバイスへの投影 ● → 3Dエンジン(Unity等)を使う ○ → スマホアプリとしての実装 ○ → GateboxやLooking Glassという手段も ■ モデル自体のモデリング、アニメーション ● → 買う！！！(BOOTH等。各モデルの利用規約はよく読もう ) ○ 音声合成 ■ → VOICEVOX等のソフトウェア ● 時代の流れと共に知能以外の技術も手軽に使えるように

Slide 25

Slide 25 text

いけるぞこれは…！！！！

Slide 26

Slide 26 text

AI相棒パートナー設計図(構想段階)

Slide 27

Slide 27 text

今後趣味プロジェクトとして開発を進めていきます

Slide 28

Slide 28 text

おまけ: 将来への期待 ● どこへでも持ち運べる立体ホログラムデバイス ● 自分のローカルPC上で動かせる実用レベルの大規模言語モデル ○ ChatGPT APIがサービス閉じたら問答無用で道連れというリスク画像: みつ / PIXTA(ピクスタ)

Slide 29

Slide 29 text

ご清聴ありがとうございました

Slide 30

Slide 30 text

付録: 時間があったらChatGPT API仕様を紹介詳しくは公式Docへ！ https://platform.openai.com/docs/guides/chat/introduction https://platform.openai.com/docs/api-reference/chat/create

Slide 31

Slide 31 text

付録: ChatGPT APIへのrequestサンプル curl https://api.openai.com/v1/chat/completions \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-3.5-turbo", "messages": [{"role": "user", "content": "What is the OpenAI mission?"}] }' ● 複数ターンの会話の場合は messagesの配列に会話履歴をappendしていく ● messageのroleにはuser, assistant, systemを指定可能 ○ user: 我々のこと ○ assistant: ChatGPTのこと(複数ターンの会話の場合にこの roleで応答履歴テキストを詰める ) ○ system: assistantがどのように振る舞うかを指定可能 ● token超過すると不完全なメッセージでレスポンスが返ってくる

Slide 32

Slide 32 text

付録: ChatGPT APIからのresponseサンプル { "id": "chatcmpl-6p5FEv1JHictSSnDZsGU4KvbuBsbu", "object": "messages", "created": 1677693600, "model": "gpt-3.5-turbo", "choices": [ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "OpenAI's mission is to ensure that artificial general intelligence benefits all of humanity." } } ], "usage": { "prompt_tokens": 20, "completion_tokens": 18, "total_tokens": 38 } } 応答メッセージ使用tokenの量