Slide 1

Slide 1 text

LT ChatGPT-4oの 新ボイスモードが出たの で少し触ってみた 2024/09/25 @doradora09

Slide 2

Slide 2 text

Copyright © 2024 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter @doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 ⽀部⻑ / iU 情報経営イノベーション専⾨職⼤学 客員教員 ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 オモシロAIごった煮勉強会、ChatGPT部、 AGI福岡、他2つ 本業ではデータ分析チームの ⽴ち上げ・育成・⾃⾛⽀援を展開中

Slide 3

Slide 3 text

Copyright © 2024 NOB DATA All Rights Reserved. 取り急ぎ、実験動画のリンクと所感をば。 https://x.com/doradora09/status/18 38767397219795272 https://x.com/doradora09/status/1 838773344164016365

Slide 4

Slide 4 text

Copyright © 2024 NOB DATA All Rights Reserved. 参考:このデモとかスゴいですよね • ちょっとした役割をプロンプトで与 えるだけで、ちゃんと声⾊まで含め て演じてくてました https://x.com/ish_creative/status/1838782605325680705

Slide 5

Slide 5 text

Copyright © 2024 NOB DATA All Rights Reserved. 1時間くらい触ってみての所感 • ここはgood • やはり、圧倒的なレスポンスの速さ。⾃然な会話 • 会話途中のカットイン対応 • 感情を込めた会話表現 • ここはこれから • SE⾳合成はできないみたい • ロボの声真似も、限度あり (OpenAIのデモほどではない) • こちらの声の⾳程の把握はできない模様 (複数話者判定も不明、多分できない) • (こちらの声のトーンや息遣いからの感情判断は、まだ試してないのでそのうち。) • いつか期待 • ⽿コピはできないみたい -> これができたらアレンジし放題なんだが・・ • 基本は「聞き役に回る」スタンスなので、主張は弱いかも ( ここは旧モードの⽅が勝⼿に喋りまくってた ) 【欄外メモ】 なお、実装に関するマニアックな質 問をしていると別⾳声で「この質問 には答えられません」となるので、 ちょっとそこだけユーザー体験がよ くない

Slide 6

Slide 6 text

Enjoy .. !!