AIに私たちの人格を憑依させパラレルワールドを生きる

AIに私たちの人格を憑依させパラレルワールドを生きる LLM Meetup Tokyo #3 2023.7.5

「コミュニケーションを圧縮したい」

人同士の会話はシリアル通信である

シリアル通信である以上、時間短縮には限界があるパラレル通信はできない

本当にコミュニケーションを圧縮する方法はないのか？高度な高速通信プロトコルを発明するパラレルワールドを MapReduceする

AIであれば可能かも知れない高度な高速通信プロトコルを発明するパラレルワールドを MapReduceする

「高度な高速通信プロトコル」案 • transformerモデル同士であれば埋め込みベクトルやニューロン活性を利用することによってコミュニケーションを取り合うことが可能かも知れない？ ◦ OpenAIが「言語モデルに言語モデルを説明」させるデモンストレーションツールを公開 • とりあえずデータを突っ込んでも良いが、それをどう理解して何を返しているかは外部から観察が困難。手を動かして検証するにはちょっとSFすぎる。

「パラレルワールドをMapReduce」案 • ちょっと前にtwitterのアーカイブデータからgpt-neoxやOpenCALMをファインチューニング（LoRA）してみる試みが流行っていた。 • それなりにそれっぽくなるらしく、このチューニング済みモデルをパラレルワールドに分散配置してみたらどうなるか？ • シリアル通信の高速化が難しいのであれば、パラレル通信を実現することでコミュニケーションの圧縮に寄与するのではなかろうか？

パラレルワールドを開発する

AI人格を用意する • ベースモデルにはrinna/japanese-gpt-neox-3.6b-instruction-ppoを使用 • 8名の方にtwitterアーカイブを提供頂き、データ加工の上でファインチューン ◦ 試験的パラレルワールドでは100個のお題についてランダムにつぶやいてもらう設計なので、各twitterのつぶやきがどのお題に近いか類似検索し、inputがお題、outputがtwitterつぶやきとなるようにデータ加工した。 •
LoRA作成にあたってはPEFTを利用 ◦ learning_rate: 3e-5 ◦ epoch: 3 ◦ これでA6000で5〜6時間程度

ランダムに誰かのつぶやきに反応する • 候補を与えて自己選択させたかったが、生rinnaには難しいタスクだった ◦ このタスク向けにもチューニングする必要あり • よってランダムに抽出されたつぶやきに反応するメカニズムを加える

できたもの（デモ）

ふりかえり • かなりデータをクレンジングしたのに出力が荒れてしまう問題 ◦ もうちょいlossを抑えないとダメだろうか（現在でもA6000で5時間ぐらいかかっているんだけど・・・） • スペシャルトークンの残骸のようなものが出てしまう問題 ◦ 今回はppo版をファインチューニングしたが、インストラクションチューニングされていない
モデルをファインチューニングした方が良かった？　分からん・・・ • 次は会話を発生させていきたい ◦ 会話スレッドはかなり面白そう • 男子ばかりなので女子のデータも欲しい ◦ 誰か・・・

AIに私たちの人格を憑依させパラレルワールドを生きる

AIに私たちの人格を憑依させパラレルワールドを生きる

Masahiro Nishimi

More Decks by Masahiro Nishimi

Other Decks in Programming

Featured

Transcript