Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIに私たちの人格を憑依させパラレルワールドを生きる
Search
Masahiro Nishimi
July 05, 2023
Programming
0
370
AIに私たちの人格を憑依させパラレルワールドを生きる
LLM Meetup Tokyo #3 LT
Masahiro Nishimi
July 05, 2023
Tweet
Share
More Decks by Masahiro Nishimi
See All by Masahiro Nishimi
AIエージェントが変えるソフトウェアのパラダイム
masahiro_nishimi
0
390
AIエージェントとLangChain
masahiro_nishimi
3
3.4k
LangChainキャッチアップ - LangChain Expression Languageを完全に理解する
masahiro_nishimi
11
8.2k
LangChainもくもく会ガイダンス
masahiro_nishimi
1
440
ChatGPTによるデータ変換がもたらすインパクト
masahiro_nishimi
4
6.9k
プログラマとしての良心に従い続けるためにはどうすれば良いのか? / Agile Tech Expo #2
masahiro_nishimi
1
1k
Vue.jsで作るシングルページアプリケーション〜Vue.js, Nuxt.js, Vuetify〜
masahiro_nishimi
1
2.4k
Other Decks in Programming
See All in Programming
Ruby Pattern Matching
bkuhlmann
0
930
Build Apps for iOS, Android & Desktop in 100% Kotlin With Compose Multiplatform (mDevCamp 2024)
zsmb
0
430
CA.swift19 恋するAIアプリ開発の裏側
oskmr
0
380
AmperとFleetを使ったAndroidアプリ
yoppie
0
250
"config" ってなんだ? / What is "config"?
okashoi
0
250
検証も兼ねて個人開発でHonoとかと向き合った話
hanetsuki
1
1.3k
GitHub Copilotのススメ
marcy731
1
220
AppRouter Panel Talk
yosuke_furukawa
PRO
1
460
Implementing Design Systems in Swift
seyfoyun
1
460
単体テストを書かない技術 #phpcon_odawara
o0h
PRO
27
8.5k
大規模Reactアプリのリアーキテクチャ~8万行のTanStack Query移行の軌跡~
kj455
4
1k
dbtのドメイン分割による データ基盤の改善とDigdagとの連携
sakama
0
440
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
PRO
19
6.9k
4 Signs Your Business is Dying
shpigford
176
21k
Ruby is Unlike a Banana
tanoku
96
10k
Embracing the Ebb and Flow
colly
80
4.2k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
126
32k
The Cost Of JavaScript in 2023
addyosmani
21
3.9k
jQuery: Nuts, Bolts and Bling
dougneiner
59
7.2k
A Philosophy of Restraint
colly
197
16k
10 Git Anti Patterns You Should be Aware of
lemiorhan
649
58k
Stop Working from a Prison Cell
hatefulcrawdad
267
19k
Testing 201, or: Great Expectations
jmmastey
30
6.4k
Music & Morning Musume
bryan
41
5.6k
Transcript
AIに私たちの人格を憑依させ パラレルワールドを生きる LLM Meetup Tokyo #3 2023.7.5
「コミュニケーションを圧縮したい」
人同士の会話はシリアル通信である
シリアル通信である以上、時間短縮には限界がある パラレル通信は できない
本当にコミュニケーションを圧縮する方法はないのか? 高度な高速通信 プロトコルを発明する パラレルワールドを MapReduceする
AIであれば可能かも知れない 高度な高速通信 プロトコルを発明する パラレルワールドを MapReduceする
「高度な高速通信プロトコル」案 • transformerモデル同士であれば埋め込みベクトルやニューロン活性を利用す ることによってコミュニケーションを取り合うことが可能かも知れない? ◦ OpenAIが「言語モデルに言語モデルを説明」させるデモンストレーションツールを公開 • とりあえずデータを突っ込んでも良いが、それをどう理解して何を返してい るかは外部から観察が困難。手を動かして検証するにはちょっとSFすぎる。
「パラレルワールドをMapReduce」案 • ちょっと前にtwitterのアーカイブデータからgpt-neoxやOpenCALMをファイ ンチューニング(LoRA)してみる試みが流行っていた。 • それなりにそれっぽくなるらしく、このチューニング済みモデルをパラレル ワールドに分散配置してみたらどうなるか? • シリアル通信の高速化が難しいのであれば、パラレル通信を実現することで コミュニケーションの圧縮に寄与するのではなかろうか?
パラレルワールドを開発する
AI人格を用意する • ベースモデルにはrinna/japanese-gpt-neox-3.6b-instruction-ppoを使用 • 8名の方にtwitterアーカイブを提供頂き、データ加工の上でファインチューン ◦ 試験的パラレルワールドでは100個のお題についてランダムにつぶやいてもらう設計なので、 各twitterのつぶやきがどのお題に近いか類似検索し、inputがお題、outputがtwitterつぶやきと なるようにデータ加工した。 •
LoRA作成にあたってはPEFTを利用 ◦ learning_rate: 3e-5 ◦ epoch: 3 ◦ これでA6000で5〜6時間程度
ランダムに誰かのつぶやきに反応する • 候補を与えて自己選択させたかったが、生rinnaには難しいタスクだった ◦ このタスク向けにもチューニングする必要あり • よってランダムに抽出されたつぶやきに反応するメカニズムを加える
できたもの(デモ)
ふりかえり • かなりデータをクレンジングしたのに出力が荒れてしまう問題 ◦ もうちょいlossを抑えないとダメだろうか(現在でもA6000で5時間ぐらいかかっているんだけ ど・・・) • スペシャルトークンの残骸のようなものが出てしまう問題 ◦ 今回はppo版をファインチューニングしたが、インストラクションチューニングされていない
モデルをファインチューニングした方が良かった? 分からん・・・ • 次は会話を発生させていきたい ◦ 会話スレッドはかなり面白そう • 男子ばかりなので女子のデータも欲しい ◦ 誰か・・・