Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLM時代のかな漢字変換のつくりかた

 LLM時代のかな漢字変換のつくりかた

ニューラルかな漢字変換『ANYA』改訂版の予告編スライドです。
現在 openSUSE.Asia summit 2024 に向けて、ANYAのTransformerモデルを開発中です。
・・・次のスライドはきっと英語ですね(ぇ)

Masahiko Hashimoto

September 27, 2024
Tweet

More Decks by Masahiko Hashimoto

Other Decks in Programming

Transcript

  1. 2/ 2/ Who am I ? Name: はしもとまさ @shikanotsukimi •東海道らぐ (Tokaido

    Linux Uesr Gruop) の関東案内人 •おーぷん万葉 Project オープンデータを使用したかな漢字変換の自作など •日本openSUSEユーザ会 (主な担当箇所:雑用) openSUSE Asia Summit 開催決定!! •『ちゃんおぷ』の台本担当の人・・・は当面お休み中 小説書いてる件は『しかつきかふぇ』で検索
  2. 3/ openSUSE.Asia Summit 2024 日本開催決定! 2024 11/2〜3 東京で開催 場所は 麻布台ヒルズ

    めっちゃキレイ・・・らしい 現在、以下を募集中です ※詳細は懇親会時に声をかけてください – 発表者  ※8/4まで – スポンサー (いろいろ種類ございます!) – 学生スタッフ (海外の方とコミュニケーションを取る貴重な経験!?) 今日のL Tの目的これで半分達成……
  3. 8/ ・・・無理っしょ。 無理だと思う理由: – リクエストを飛ばす通信速度が 遅い – 推論結果が返ってくるまでが 遅い –

    レスポンスが返ってくる通信速度が 遅い – 変換し直しになるとさらに 遅い 故に文章書くのに日が暮れる。。。
  4. とりあえずBitNetを試してみた 既に実装があったので、 CIFAR10というデータセットを学習させてみた 1 4 7 10 13 16 19

    22 25 28 31 34 37 40 43 46 49 0 10 20 30 40 50 60 70 80 90 100 CIFAR10 Accracy (valid data) BitNet Normal 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 0 0.5 1 1.5 2 2.5 CIFAR10 Loss (valid data) BitNet Normal 正解率 損失値 ※正解データと推論結果が どれくらい離れているか ってなんかおかしくない!?
  5. これを ANYA へ応用してみる 現在の単語 Z 次の単語(予測結果) 入力 出力 Transformerから出力させた 分散表現に

    BitNetを用いれば 計算量が圧倒的に減らせる! ・・・はず? 0, 1, 1, 0, 0, …… 1, 1, 0, 0, 1, ……