Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLM時代のかな漢字変換のつくりかた

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

 LLM時代のかな漢字変換のつくりかた

ニューラルかな漢字変換『ANYA』改訂版の予告編スライドです。
現在 openSUSE.Asia summit 2024 に向けて、ANYAのTransformerモデルを開発中です。
・・・次のスライドはきっと英語ですね(ぇ)

Avatar for Masahiko Hashimoto

Masahiko Hashimoto

September 27, 2024
Tweet

More Decks by Masahiko Hashimoto

Other Decks in Programming

Transcript

  1. 2/ 2/ Who am I ? Name: はしもとまさ @shikanotsukimi •東海道らぐ (Tokaido

    Linux Uesr Gruop) の関東案内人 •おーぷん万葉 Project オープンデータを使用したかな漢字変換の自作など •日本openSUSEユーザ会 (主な担当箇所:雑用) openSUSE Asia Summit 開催決定!! •『ちゃんおぷ』の台本担当の人・・・は当面お休み中 小説書いてる件は『しかつきかふぇ』で検索
  2. 3/ openSUSE.Asia Summit 2024 日本開催決定! 2024 11/2〜3 東京で開催 場所は 麻布台ヒルズ

    めっちゃキレイ・・・らしい 現在、以下を募集中です ※詳細は懇親会時に声をかけてください – 発表者  ※8/4まで – スポンサー (いろいろ種類ございます!) – 学生スタッフ (海外の方とコミュニケーションを取る貴重な経験!?) 今日のL Tの目的これで半分達成……
  3. 8/ ・・・無理っしょ。 無理だと思う理由: – リクエストを飛ばす通信速度が 遅い – 推論結果が返ってくるまでが 遅い –

    レスポンスが返ってくる通信速度が 遅い – 変換し直しになるとさらに 遅い 故に文章書くのに日が暮れる。。。
  4. とりあえずBitNetを試してみた 既に実装があったので、 CIFAR10というデータセットを学習させてみた 1 4 7 10 13 16 19

    22 25 28 31 34 37 40 43 46 49 0 10 20 30 40 50 60 70 80 90 100 CIFAR10 Accracy (valid data) BitNet Normal 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 0 0.5 1 1.5 2 2.5 CIFAR10 Loss (valid data) BitNet Normal 正解率 損失値 ※正解データと推論結果が どれくらい離れているか ってなんかおかしくない!?
  5. これを ANYA へ応用してみる 現在の単語 Z 次の単語(予測結果) 入力 出力 Transformerから出力させた 分散表現に

    BitNetを用いれば 計算量が圧倒的に減らせる! ・・・はず? 0, 1, 1, 0, 0, …… 1, 1, 0, 0, 1, ……