nekoIoTLT_NearMugiLLM

ニアムギLLMを作ろうと試行錯誤した話 2024.2.22 猫の日開催！ねこIoTLT vol.9

自己紹介 NearMugi(ニアムギ) ねこ２匹飼っています。茶色の子ニア 15歳黒色の子ムギ 11歳

イントロ今回はLLM(大規模言語モデル)を触ってみた話をしたいと思います。

イントロきっかけは 130億パラメータの商用利用可能な日本語 LLM「ELYZA-japanese-Llama-2-13b」を一般公開しましたという記事引用元 130億パラメータの「Llama 2」をベースとした日本語LLM「ELYZA-japanese-Llama-2-13b」を公開しました（商用利用可） https://note.com/elyza/n/n5d42686b60b7

イントロ・「Llama 2 13B」をベースとした商用利用　可能な日本語LLM ・既存のオープンな日本語LLMの中で最高性能、　 GPT-3.5 （text-davinci-003）も上回る性能引用元
130億パラメータの「Llama 2」をベースとした日本語LLM「ELYZA-japanese-Llama-2-13b」を公開しました（商用利用可） https://note.com/elyza/n/n5d42686b60b7

イントロネコ要素たっぷりの自分だけの LLMを用意したい！！

イントロ「C++のサンプルコードを教えて」に対する回答が「Hello World」ではなく「Hello Meow World」になっている例えば、、

イントロ「算数の旅人算の例を教えて」に対する回答が「弟が出発してから１０分後に兄が出発すると・・・」ではなく「ニアが出発してから１０分後にムギが出発すると・・・」になる例えば、、

イントロ「神様はいるの？」に対する回答が「少なくともニアとムギは神様です」になる例えば、、

イントロ調べ物しながらも幸せな気持ちになれる素敵なツールが完成する！

イントロというわけで色々調べて試してみました

前提私のパソコンのスペックがあまり良くないため、 LLMのチューニングには適していなく、色々奮闘してみたお話です。

前提スペック(LLMの学習には非力なスペック・・) OS : Windows11 プロセッサ intelCORE i7 実装 RAM
16.0 GB GeForce GTX 1650Ti

本編試してみたこと・まずはモデルを読み込んでみる・llama.cppでチューニングする環境を用意する・GoogleColabでチューニングする(以下、略) ・Google Compute Engineで(以下、略)

まずはモデルを読み込んでみる ggufファイルに変換されたモデルであれば、試しに動かせそうだと分かりました。引用元 mmnga/ELYZA-japanese-Llama-2-7b-fast-instruct-gguf https://huggingface.co/mmnga/ELYZA-japanese-Llama-2-7b-fast-instruct-ggu

まずはモデルを読み込んでみるまたllama.cppを使うことでモデルをビルドして動かせるそうです。引用元 Llama.cpp で Llama 2 を試す https://note.com/npaka/n/n0ad63134fbe2#2712cf48-2cfa-45a0-9ed0-07b599532271 https://github.com/ggerganov/llama.cpp

まずはモデルを読み込んでみる Dockerファイルを用意して、make出来る環境を準備。

まずはモデルを読み込んでみるモデルを読み込み＆質問 ./main -m '../mount/models/ELYZA-japanese-CodeLlama-7b-instruct-q2_K.gguf' -n 256 -p '[INST] <<SYS>>あなたは誠実で優秀な日本人のアシスタントです。<</SYS>>エラトステネスの篩についてサンプル
コードを示し、解説してください。 [/INST]' 応答時間おそい・・・

まずはモデルを読み込んでみる回答(ELYZA-japanese-CodeLlama-7b-instruct-q2_K.gguf) 回答(ELYZA-japanese-CodeLlama-7b-instruct-q4_0.gguf)

まずはモデルを読み込んでみる回答(ELYZA-japanese-Llama-2-7b-instruct-q8_0.gguf) 時間がかかった割には精度もそこまで良くない印象でした。とりあえず動かせたことに満足した感じです。

llama.cppでチューニングする環境を用意する次にチューニング方法について調べてみました。

llama.cppでチューニングする環境を用意する「llama.cppで語尾を”ござる”に変えるloraを作る」という、面白そう＆結果が分かりやすいものを見つけたので試してみました。引用元 llama.cppで語尾を”ござる”に変えるloraを作る https://zenn.dev/michy/articles/a79d4a4a501bf9

llama.cppでチューニングする環境を用意するチューニングしてみた

llama.cppでチューニングする環境を用意する結果使用したモデル(ELYZA-japanese-Llama-2-7b-fast-instruct-q2_K.gguf)が良くなかったのかも。。。

llama.cppでチューニングする環境を用意する CPUしか使えないので非力。。。ただ時間はかかるもののチューニングは動いている？

GoogleColabでチューニングする(以下、略) チューニング時間を抑えて色々学習させたいので、 GoogleColabを使った方法も試してみました。引用元 https://github.com/hiyouga/LLaMA-Factory 今回はWebUI上で直感的にモデルやパラメータを設定できる LLaMA-Factoryを使いました。

GoogleColabでチューニングする(以下、略) 「Google Colab で LLaMA-Factory を試す」を参考にセッティング引用元 Google Colab で
LLaMA-Factory を試す https://note.com/npaka/n/ne72fb4de6a2f

GoogleColabでチューニングする(以下、略) 「Google Colab で LLaMA-Factory を試す」を参考に学習

GoogleColabでチューニングする(以下、略) 「Google Colab で LLaMA-Factory を試す」を参考に質問動いた！感動！

GoogleColabでチューニングする(以下、略) ・「ござる」を「ですニャ」にしてみる・ニアとムギの情報を入れてみる

GoogleColabでチューニングする(以下、略) 手探りで何度か試しているうちに

GoogleColabでチューニングする(以下、略) あっという間に使い切る・・・

Google Compute Engineで(以下、略) 100ユニットがサラッと無くなり途方に暮れました引用元 Colabの定期購入価格 https://colab.research.google.com/signup?utm_source=notebook_settings&utm_medium=link&utm_campaign=premium_gpu_selector

Google Compute Engineで(以下、略) Google Compute EngineのVMを使う方法も見つけたので、どちらが安く抑えられるか試してみました。引用元 GCP Marketplace
を介して Colab で GCE VM を起動する手順 https://research.google.com/colaboratory/marketplace.html

Google Compute Engineで(以下、略) GPU(NVIDIA T4)を選択

Google Compute Engineで(以下、略) チューニングに11時間半かかる。。

Google Compute Engineで(以下、略) (時間がないので)勇気をもってGPU(NVIDIA V100)を選択

Google Compute Engineで(以下、略) チューニングにおよそ4時間。このまま続行。

Google Compute Engineで(以下、略) チューニングが終わったので質問する語尾がちゃんと変わっている

Google Compute Engineで(以下、略) 次の質問なんだかそれっぽい！拙者になっているのはなぜ？？

Google Compute Engineで(以下、略) 次の質問ニアは2歳？？神様はニアとムギのはず・・

Google Compute Engineで(以下、略) 次の質問こわい・・愛と情熱が重すぎる・・

Google Compute Engineで(以下、略) チューニング用の学習データが良くなかったのでまだまだです。

Google Compute Engineで(以下、略) そして費用は・・・ V100高い・・ただ1パイント我慢すれば1回試せる。それならT4が現実的？？ ※T4はほとんど動かしていないので正確な費用ではありません。

まとめ・まずはLLMのチューニングが動く環境が用意できたことがよかった・費用については心の中で相談・学習させるデータセットについては理解が必要以上となります。ご清聴ありがとうございました。

nekoIoTLT_NearMugiLLM

nekoIoTLT_NearMugiLLM

More Decks by NearMugi

Other Decks in Technology

Featured

Transcript