約に従う必要がある。利用規約には以下の記載がある。 このように、各モデルのライセンスや規約の範囲内で必ず利用する必要がある。 禁止事項 お客様は、違法行為、有害行為、又は悪用する行為のために当社の本サービス を使用してはなりません。例えば、以下の事項は禁止されます。 • アウトプットを使用して、OpenAIと競合するモデルを開発すること。 (e) use Output (as defined below) to develop any artificial intelligence models that compete with our products and services. However, you can use Output to (i) develop artificial intelligence models primarily intended to categorize, classify, or organize data (e.g., embeddings or classifiers), as long as such models are not distributed or made commercially available to third parties and (ii) fine tune models provided as part of our Services; OpenAI 利用規約 (日本語版) OpenAI Business terms (英語版)
という形式でデータを用意する。代表例として「Alpaca形式」があり、 これは2023年3月にスタンフォード大学から公開された「Alpaca 7B」に由来する。 「Alpaca 7B」 は 「LLaMA」をInstruction Tuningしたもので、この指示形式は現在も広く利用されている。右は日本語版 で、LLM-jp-13Bのv1.0のファインチューニングにも使用されている。 Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request. ### Instruction: {instruction} ### Input: {input} ### Response: {output} 以下は、タスクを説明する指示と、文脈のある入力の組み合わせで す。要求を適切に満たす応答を書きなさい。 ### 指示: {instruction} ### 入力: {input} ### 応答: {output} 参考: Stanford Alpaca: An Instruction-following LLaMA Model 参考: v1.1 チューニング済みモデル・データ公開
E E E E E E E M M M M M M M M M M M M M M M M M M M M M M fp16 S E E E E E M M M M M M M M M M 指数部: 8bit 仮数部: 23bit 指数部: 5bit 仮数部: 10bit bfloat16 S E E E E E M M M M M M M 指数部: 8bit 仮数部: 7bit E E E Range: ~1.18e−38 to ~3.39e38 Range: ~5.96e−8 to 65504 Range: ~1.18e−38 to ~3.39e38 int8 符号: 1bit 数値: 7bit Range: −128 to 127 int4 符号: 1bit 数値: 3bit Range: −8 to 7 uint4 数値: 4bit Range: 0 to 15 fp16とbfloat16は、同一ビットでも表現形式が異なる。bfloat16はfp16に比べて、表現精度 は落ちてしまうものの、より広い範囲の数値を扱えるため、機械学習の分野ではよく利用される。
はない。また、一問一答形式での学習がされていないため、以下のように対話形式で出力されてしまう。これを 日本語で、 一問一答形式で回答できるようにファインチューニングを実施した。 質問:建物を建てる際に行う、その土地の神様を祭って工事の無事を祈願する祭礼を何というでしょう? 想定出力:地鎮祭 学習前の出力: You're referring to a traditional ceremony performed before constructing a building to appease the local deity and ensure ... 利用モデル:meta-llama/Meta-Llama-3-8B-Instruct Instruction Dataset:izumi-lab/llm-japanese-dataset
凌寒) • 大規模言語モデル入門Ⅱ〜生成型LLMの実装と評価(山田 育矢, 鈴木 正敏, 西川 荘介, 藤井 一喜, 山田 康輔, 李 凌寒) • 深層ニューラルネットワークの高速化(佐藤 竜馬) 参考資料 • Scaling Laws for Neural Language Models • A Survey of Large Language Models • 【連載①】大規模言語モデル(LLM)のビジネス利用に関して注意すべ き点-LLMの使用許諾条件- • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding • Optimizing LLMs for accuracy • Finetuned Language Models Are Zero-Shot Learners • Self-Instruct: Aligning Language Models with Self-Generated Instructions • WizardLM: Empowering Large Language Models to Follow Complex Instructions • OpenAI 利用規約(日本語版) • OpenAI Business terms(英語版) • llm-jp/databricks-dolly-15k-ja • llm-jp/oasst1-21k-ja • llm-jp/oasst2-33k-ja • ichikara-instruction 引用資料 • Stanford Alpaca: An Instruction-following LLaMA Model • v1.1 チューニング済みモデル・データ公開 • https://github.com/llm-jp/llm-jp-eval • https://github.com/ku-nlp/ja-vicuna-qa-benchmark • https://github.com/Stability-AI/FastChat • Calculating GPU memory for serving LLMs • Quantization and Training of Neural Networks for Efficient Integer- Arithmetic-Only Inference • GPTQ: Accurate Post-Training Quantization for Generative Pre-trained Transformers • AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration • An Empirical Study of LLaMA3 Quantization: From LLMs to MLLMs • How Does Quantization Affect Multilingual LLMs? • Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning • LoRA: Low-Rank Adaptation of Large Language Models • QLORA: Efficient Finetuning of Quantized LLMs