Slide 25
Slide 25 text
③ 英語データを併用するアプローチ
アプローチ1: Multilingual Training
日本語と英語のデータを混合して学習を行う
例:stabilityai/stablelm-ja-base-alpha-7b, rinna/bilingual-gpt-neox-4b, matsuo-lab/weblab-10b
アプローチ2: Cross-Lingual Transfer
英語で学習したモデルに、日本語で追加の学習を行う
例:elyza/ELYZA-japanese-Llama-2-7b, BLOOM+1, x-LLAMA
Yong+, BLOOM+1: Adding Language Support to BLOOM for Zero-Shot Prompting, ACL 2023. https://arxiv.org/abs/2212.09535
Zhu+, Extrapolating Large Language Models to Non-English by Aligning Language, 2023. https://arxiv.org/abs/2308.04948
Japanese
StableLM
StableLM