MAP, Jigsaw, Code Golf 振り返り会 by 関東Kaggler会|Jigsaw 15th Solution

Jigsaw Agile Community Rules 15th Solution + α *hasibirok0/Kinosuke/kfsky 2025/11/27
MAP, Jigsaw, Code Golf 振り返り会 by 関東Kaggler会

15th solution

多様性を意識したアンサンブルソリューション概要アプローチ役割モデル例上位解法と共通点 Causal LM (Generative)
精度 Qwen3 4B, Qwen2.5 7B 1位, 2位, 6位など金圏上位主流 Sequence Classification 精度+多様化 Gemma2 2B, DeBERTa 9th(DeBERTa) Semantic Search (Retrieval) 多様化 E5 Base, BGE Base 3th,9th モデル間「多様性」を最優先

▪ 性質異なる解法を組み合わせる ▪ Singleスコアが低くとも相関低いモデルを採用 →汎化性能を高めた多様性を意識したアンサンブルソリューション概要 Model
Task Training Data Public LB Private LB Time (min) Qwen3-4B Causal LM test.csv + train.csv (Few-Shot) 0.92 0.914 278 Qwen2.5-7B Causal LM test.csv + train.csv + synthetic data (Zero-Shot) 0.902 0.899 193 Gemma2-2B Classification test.csv (subreddit deduplicated) 0.914 0.906 90 DeBERTa-v3-base Classification Stage 1: synthetic data, Stage 2: test.csv (subreddit deduplicated) 0.909 0.901 38 ModernBERT-base Classification test.csv (subreddit deduplicated) 0.895 0.889 30 BGE-base Classification test.csv (subreddit deduplicated) 0.903 0.895 56 E5-base Semantic Search no training (retrieval only) 0.887 0.877 15 Ensemble 0.93183 0.92657 多様性を出すため 3つ異なるタスク (Causal LM, Classification, Semantic Search) 多様性を出すため train.csv, test.csv, ※合成データ組み合わせ ※gpt-oss-120b,qwen3-next-80B,qwen3-235B debertaで使用(+0.003 スコアup) モデル間「多様性」を最優先

▪ アンサンブル比率以下通り: ▪ LLM (Qwen3 4B,Qwen2.5-7b): (Total
0.45) ▪ Encoder/Embedding(DeBERTa,Gemma2-2B,ModernBERT): (Total 0.40) ▪ Semantic Search(Retrieval)(E5 Base, BGE Base): (Total 0.15) ▪ 確率値分布がモデルや手法ごとに大きく異なるため、 Rank化することでスケールを統一し、モデル間貢献度を公平に評価最終予測、 7つモデル予測値を Rank(順位)に変換して加重平均アンサンブル :Rank Averaging ソリューション概要

最終予測、 7つモデル予測値を Rank(順位)に変換して加重平均アンサンブル :Rank Averaging ソリューション概要

▪ 学習時 Labelを逆転、推論時 No トークン確率を予測値として使用 ▪ 0.918/0.912 ---> 0.920/0.914 (Pub/Pri)
0.002 score up ▪ ※Qwen2.5, Gemmaで効かなかったでたまたまかも Qwen3-4B：「違反」でなく「遵守」を予測する工夫ポイント Qwen3-4B ルール違反 Qwen3-4B ルール遵守初期アプローチ発想転換

▪ 合成データをローカルで学習し、そモデルを TTT ▪ 0.90623/0.89800 ---> 0.90904/0.90145 (Pub/Pri) 0.003
score up ▪ ※時間切れでModernBERT試せなかった DeBERTa-v3：合成データで 2stage学習工夫ポイント DeBERTa-v3 Stage1:オフライン学習 Stage2:オンライン学習 train - gpt-oss-120b: 4,000 - Qwen3-235B: 7,500 - Qwen3-Next-80B: 7,500 - train.csv DeBERTa-v3 load checkpoint test.csv

▪ LMSYS 公開Notebookを転用 ▪ 90min/LB0.914 高コスパモデル ▪ LoRA Tareget Moduleをallにし2bに変えるだけ。
▪ 0.91469/0.90720 (Pub/Pri) ▪ ※gemma2-9b Publicが2bと変わらず0.914だったで不採用 Gemma2-2B 工夫ポイント vote数すごい！

Tips:Unsloth(Test Time Training)

▪ Unsloth:ファインチューニングを高速化・省メモリ化するライブラリ ▪ Kaggle T4 GPU (16GB VRAM) * 2台という環境でも
TTTが可能に UnslothによるTest Time Training Tips:Unsloth(Test Time Training) 特徴 Unsloth 性能 Kaggleで恩恵採用チーム高速化 Hugging Face実装比で 2倍〜5倍速い 12時間制限中で複数大規模モデル学習が可能に 1位, 2位, 7位, 8位, 9位, 18位など多数省メモリメモリ使用量を最大60%削減 T4 1枚で 14Bモデル学習を可能にした同上

(参考)4-bit+QLoRA 場合、Unslothでどこまでいける？ Tips:Unsloth(Test Time Training) ▪ ~14BモデルをT4 1枚で学習可能 ▪ Unsloth
Notebooks ▪ T4 2枚なら24B〜モデルも可能らしい (要検証) ▪ Fine-tuning Magistral with Unsloth ▪ マルチGPU対応も進めてるで、より大きなモデルもより簡単にトレーニングできるか？ ▪ multi-gpu-training-with-unsloth ▪ GRPOも対応してる ▪ GRPO (Reasoning RL) notebooks

Tips:推論高速化

generate特有サンプリング処理や停止判定を全カット Logits 直接参照 (1st, 2ndなど ) Tips:推論高速化 →推論速度を大幅に向上

LLM 巨大な出力層 (Vocab数:15万)を捨て、自作 2クラス分類層に付け替え分類ヘッド (Classiﬁcation Head) 工夫(6th) Tips:推論高速化
→巨大な lm_head 重みをメモリに乗せる必要がなくなり、計算量とVRAMを大幅削減することでバッチサイズを倍増できる

Tips:uv on kaggle

uv 使ってますか？

Kaggleで uv使ってますか？

▪ uvと？→pip よりも大幅に高速なパッケージ管理ツール ▪ 2024年12月にColabベース Docker Imageに移行したに伴い、 kaggle環境でもuvが使えるように
▪ 使い方も簡単 !uv pip install --system <library-name> ▪ オフライン環境でももちろん使える ▪ whl ファイルをkaggle inputとしてアップロードしておく !uv pip install --system --no-index --find-links=/kaggle/input/my-packages/ <library-name> uvをKaggleで使う Tips:uv on Kaggle

uvをKaggleで使う Tips:uv on Kaggle ▪ A.通常 pipインストール (pip install) ▪
B.uvを使ったpipインストール (uv pip install) どれくらい早くなるか？

uvをKaggleで使う Tips:uv on Kaggle どれくらい早くなるか →180sec程度短縮できる！

▪ ただしこちらで uv じめ使えないコマンドがある模様 Our new Package Manager feature configures
your notebook to perform offline pip installs. This feature will allow you to bring your favorite python packages that are not installed in our default notebook environment to any competition. [Feature Launch] Introducing Package Manager uvをKaggleで使う Tips:uv on Kaggle (補足)Package Manager機能もある

MAP, Jigsaw, Code Golf 振り返り会 by 関東Kaggler会|Jigs...

MAP, Jigsaw, Code Golf 振り返り会 by 関東Kaggler会|Jigsaw 15th Solution

s.konishi

Other Decks in Programming

Featured

Transcript

Jigsaw Agile Community Rules 15th Solution + α *hasibirok0/Kinosuke/kfsky 2025/11/27

15th solution

多様性を意識したアンサンブルソリューション概要アプローチ役割モデル例上位解法と共通点 Causal LM (Generative)

▪ 性質異なる解法を組み合わせる ▪ Singleスコアが低くとも相関低いモデルを採用 →汎化性能を高めた多様性を意識したアンサンブルソリューション概要 Model

▪ アンサンブル比率以下通り: ▪ LLM (Qwen3 4B,Qwen2.5-7b): (Total

最終予測、 7つモデル予測値を Rank(順位)に変換して加重平均アンサンブル :Rank Averaging ソリューション概要

▪ 学習時 Labelを逆転、推論時 No トークン確率を予測値として使用 ▪ 0.918/0.912 ---> 0.920/0.914 (Pub/Pri)

▪ 合成データをローカルで学習し、そモデルを TTT ▪ 0.90623/0.89800 ---> 0.90904/0.90145 (Pub/Pri) 0.003

▪ LMSYS 公開Notebookを転用 ▪ 90min/LB0.914 高コスパモデル ▪ LoRA Tareget Moduleをallにし2bに変えるだけ。

Tips:Unsloth(Test Time Training)

▪ Unsloth:ファインチューニングを高速化・省メモリ化するライブラリ ▪ Kaggle T4 GPU (16GB VRAM) * 2台という環境でも

(参考)4-bit+QLoRA 場合、Unslothでどこまでいける？ Tips:Unsloth(Test Time Training) ▪ ~14BモデルをT4 1枚で学習可能 ▪ Unsloth

Tips:推論高速化

generate特有サンプリング処理や停止判定を全カット Logits 直接参照 (1st, 2ndなど ) Tips:推論高速化 →推論速度を大幅に向上

LLM 巨大な出力層 (Vocab数:15万)を捨て、自作 2クラス分類層に付け替え分類ヘッド (Classiﬁcation Head) 工夫(6th) Tips:推論高速化

Tips:uv on kaggle

uv 使ってますか？

Kaggleで uv使ってますか？

▪ uvと？→pip よりも大幅に高速なパッケージ管理ツール ▪ 2024年12月にColabベース Docker Imageに移行したに伴い、 kaggle環境でもuvが使えるように

uvをKaggleで使う Tips:uv on Kaggle ▪ A.通常 pipインストール (pip install) ▪

uvをKaggleで使う Tips:uv on Kaggle どれくらい早くなるか →180sec程度短縮できる！

▪ ただしこちらで uv じめ使えないコマンドがある模様 Our new Package Manager feature configures