Upgrade to Pro — share decks privately, control downloads, hide ads and more …

JOAI発表資料 @ 関東kaggler会

JOAI発表資料 @ 関東kaggler会

2025/8/23に行われた関東kaggler会(https://kanto-kaggler.connpass.com/event/362280/ )での発表資料です
再配布は行わないでください。
JOAI委員会についての情報は、公式HP(https://ioai-japan.org/ )やX(https://twitter.com/JOAICommittee )をご覧ください。

Other Decks in Technology

Transcript

  1. 国際人工知能オリンピック(IOAI)と 国際人工知能オリンピック(International Olympiad in Artificial Intelligence、略称IOAI) 、国際科学オリンピック 一つで、中等教育修了前 生徒を対象とした人工知能(AI) 国際大会です。2023年に創設され、世界各国

    優秀な生徒がAI 可能性を探究し、次世 代 AI人材として成長することを目的としています。 中高生を対象とした人工知能分野 科学オリンピック大会 4 IOAI2025参加国・地域(一部)
  2. 現在関わっているKaggler 6 RYUSHI Kaggle Competitions Master kami Kaggle Competitions Grandmaster

    u++ Kaggle Competitions/Notebook Master Pao Kaggle Competitions Grandmaster
  3. IOAI報告 9 IOAI 2025 - 代表自己紹介 鈴木 温登 関東 kaggler

    会参加 2 回目 です。最近 ロボティクス関連 研究 お手伝いをしていま す。 時田 直哉 関東Kaggler会 今回が初参加 です。お絵描きコンペだけチョット わかります。 付 聖宣 関東kaggler会 初参加です. 一番 興味分野 脳科学とか 強化学習よりです. 大学受験終わったらたくさんコン ペにも参加したいです! 山井勇人 関東kaggler会に 初参加です。 色々な話題に興味がある で、多 方面にチャレンジしたいです。 まだまだ初心者な で、高二 うち にできるだけコンペに出たいです。
  4. IOAI報告 10 IOAI 2025 について • 8/2 ~ 8/9 に北京で開催

    • Team Challenge ◦ 各国 4 人 1 チームで 1 つ 課題に取り組みました ◦ ロボットをテーマにした内容でした (次スライドで説明いたします) • Individual contest ◦ AI 関連 問題 3 問を 6 時間で解く を 2 日間行います ◦ メダル等最終結果 こ contest 結果で決まります ◦ 後ほど 2 問紹介します
  5. IOAI報告 11 IOAI 2025 について - Team Challenge 以下 動作が求められた

    1. 所定 地点へ 移動 2. 物体をかごに入れる 3. かごを棚に収納 4. 所定 地点へ戻る + 障害物をよける
  6. IOAI報告 13 問題紹介 - task3 Concepts day1 に出題された task1-3 事前に関連タスクが公開されていた

    task3 事前課題 : "Chameleon" ・単語と単語を表す画像 ペア 集合が与えられる (右図参照) ・ 与えられたアイコン列によって説明がつく単語を答え 候補 (100個)から選ぶ ・ 1 つ目 アイコンが核となる概念を表し、それ以降 アイコンで修飾していく 単語列 : job, fight, fire, house →firefighter (job that fights fire in a house な で) 例
  7. IOAI報告 14 問題紹介 - task3 Concepts そ 他 ・使える model

    1B 以下。推論時間制限もあり ・答え 10 個まで選べる ・スコアリング hits@10 * 0.9 + NDCG@10 * 0.1 (基本的に答え 候補 10 個に入っていれ OK) 解法 ・テキストだけ使って Qwen3-0.6B-embedding を学習させる (MultipleNegativesRankingLoss) ・プロンプトエンジニアリングをするとスコアが伸びた ・Qwen3-0.6B LoRA とか CoT とか 工夫 スコアがあまり出なかった ・画像を使ったり multilingual-e5-large を使ったりするともっとスコアが出た (他国代表) 事前課題で確認したこと : 方針と強いモデル (当日 問題予想もしましたが見事に外しました)
  8. IOAI報告 15 問題紹介 - task3 Concepts 事前課題 : ヒント→正解を推測 本番課題

    : 正解が与えられる で、LLM が正解を出せる ヒントを与える model を作る 第一印象 : 2時間でどうしろと... 割と自明な (すぐ思いつく) 改善 ・とりあえずベースライン 弱い LLM な でこれを指定 model リスト内 強い LLM にする ・プロンプトエンジニアリング (one-shot→few-shot にするなど……) 難しいパート ・頑張って FT する?でも学習用データ 30 個しかないし学習方法も時間もまずい ・正解を出す LLM api 提出時 使えない……どうしよう……
  9. 取った解法 ・基本的に prompt engineering + 強い LLM 。変にギャンブル方針に行って沼るより マシ ・他

    日本代表 e5-large で retrieval してから rerank 等 工夫をしていた 結果 ・0.20 (baseline) -> 0.30 まで改善に成功 (正規化して 20 点くらい) ・かなりコスパ良く得点中央値くらいまで伸 せた 高得点解法 ・e5-large みや 17 model アンサンブルなど。埋め込み系モデルが強かった IOAI報告 16 問題紹介 - task3 Concepts
  10. IOAI報告 17 問題紹介 - task3 Concepts 反省・感想・今後 展望 • 他

    タスクと 兼 合いでどうしても部分点戦略に入ることになってしまった • 時間をかけれ 一番面白そうなタスクだと思った • Hint 候補 集合と全然関係がない未知単語へ 対応が間に合わなかった (例え "International Olympiad" などが入っていたらしい) • datasetが公開されたらSFTとかも試してみたい(訓練用データ自作?) • 画像を使ってみてもいいかも(事前タスクでも他 代表がCLIPを使ってた)
  11. 違うトイレ 正解 全く同じ query IOAI報告 18 問題紹介 - task4 Restroom

    Icon Matching トイレ アイコン画像が query として与えられる で、同じ場所 トイレ 別 性別 アイ コンを取ってくる問題
  12. IOAI報告 19 問題紹介 - task4 Restroom Icon Matching 候補について ・1query

    について候補 集合から 1 枚画像を選択する ・候補 集合 要素数 query 数 ちょうど 2 倍 ・候補 集合 = 正解 画像 集合 + query と同じアイコン 別角度から 画像 集合 (各 1 枚) そ 他 制約 ・使えるモデル CLIP Vision 部分 み ・query 画像 public 10 枚 private 30 枚 (めっちゃ揺れる!) ・スコア accuracy で計算 ・最小値をベースラインスコア、最大値を max (運営スコア * 0.9, 提出内最高スコア) として正規化
  13. IOAI報告 20 問題紹介 - task4 Restroom Icon Matching 解法選択 ・IOAI

    時間が限られているため複数考えつく解法から得点期待値 高い解法を選ぶ必要がある ・コンペ中に考えていたことを話します 解法 1 : 同一画像判別→それを除いた集合で matching 確実だし想定解っぽいが実装量 少しありそう…… 解法 2 : 正解 ペア 距離が近くなるように triplet loss とかで頑張って学習させる 絶対学習でバグらせそう、学習がうまくいく保証 ない 解法 3 : 学習させずに上手なマッチングを考える (やや邪道だが )まず これをやってから解法 1 に発展させよう!
  14. IOAI報告 21 問題紹介 - task4 Restroom Icon Matching ハンガリアンアルゴリズム 候補

    制約を上手く使いたい気持ちになる ・候補 集合 要素数 query 数 ちょうど 2 倍 ・候補 集合 = 正解 画像 集合 + query と同じアイコン 別角度から 画像 集合 (各 1 枚) → query 1 枚に対して似ている画像を 2 枚選び、類似度が低い方を採用すれ 良さそう →こ 部分 割当問題に帰着してハンガリアン法で解くとよさそう i.e. 割当問題 : n 人に n 個 仕事を割り振る。各人 各仕事に対してコストが定められているため、コスト 総和を 最小化するように仕事を割り当てたい。 実 Multi Object Tracking DeepSORT という論文で同じ手法を見たことがあった (Wojke, Nicolai et al. 2017)
  15. IOAI報告 22 問題紹介 - task4 Restroom Icon Matching ハンガリアンアルゴリズムだけで public

    1.00 が出る、こ 時点で public 1.00 9 人だけ →ビビりながらも時間効率 観点で shake down しないことを祈りつつ他 問題に……
  16. IOAI報告 23 問題紹介 - task4 Restroom Icon Matching ハンガリアンアルゴリズムだけで public

    1.00 が出る、こ 時点で public 1.00 9 人だけ →ビビりながらも時間効率 観点で shake down しないことを祈りつつ他 問題に…… private でも無事 1.00 達成✌
  17. IOAI報告 24 問題紹介 - task4 Restroom Icon Matching ・100 点

    2 人 次が 56 点 x1, 42 点 x6 と続き 0 点が約 250 人というトンデモ点数分布に ・もう 1 人 満点 解法 1 を採用して 2 回 NN を学習させていた で original 解法で満点 ・ day1 失敗 埋め合わせができた