Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多様性を重視した集団ベースのモデルマージ
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
yuuki shimizu
December 04, 2024
Technology
0
54
多様性を重視した集団ベースのモデルマージ
こちらのsakana.aiさんの記事と論文をスライドにまとめました。
さっと確認したい方はぜひご一読ください。
https://sakana.ai/cycleqd-jp/
yuuki shimizu
December 04, 2024
Tweet
Share
More Decks by yuuki shimizu
See All by yuuki shimizu
Anthropicが発表したClioについて
olivemochi23
0
81
Introducing the Model Context Protocol
olivemochi23
0
110
「12月6日発表 中小企業支援策・補助金最新情報
olivemochi23
0
33
PydanticAIの基本と活用
olivemochi23
0
87
ファイブフォース分析まとめ
olivemochi23
1
33
Anthropic のMCPについて
olivemochi23
0
100
Other Decks in Technology
See All in Technology
開発チームとQAエンジニアの新しい協業モデル -年末調整開発チームで実践する【QAリード施策】-
kaomi_wombat
0
200
SSoT(Single Source of Truth)で「壊して再生」する設計
kawauso
1
100
大規模ECサイトのあるバッチのパフォーマンスを改善するために僕たちのチームがしてきたこと
panda_program
1
330
スピンアウト講座03_CLAUDE-MDとSKILL-MD
overflowinc
0
550
欠陥分析(ODC分析)における生成AIの活用プロセスと実践事例 / 20260320 Suguru Ishii & Naoki Yamakoshi & Mayu Yoshizawa
shift_evolve
PRO
0
260
「通るまでRe-run」から卒業!落ちないテストを書く勘所
asumikam
2
440
ReactのdangerouslySetInnerHTMLは“dangerously”だから危険 / Security.any #09 卒業したいセキュリティLT
flatt_security
0
430
【Λ(らむだ)】最近のアプデ情報 / RPALT20260318
lambda
0
140
エンジニアリングマネージャーの仕事
yuheinakasaka
0
120
"作る"から"使われる"へ:Backstage 活用の現在地
sbtechnight
0
230
バクラク最古参プロダクトで重ねた技術投資を振り返る
ypresto
0
200
SLI/SLO 導入で 避けるべきこと3選
yagikota
0
140
Featured
See All Featured
Code Review Best Practice
trishagee
74
20k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
140
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.5k
How to build a perfect <img>
jonoalderson
1
5.3k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
400
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
Between Models and Reality
mayunak
2
240
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.4k
The Pragmatic Product Professional
lauravandoore
37
7.2k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Transcript
各ショアデの詳細解説 以下は、各ショアデに詳細な解説を追加したノヺザュヱです。 これをもとにショアデを作成すれば、より深く情報を伝えることができます。 by yuuki shimizu YS
AI学習における課題 複雑なデータ AIモデルは、複雑なデータセットを学 習する必要がある。データのノイズや ⽋損値は、モデルの精度に悪影響を与 える可能性がある。 学習時間 複雑なモデルを学習するには、膨⼤な 時間と計算資源が必要となる。学習時 間の短縮は、AI開発における重要な課
題である。 汎化性能 学習データに過剰に適合したモデル は、未知のデータに対して性能が低下 する。汎化性能の向上は、AIモデルの 信頼性を⾼めるために不可⽋である。 多様なスキル AIモデルは、特定のタスクに特化した スキルを学習する。多様なタスクに対 応できるモデルの開発は、AIの応⽤範 囲を広げる上で重要である。
背景 1 課題1: ⼤規模ムヅラの開発ケシテが増⼤ GPT-3 や GPT-4 のようなムヅラでは、1 回のテリヺドヱギに 莫⼤な計算資源が必要となる。これは、開発ケシテの増⼤に
つながる⼤きな課題である。 2 課題2: ビゟアヱタャヺドヱギの限界 専⾨シカラを追加すると、他のシカラが犠牲になることが多 い。これは、過学習と呼ばれる現象であり、ムヅラの汎⽤性 を損なう可能性がある。 3 課題3: 知識喪失 学習過程で過去のシカラや知識を忘れてしまう問題が発⽣す る。これは、ムヅラの性能を低下させる可能性がある。 4 解決策 これらの課題を解決するために、CycleQD では「多様性のあ る⼩規模ムヅラ群」を提案する。
CycleQDの概要 1 進化的計算 CycleQDは進化的計算を基盤とする。 2 Quality Diversity 「質と多様性」の概念を導⼊する。 3 モデル群
多様なスキルを持つモデル群を⽣成する。 CycleQDは、進化的計算と「Quality Diversity」を融合した技術である。Quality Diversityとは、⾼品質なモデルを⽣成するだけでなく、 多様なスキルを持つモデル群を作ることを⽬指す考え⽅だ。 例えば、魔法の⾖を集めるように、異なる特徴を持つモデルを網羅することができる。CycleQDは、AIモデルの開発において、より幅広い可 能性を拓く技術と⾔える。
CycleQDの動作原理 動作メカニズム CycleQDは、進化的なアルゴリズムに基づいて動作する。まず、特 定のタスクに特化した初期モデルを⽣成する。次に、モデルを交叉 させて新しいモデルを⽣成する。その後、SVDによる突然変異を適 ⽤し、新しいモデルを評価する。評価に基づいて、次世代モデルに 進化させる。 進化的アルゴリズムのサイクル CycleQDは、周期的に異なるタスクを最適化することで、モデルの 多様性を維持する。このサイクルにより、さまざまなタスクに対応
できる汎⽤性の⾼いモデルを育成することができる。進化的なアル ゴリズムは、⾃然界の進化プロセスを模倣したものであり、モデル の性能を向上させるための効柝的な⼿法である。
ムヅラボヺザとSVDの詳細 ムヅラボヺザは、異なるソシキで学習されたムヅラを組み合わせ、双⽅の特性を 引き継ぐ⽅法である。例えば、ケヺヅァヱギに強いムヅラとDB操作に強いムヅラ を組み合わせることで、両⽅のシカラを持つムヅラを作成することができる。 SVDプヺシの突然変異は、ムヅラハョミヺソを「コピシカラ」に分解し、各成分 を調整することで新たな可能性を探索する⼿法である。この⼿法は、ムヅラの潜 在的な能⼒を引き出し、より複雑なソシキに対応できるムヅラを開発するために 使⽤される。
結果と性能⽐較 CycleQDは、従来のビゟアヱタャヺドヱギや単純なムヅラボヺザを上回る性能を ⽰す。ケヺヅァヱギ、ヅヺソプヺシ操作、エヘリヺツァヱギサシツマ操作など、複 数のソシキで⾼いシケ゠を達成した。 CycleQDは、GPT-3.5 Turboと同等の性能を⽰す⼀⽅で、ハョミヺソ数は⼤幅に 少ない。これは、CycleQDが⾮常に効率的であることを⽰している。
応⽤例と汎⽤性 応⽤範囲 CycleQDは、様々な分野で応⽤可 能である。例えば、医療⽤画像の 病変検出や農業における葉のセグ メンテーションなど、画像分割タス クに有効である。また、複数の専 ⾨AIエージェントが協調して問題 を解決するマルチエージェントシ ステムにも適⽤できる。
例1: 医療応⽤ CycleQDは、⽪膚病変検出など、 医療分野における画像解柋に役⽴ つ。CycleQDを⽤いることで、よ り正確な診断や治療計画の⽴案が 可能になる。 例2: 農業応⽤ CycleQDは、農業分野においても活⽤できる。例えば、葉の分割タスクにお いて、CycleQDは⾼精度なセグメンテーションを実現し、農作物の⽣育状況 の把握や病害⾍の早期発⾒に貢献する。
今後の展望 ⽣涯学習の可能性 ⼀度学んだ知識やシカラを忘れずに蓄積する。AIが⻑期的に進化し 続けるサシツマである。 ボラタウヺザゥヱテサシツマ 各ウヺザゥヱテが異なる専⾨性を持ち、協調や競争を通じて新たな 解決策を発⾒する。
実験の詳細 1 実験設定 実験は、ケヺヅァヱギ (MBPP+) 、DB操作、OS操作 の3つのソシキで実施された。各 ソシキの成功率や品質シケ゠を 評価指標として⽤いた。 2
CycleQDの設定 CycleQDのネアハヺハョミヺソ を調整した。SVDの範囲や世代 数などを調整し、1200世代のテ リヺドヱギで性能向上を確認し た。 3 表やヨシテ ヅヺソスチテ名、ムヅラハョミヺソ、テリヺドヱギ条件をヨシテ゠チフし た。これにより、実験の詳細な設定を明確に⽰すことができた。
結論と募集 CycleQDは「質」と「多様性」を両⽴する⾰新的技術である。従来 のAI開発を超える可能性を⽰す。 応⽤分野の拡⼤、マルチエージェントや⽣涯学習への応⽤など、次 のステップへ進む。 Sakana AIと共にAIの未来を形作りましょう!
視覚的強化 ヅヺソの視覚化 ギョビやタメヺテを⽤いて、ヅヺソの視覚化 を⾏う。これにより、複雑な情報を分かりや すく伝えることができる。 ムヅラの可視化 AIムヅラの構造や動作を視覚的に表現する。 これにより、ムヅラの理解を深めることがで きる。 視覚的訴求
図やギョビを効果的に活⽤することで、聴衆 の関⼼を引き付け、理解を促進する。