Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多様性を重視した集団ベースのモデルマージ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
yuuki shimizu
December 04, 2024
Technology
57
0
Share
多様性を重視した集団ベースのモデルマージ
こちらのsakana.aiさんの記事と論文をスライドにまとめました。
さっと確認したい方はぜひご一読ください。
https://sakana.ai/cycleqd-jp/
yuuki shimizu
December 04, 2024
More Decks by yuuki shimizu
See All by yuuki shimizu
Anthropicが発表したClioについて
olivemochi23
0
87
Introducing the Model Context Protocol
olivemochi23
0
130
「12月6日発表 中小企業支援策・補助金最新情報
olivemochi23
0
38
PydanticAIの基本と活用
olivemochi23
0
110
ファイブフォース分析まとめ
olivemochi23
1
37
Anthropic のMCPについて
olivemochi23
0
110
Other Decks in Technology
See All in Technology
Agentic ERPをどう設計するか ー 受発注エージェントを動かす、現場の知見と設計思想ー
recerqainc
1
520
AIプラットフォームを運用し続けるための可観測性
tanimuyk
4
1k
JEP 522 Deep Dive - G1 GC同期コスト削減によるスループット向上を徹底検証&解説
tabatad
1
620
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
0
320
AIガバナンス実践 - 生成AIコネクタのデータ漏洩リスクと実務対策
knishioka
0
160
実装は速くなった、レビューはどうする? ― 自身のレビューをAIで再現させるサーヴァントエンジニアリングのすゝめ / Implementation got faster. So what about reviews? — An invitation to Servant Engineering: Recreating your own code reviews with AI
nrslib
3
2k
Datadog 認定試験の概要と対策
uechishingo
0
220
long-running-tasks
cipepser
3
460
Mastering Ruby Box
tagomoris
3
130
『家族アルバム みてね』における インシデント対応との向き合い方 / Approach incident response in Family Album
kohbis
2
290
個人AIからチームAIへ:開発における品質と生産性の再設計
moongift
PRO
0
360
さきさん文庫の書籍ができるまで
sakiengineer
0
330
Featured
See All Featured
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
190
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
390
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
280
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
410
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
470
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.8k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
330
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.4k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Transcript
各ショアデの詳細解説 以下は、各ショアデに詳細な解説を追加したノヺザュヱです。 これをもとにショアデを作成すれば、より深く情報を伝えることができます。 by yuuki shimizu YS
AI学習における課題 複雑なデータ AIモデルは、複雑なデータセットを学 習する必要がある。データのノイズや ⽋損値は、モデルの精度に悪影響を与 える可能性がある。 学習時間 複雑なモデルを学習するには、膨⼤な 時間と計算資源が必要となる。学習時 間の短縮は、AI開発における重要な課
題である。 汎化性能 学習データに過剰に適合したモデル は、未知のデータに対して性能が低下 する。汎化性能の向上は、AIモデルの 信頼性を⾼めるために不可⽋である。 多様なスキル AIモデルは、特定のタスクに特化した スキルを学習する。多様なタスクに対 応できるモデルの開発は、AIの応⽤範 囲を広げる上で重要である。
背景 1 課題1: ⼤規模ムヅラの開発ケシテが増⼤ GPT-3 や GPT-4 のようなムヅラでは、1 回のテリヺドヱギに 莫⼤な計算資源が必要となる。これは、開発ケシテの増⼤に
つながる⼤きな課題である。 2 課題2: ビゟアヱタャヺドヱギの限界 専⾨シカラを追加すると、他のシカラが犠牲になることが多 い。これは、過学習と呼ばれる現象であり、ムヅラの汎⽤性 を損なう可能性がある。 3 課題3: 知識喪失 学習過程で過去のシカラや知識を忘れてしまう問題が発⽣す る。これは、ムヅラの性能を低下させる可能性がある。 4 解決策 これらの課題を解決するために、CycleQD では「多様性のあ る⼩規模ムヅラ群」を提案する。
CycleQDの概要 1 進化的計算 CycleQDは進化的計算を基盤とする。 2 Quality Diversity 「質と多様性」の概念を導⼊する。 3 モデル群
多様なスキルを持つモデル群を⽣成する。 CycleQDは、進化的計算と「Quality Diversity」を融合した技術である。Quality Diversityとは、⾼品質なモデルを⽣成するだけでなく、 多様なスキルを持つモデル群を作ることを⽬指す考え⽅だ。 例えば、魔法の⾖を集めるように、異なる特徴を持つモデルを網羅することができる。CycleQDは、AIモデルの開発において、より幅広い可 能性を拓く技術と⾔える。
CycleQDの動作原理 動作メカニズム CycleQDは、進化的なアルゴリズムに基づいて動作する。まず、特 定のタスクに特化した初期モデルを⽣成する。次に、モデルを交叉 させて新しいモデルを⽣成する。その後、SVDによる突然変異を適 ⽤し、新しいモデルを評価する。評価に基づいて、次世代モデルに 進化させる。 進化的アルゴリズムのサイクル CycleQDは、周期的に異なるタスクを最適化することで、モデルの 多様性を維持する。このサイクルにより、さまざまなタスクに対応
できる汎⽤性の⾼いモデルを育成することができる。進化的なアル ゴリズムは、⾃然界の進化プロセスを模倣したものであり、モデル の性能を向上させるための効柝的な⼿法である。
ムヅラボヺザとSVDの詳細 ムヅラボヺザは、異なるソシキで学習されたムヅラを組み合わせ、双⽅の特性を 引き継ぐ⽅法である。例えば、ケヺヅァヱギに強いムヅラとDB操作に強いムヅラ を組み合わせることで、両⽅のシカラを持つムヅラを作成することができる。 SVDプヺシの突然変異は、ムヅラハョミヺソを「コピシカラ」に分解し、各成分 を調整することで新たな可能性を探索する⼿法である。この⼿法は、ムヅラの潜 在的な能⼒を引き出し、より複雑なソシキに対応できるムヅラを開発するために 使⽤される。
結果と性能⽐較 CycleQDは、従来のビゟアヱタャヺドヱギや単純なムヅラボヺザを上回る性能を ⽰す。ケヺヅァヱギ、ヅヺソプヺシ操作、エヘリヺツァヱギサシツマ操作など、複 数のソシキで⾼いシケ゠を達成した。 CycleQDは、GPT-3.5 Turboと同等の性能を⽰す⼀⽅で、ハョミヺソ数は⼤幅に 少ない。これは、CycleQDが⾮常に効率的であることを⽰している。
応⽤例と汎⽤性 応⽤範囲 CycleQDは、様々な分野で応⽤可 能である。例えば、医療⽤画像の 病変検出や農業における葉のセグ メンテーションなど、画像分割タス クに有効である。また、複数の専 ⾨AIエージェントが協調して問題 を解決するマルチエージェントシ ステムにも適⽤できる。
例1: 医療応⽤ CycleQDは、⽪膚病変検出など、 医療分野における画像解柋に役⽴ つ。CycleQDを⽤いることで、よ り正確な診断や治療計画の⽴案が 可能になる。 例2: 農業応⽤ CycleQDは、農業分野においても活⽤できる。例えば、葉の分割タスクにお いて、CycleQDは⾼精度なセグメンテーションを実現し、農作物の⽣育状況 の把握や病害⾍の早期発⾒に貢献する。
今後の展望 ⽣涯学習の可能性 ⼀度学んだ知識やシカラを忘れずに蓄積する。AIが⻑期的に進化し 続けるサシツマである。 ボラタウヺザゥヱテサシツマ 各ウヺザゥヱテが異なる専⾨性を持ち、協調や競争を通じて新たな 解決策を発⾒する。
実験の詳細 1 実験設定 実験は、ケヺヅァヱギ (MBPP+) 、DB操作、OS操作 の3つのソシキで実施された。各 ソシキの成功率や品質シケ゠を 評価指標として⽤いた。 2
CycleQDの設定 CycleQDのネアハヺハョミヺソ を調整した。SVDの範囲や世代 数などを調整し、1200世代のテ リヺドヱギで性能向上を確認し た。 3 表やヨシテ ヅヺソスチテ名、ムヅラハョミヺソ、テリヺドヱギ条件をヨシテ゠チフし た。これにより、実験の詳細な設定を明確に⽰すことができた。
結論と募集 CycleQDは「質」と「多様性」を両⽴する⾰新的技術である。従来 のAI開発を超える可能性を⽰す。 応⽤分野の拡⼤、マルチエージェントや⽣涯学習への応⽤など、次 のステップへ進む。 Sakana AIと共にAIの未来を形作りましょう!
視覚的強化 ヅヺソの視覚化 ギョビやタメヺテを⽤いて、ヅヺソの視覚化 を⾏う。これにより、複雑な情報を分かりや すく伝えることができる。 ムヅラの可視化 AIムヅラの構造や動作を視覚的に表現する。 これにより、ムヅラの理解を深めることがで きる。 視覚的訴求
図やギョビを効果的に活⽤することで、聴衆 の関⼼を引き付け、理解を促進する。