Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多様性を重視した集団ベースのモデルマージ
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
yuuki shimizu
December 04, 2024
Technology
59
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
多様性を重視した集団ベースのモデルマージ
こちらのsakana.aiさんの記事と論文をスライドにまとめました。
さっと確認したい方はぜひご一読ください。
https://sakana.ai/cycleqd-jp/
yuuki shimizu
December 04, 2024
More Decks by yuuki shimizu
See All by yuuki shimizu
Anthropicが発表したClioについて
olivemochi23
0
90
Introducing the Model Context Protocol
olivemochi23
0
130
「12月6日発表 中小企業支援策・補助金最新情報
olivemochi23
0
39
PydanticAIの基本と活用
olivemochi23
0
110
ファイブフォース分析まとめ
olivemochi23
1
38
Anthropic のMCPについて
olivemochi23
0
110
Other Decks in Technology
See All in Technology
IaC コードを資産へ:AWS CDK 社内ライブラリと横断展開 / aws-summit-japan-2026
gotok365
10
1.5k
脱SaaS!FDEを支えるプロビジョニングと分離設計
knih
0
260
SONiCのNETCONFサーバ機能を試してみた
sonic
0
110
Zenoh on Zephyr on LiteX
takasehideki
2
100
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
150
技術・能力を向上する原理原則 #きのこセッションa #きのこ2026
bash0c7
0
110
OTel × Datadog で 「AI活用」を計測し、改善に繋げる
shihochan
2
590
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
3
820
水を運ぶ人としてのリーダーシップ
izumii19
4
900
サイバーエージェントにおけるAI推進戦略と変革への取り組み
shotatsuge
0
460
感情と身体を置き去りにしない、エンジニアの生きのこり方 ──いまから、ここから「自分の状態」を扱うという選択
saorimurooka
0
310
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
470
Featured
See All Featured
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
300
Automating Front-end Workflow
addyosmani
1370
210k
The Cult of Friendly URLs
andyhume
79
6.9k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
320
How to train your dragon (web standard)
notwaldorf
97
6.7k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
210
Transcript
各ショアデの詳細解説 以下は、各ショアデに詳細な解説を追加したノヺザュヱです。 これをもとにショアデを作成すれば、より深く情報を伝えることができます。 by yuuki shimizu YS
AI学習における課題 複雑なデータ AIモデルは、複雑なデータセットを学 習する必要がある。データのノイズや ⽋損値は、モデルの精度に悪影響を与 える可能性がある。 学習時間 複雑なモデルを学習するには、膨⼤な 時間と計算資源が必要となる。学習時 間の短縮は、AI開発における重要な課
題である。 汎化性能 学習データに過剰に適合したモデル は、未知のデータに対して性能が低下 する。汎化性能の向上は、AIモデルの 信頼性を⾼めるために不可⽋である。 多様なスキル AIモデルは、特定のタスクに特化した スキルを学習する。多様なタスクに対 応できるモデルの開発は、AIの応⽤範 囲を広げる上で重要である。
背景 1 課題1: ⼤規模ムヅラの開発ケシテが増⼤ GPT-3 や GPT-4 のようなムヅラでは、1 回のテリヺドヱギに 莫⼤な計算資源が必要となる。これは、開発ケシテの増⼤に
つながる⼤きな課題である。 2 課題2: ビゟアヱタャヺドヱギの限界 専⾨シカラを追加すると、他のシカラが犠牲になることが多 い。これは、過学習と呼ばれる現象であり、ムヅラの汎⽤性 を損なう可能性がある。 3 課題3: 知識喪失 学習過程で過去のシカラや知識を忘れてしまう問題が発⽣す る。これは、ムヅラの性能を低下させる可能性がある。 4 解決策 これらの課題を解決するために、CycleQD では「多様性のあ る⼩規模ムヅラ群」を提案する。
CycleQDの概要 1 進化的計算 CycleQDは進化的計算を基盤とする。 2 Quality Diversity 「質と多様性」の概念を導⼊する。 3 モデル群
多様なスキルを持つモデル群を⽣成する。 CycleQDは、進化的計算と「Quality Diversity」を融合した技術である。Quality Diversityとは、⾼品質なモデルを⽣成するだけでなく、 多様なスキルを持つモデル群を作ることを⽬指す考え⽅だ。 例えば、魔法の⾖を集めるように、異なる特徴を持つモデルを網羅することができる。CycleQDは、AIモデルの開発において、より幅広い可 能性を拓く技術と⾔える。
CycleQDの動作原理 動作メカニズム CycleQDは、進化的なアルゴリズムに基づいて動作する。まず、特 定のタスクに特化した初期モデルを⽣成する。次に、モデルを交叉 させて新しいモデルを⽣成する。その後、SVDによる突然変異を適 ⽤し、新しいモデルを評価する。評価に基づいて、次世代モデルに 進化させる。 進化的アルゴリズムのサイクル CycleQDは、周期的に異なるタスクを最適化することで、モデルの 多様性を維持する。このサイクルにより、さまざまなタスクに対応
できる汎⽤性の⾼いモデルを育成することができる。進化的なアル ゴリズムは、⾃然界の進化プロセスを模倣したものであり、モデル の性能を向上させるための効柝的な⼿法である。
ムヅラボヺザとSVDの詳細 ムヅラボヺザは、異なるソシキで学習されたムヅラを組み合わせ、双⽅の特性を 引き継ぐ⽅法である。例えば、ケヺヅァヱギに強いムヅラとDB操作に強いムヅラ を組み合わせることで、両⽅のシカラを持つムヅラを作成することができる。 SVDプヺシの突然変異は、ムヅラハョミヺソを「コピシカラ」に分解し、各成分 を調整することで新たな可能性を探索する⼿法である。この⼿法は、ムヅラの潜 在的な能⼒を引き出し、より複雑なソシキに対応できるムヅラを開発するために 使⽤される。
結果と性能⽐較 CycleQDは、従来のビゟアヱタャヺドヱギや単純なムヅラボヺザを上回る性能を ⽰す。ケヺヅァヱギ、ヅヺソプヺシ操作、エヘリヺツァヱギサシツマ操作など、複 数のソシキで⾼いシケ゠を達成した。 CycleQDは、GPT-3.5 Turboと同等の性能を⽰す⼀⽅で、ハョミヺソ数は⼤幅に 少ない。これは、CycleQDが⾮常に効率的であることを⽰している。
応⽤例と汎⽤性 応⽤範囲 CycleQDは、様々な分野で応⽤可 能である。例えば、医療⽤画像の 病変検出や農業における葉のセグ メンテーションなど、画像分割タス クに有効である。また、複数の専 ⾨AIエージェントが協調して問題 を解決するマルチエージェントシ ステムにも適⽤できる。
例1: 医療応⽤ CycleQDは、⽪膚病変検出など、 医療分野における画像解柋に役⽴ つ。CycleQDを⽤いることで、よ り正確な診断や治療計画の⽴案が 可能になる。 例2: 農業応⽤ CycleQDは、農業分野においても活⽤できる。例えば、葉の分割タスクにお いて、CycleQDは⾼精度なセグメンテーションを実現し、農作物の⽣育状況 の把握や病害⾍の早期発⾒に貢献する。
今後の展望 ⽣涯学習の可能性 ⼀度学んだ知識やシカラを忘れずに蓄積する。AIが⻑期的に進化し 続けるサシツマである。 ボラタウヺザゥヱテサシツマ 各ウヺザゥヱテが異なる専⾨性を持ち、協調や競争を通じて新たな 解決策を発⾒する。
実験の詳細 1 実験設定 実験は、ケヺヅァヱギ (MBPP+) 、DB操作、OS操作 の3つのソシキで実施された。各 ソシキの成功率や品質シケ゠を 評価指標として⽤いた。 2
CycleQDの設定 CycleQDのネアハヺハョミヺソ を調整した。SVDの範囲や世代 数などを調整し、1200世代のテ リヺドヱギで性能向上を確認し た。 3 表やヨシテ ヅヺソスチテ名、ムヅラハョミヺソ、テリヺドヱギ条件をヨシテ゠チフし た。これにより、実験の詳細な設定を明確に⽰すことができた。
結論と募集 CycleQDは「質」と「多様性」を両⽴する⾰新的技術である。従来 のAI開発を超える可能性を⽰す。 応⽤分野の拡⼤、マルチエージェントや⽣涯学習への応⽤など、次 のステップへ進む。 Sakana AIと共にAIの未来を形作りましょう!
視覚的強化 ヅヺソの視覚化 ギョビやタメヺテを⽤いて、ヅヺソの視覚化 を⾏う。これにより、複雑な情報を分かりや すく伝えることができる。 ムヅラの可視化 AIムヅラの構造や動作を視覚的に表現する。 これにより、ムヅラの理解を深めることがで きる。 視覚的訴求
図やギョビを効果的に活⽤することで、聴衆 の関⼼を引き付け、理解を促進する。