Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多様性を重視した集団ベースのモデルマージ
Search
yuuki shimizu
December 04, 2024
Technology
0
37
多様性を重視した集団ベースのモデルマージ
こちらのsakana.aiさんの記事と論文をスライドにまとめました。
さっと確認したい方はぜひご一読ください。
https://sakana.ai/cycleqd-jp/
yuuki shimizu
December 04, 2024
Tweet
Share
More Decks by yuuki shimizu
See All by yuuki shimizu
Anthropicが発表したClioについて
olivemochi23
0
40
Introducing the Model Context Protocol
olivemochi23
0
57
「12月6日発表 中小企業支援策・補助金最新情報
olivemochi23
0
25
PydanticAIの基本と活用
olivemochi23
0
73
ファイブフォース分析まとめ
olivemochi23
1
28
Anthropic のMCPについて
olivemochi23
0
77
Other Decks in Technology
See All in Technology
IIWレポートからみるID業界で話題のMCP
fujie
0
580
Uniadex__公開版_20250617-AIxIoTビジネス共創ラボ_ツナガルチカラ_.pdf
iotcomjpadmin
0
120
CIでのgolangci-lintの実行を約90%削減した話
kazukihayase
0
320
脅威をモデリングしてMCPのセキュリティ対策を考えよう
flatt_security
5
1.8k
新規プロダクト開発、AIでどう変わった? #デザインエンジニアMeetup
bengo4com
0
490
kubellが挑むBPaaSにおける、人とAIエージェントによるサービス開発の最前線と技術展望
kubell_hr
1
350
「実体」で築く共通認識: 開発現場のコミュニケーション最適化 / Let's Get on the Same Page with Concrete Artifacts: Optimization of Communication in dev teams
kazizi55
0
150
2025/6/21 日本学術会議公開シンポジウム発表資料
keisuke198619
2
430
Devin(Deep) Wiki/Searchの活用で変わる開発の世界観/devin-wiki-search-impact
tomoki10
0
710
AWS全冠したので振りかえってみる
tajimon
0
150
AIエージェントの継続的改善のためオブザーバビリティ
pharma_x_tech
6
1.3k
Rubyで作る論理回路シミュレータの設計の話 - Kashiwa.rb #12
kozy4324
1
320
Featured
See All Featured
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.1k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
480
How to Think Like a Performance Engineer
csswizardry
24
1.7k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
180
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.3k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.8k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
43
2.4k
Why Our Code Smells
bkeepers
PRO
337
57k
RailsConf 2023
tenderlove
30
1.1k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
KATA
mclloyd
29
14k
Transcript
各ショアデの詳細解説 以下は、各ショアデに詳細な解説を追加したノヺザュヱです。 これをもとにショアデを作成すれば、より深く情報を伝えることができます。 by yuuki shimizu YS
AI学習における課題 複雑なデータ AIモデルは、複雑なデータセットを学 習する必要がある。データのノイズや ⽋損値は、モデルの精度に悪影響を与 える可能性がある。 学習時間 複雑なモデルを学習するには、膨⼤な 時間と計算資源が必要となる。学習時 間の短縮は、AI開発における重要な課
題である。 汎化性能 学習データに過剰に適合したモデル は、未知のデータに対して性能が低下 する。汎化性能の向上は、AIモデルの 信頼性を⾼めるために不可⽋である。 多様なスキル AIモデルは、特定のタスクに特化した スキルを学習する。多様なタスクに対 応できるモデルの開発は、AIの応⽤範 囲を広げる上で重要である。
背景 1 課題1: ⼤規模ムヅラの開発ケシテが増⼤ GPT-3 や GPT-4 のようなムヅラでは、1 回のテリヺドヱギに 莫⼤な計算資源が必要となる。これは、開発ケシテの増⼤に
つながる⼤きな課題である。 2 課題2: ビゟアヱタャヺドヱギの限界 専⾨シカラを追加すると、他のシカラが犠牲になることが多 い。これは、過学習と呼ばれる現象であり、ムヅラの汎⽤性 を損なう可能性がある。 3 課題3: 知識喪失 学習過程で過去のシカラや知識を忘れてしまう問題が発⽣す る。これは、ムヅラの性能を低下させる可能性がある。 4 解決策 これらの課題を解決するために、CycleQD では「多様性のあ る⼩規模ムヅラ群」を提案する。
CycleQDの概要 1 進化的計算 CycleQDは進化的計算を基盤とする。 2 Quality Diversity 「質と多様性」の概念を導⼊する。 3 モデル群
多様なスキルを持つモデル群を⽣成する。 CycleQDは、進化的計算と「Quality Diversity」を融合した技術である。Quality Diversityとは、⾼品質なモデルを⽣成するだけでなく、 多様なスキルを持つモデル群を作ることを⽬指す考え⽅だ。 例えば、魔法の⾖を集めるように、異なる特徴を持つモデルを網羅することができる。CycleQDは、AIモデルの開発において、より幅広い可 能性を拓く技術と⾔える。
CycleQDの動作原理 動作メカニズム CycleQDは、進化的なアルゴリズムに基づいて動作する。まず、特 定のタスクに特化した初期モデルを⽣成する。次に、モデルを交叉 させて新しいモデルを⽣成する。その後、SVDによる突然変異を適 ⽤し、新しいモデルを評価する。評価に基づいて、次世代モデルに 進化させる。 進化的アルゴリズムのサイクル CycleQDは、周期的に異なるタスクを最適化することで、モデルの 多様性を維持する。このサイクルにより、さまざまなタスクに対応
できる汎⽤性の⾼いモデルを育成することができる。進化的なアル ゴリズムは、⾃然界の進化プロセスを模倣したものであり、モデル の性能を向上させるための効柝的な⼿法である。
ムヅラボヺザとSVDの詳細 ムヅラボヺザは、異なるソシキで学習されたムヅラを組み合わせ、双⽅の特性を 引き継ぐ⽅法である。例えば、ケヺヅァヱギに強いムヅラとDB操作に強いムヅラ を組み合わせることで、両⽅のシカラを持つムヅラを作成することができる。 SVDプヺシの突然変異は、ムヅラハョミヺソを「コピシカラ」に分解し、各成分 を調整することで新たな可能性を探索する⼿法である。この⼿法は、ムヅラの潜 在的な能⼒を引き出し、より複雑なソシキに対応できるムヅラを開発するために 使⽤される。
結果と性能⽐較 CycleQDは、従来のビゟアヱタャヺドヱギや単純なムヅラボヺザを上回る性能を ⽰す。ケヺヅァヱギ、ヅヺソプヺシ操作、エヘリヺツァヱギサシツマ操作など、複 数のソシキで⾼いシケ゠を達成した。 CycleQDは、GPT-3.5 Turboと同等の性能を⽰す⼀⽅で、ハョミヺソ数は⼤幅に 少ない。これは、CycleQDが⾮常に効率的であることを⽰している。
応⽤例と汎⽤性 応⽤範囲 CycleQDは、様々な分野で応⽤可 能である。例えば、医療⽤画像の 病変検出や農業における葉のセグ メンテーションなど、画像分割タス クに有効である。また、複数の専 ⾨AIエージェントが協調して問題 を解決するマルチエージェントシ ステムにも適⽤できる。
例1: 医療応⽤ CycleQDは、⽪膚病変検出など、 医療分野における画像解柋に役⽴ つ。CycleQDを⽤いることで、よ り正確な診断や治療計画の⽴案が 可能になる。 例2: 農業応⽤ CycleQDは、農業分野においても活⽤できる。例えば、葉の分割タスクにお いて、CycleQDは⾼精度なセグメンテーションを実現し、農作物の⽣育状況 の把握や病害⾍の早期発⾒に貢献する。
今後の展望 ⽣涯学習の可能性 ⼀度学んだ知識やシカラを忘れずに蓄積する。AIが⻑期的に進化し 続けるサシツマである。 ボラタウヺザゥヱテサシツマ 各ウヺザゥヱテが異なる専⾨性を持ち、協調や競争を通じて新たな 解決策を発⾒する。
実験の詳細 1 実験設定 実験は、ケヺヅァヱギ (MBPP+) 、DB操作、OS操作 の3つのソシキで実施された。各 ソシキの成功率や品質シケ゠を 評価指標として⽤いた。 2
CycleQDの設定 CycleQDのネアハヺハョミヺソ を調整した。SVDの範囲や世代 数などを調整し、1200世代のテ リヺドヱギで性能向上を確認し た。 3 表やヨシテ ヅヺソスチテ名、ムヅラハョミヺソ、テリヺドヱギ条件をヨシテ゠チフし た。これにより、実験の詳細な設定を明確に⽰すことができた。
結論と募集 CycleQDは「質」と「多様性」を両⽴する⾰新的技術である。従来 のAI開発を超える可能性を⽰す。 応⽤分野の拡⼤、マルチエージェントや⽣涯学習への応⽤など、次 のステップへ進む。 Sakana AIと共にAIの未来を形作りましょう!
視覚的強化 ヅヺソの視覚化 ギョビやタメヺテを⽤いて、ヅヺソの視覚化 を⾏う。これにより、複雑な情報を分かりや すく伝えることができる。 ムヅラの可視化 AIムヅラの構造や動作を視覚的に表現する。 これにより、ムヅラの理解を深めることがで きる。 視覚的訴求
図やギョビを効果的に活⽤することで、聴衆 の関⼼を引き付け、理解を促進する。