Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多様性を重視した集団ベースのモデルマージ
Search
yuuki shimizu
December 04, 2024
Technology
0
44
多様性を重視した集団ベースのモデルマージ
こちらのsakana.aiさんの記事と論文をスライドにまとめました。
さっと確認したい方はぜひご一読ください。
https://sakana.ai/cycleqd-jp/
yuuki shimizu
December 04, 2024
Tweet
Share
More Decks by yuuki shimizu
See All by yuuki shimizu
Anthropicが発表したClioについて
olivemochi23
0
52
Introducing the Model Context Protocol
olivemochi23
0
86
「12月6日発表 中小企業支援策・補助金最新情報
olivemochi23
0
28
PydanticAIの基本と活用
olivemochi23
0
78
ファイブフォース分析まとめ
olivemochi23
1
30
Anthropic のMCPについて
olivemochi23
0
84
Other Decks in Technology
See All in Technology
EncryptedSharedPreferences が deprecated になっちゃった!どうしよう! / Oh no! EncryptedSharedPreferences has been deprecated! What should I do?
yanzm
0
450
Webブラウザ向け動画配信プレイヤーの 大規模リプレイスから得た知見と学び
yud0uhu
0
230
5年目から始める Vue3 サイト改善 #frontendo
tacck
PRO
3
220
2つのフロントエンドと状態管理
mixi_engineers
PRO
3
110
【実演版】カンファレンス登壇者・スタッフにこそ知ってほしいマイクの使い方 / 大吉祥寺.pm 2025
arthur1
1
890
下手な強制、ダメ!絶対! 「ガードレール」を「檻」にさせない"ガバナンス"の取り方とは?
tsukaman
2
450
企業の生成AIガバナンスにおけるエージェントとセキュリティ
lycorptech_jp
PRO
2
190
新規プロダクトでプロトタイプから正式リリースまでNext.jsで開発したリアル
kawanoriku0
1
160
DroidKaigi 2025 Androidエンジニアとしてのキャリア
mhidaka
2
370
共有と分離 - Compose Multiplatform "本番導入" の設計指針
error96num
2
880
「何となくテストする」を卒業するためにプロダクトが動く仕組みを理解しよう
kawabeaver
0
420
ハードウェアとソフトウェアをつなぐ全てを内製している企業の E2E テストの作り方 / How to create E2E tests for a company that builds everything connecting hardware and software in-house
bitkey
PRO
1
150
Featured
See All Featured
Rails Girls Zürich Keynote
gr2m
95
14k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.7k
The World Runs on Bad Software
bkeepers
PRO
70
11k
Side Projects
sachag
455
43k
Fireside Chat
paigeccino
39
3.6k
Embracing the Ebb and Flow
colly
87
4.8k
Faster Mobile Websites
deanohume
309
31k
For a Future-Friendly Web
brad_frost
180
9.9k
Imperfection Machines: The Place of Print at Facebook
scottboms
268
13k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
810
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Transcript
各ショアデの詳細解説 以下は、各ショアデに詳細な解説を追加したノヺザュヱです。 これをもとにショアデを作成すれば、より深く情報を伝えることができます。 by yuuki shimizu YS
AI学習における課題 複雑なデータ AIモデルは、複雑なデータセットを学 習する必要がある。データのノイズや ⽋損値は、モデルの精度に悪影響を与 える可能性がある。 学習時間 複雑なモデルを学習するには、膨⼤な 時間と計算資源が必要となる。学習時 間の短縮は、AI開発における重要な課
題である。 汎化性能 学習データに過剰に適合したモデル は、未知のデータに対して性能が低下 する。汎化性能の向上は、AIモデルの 信頼性を⾼めるために不可⽋である。 多様なスキル AIモデルは、特定のタスクに特化した スキルを学習する。多様なタスクに対 応できるモデルの開発は、AIの応⽤範 囲を広げる上で重要である。
背景 1 課題1: ⼤規模ムヅラの開発ケシテが増⼤ GPT-3 や GPT-4 のようなムヅラでは、1 回のテリヺドヱギに 莫⼤な計算資源が必要となる。これは、開発ケシテの増⼤に
つながる⼤きな課題である。 2 課題2: ビゟアヱタャヺドヱギの限界 専⾨シカラを追加すると、他のシカラが犠牲になることが多 い。これは、過学習と呼ばれる現象であり、ムヅラの汎⽤性 を損なう可能性がある。 3 課題3: 知識喪失 学習過程で過去のシカラや知識を忘れてしまう問題が発⽣す る。これは、ムヅラの性能を低下させる可能性がある。 4 解決策 これらの課題を解決するために、CycleQD では「多様性のあ る⼩規模ムヅラ群」を提案する。
CycleQDの概要 1 進化的計算 CycleQDは進化的計算を基盤とする。 2 Quality Diversity 「質と多様性」の概念を導⼊する。 3 モデル群
多様なスキルを持つモデル群を⽣成する。 CycleQDは、進化的計算と「Quality Diversity」を融合した技術である。Quality Diversityとは、⾼品質なモデルを⽣成するだけでなく、 多様なスキルを持つモデル群を作ることを⽬指す考え⽅だ。 例えば、魔法の⾖を集めるように、異なる特徴を持つモデルを網羅することができる。CycleQDは、AIモデルの開発において、より幅広い可 能性を拓く技術と⾔える。
CycleQDの動作原理 動作メカニズム CycleQDは、進化的なアルゴリズムに基づいて動作する。まず、特 定のタスクに特化した初期モデルを⽣成する。次に、モデルを交叉 させて新しいモデルを⽣成する。その後、SVDによる突然変異を適 ⽤し、新しいモデルを評価する。評価に基づいて、次世代モデルに 進化させる。 進化的アルゴリズムのサイクル CycleQDは、周期的に異なるタスクを最適化することで、モデルの 多様性を維持する。このサイクルにより、さまざまなタスクに対応
できる汎⽤性の⾼いモデルを育成することができる。進化的なアル ゴリズムは、⾃然界の進化プロセスを模倣したものであり、モデル の性能を向上させるための効柝的な⼿法である。
ムヅラボヺザとSVDの詳細 ムヅラボヺザは、異なるソシキで学習されたムヅラを組み合わせ、双⽅の特性を 引き継ぐ⽅法である。例えば、ケヺヅァヱギに強いムヅラとDB操作に強いムヅラ を組み合わせることで、両⽅のシカラを持つムヅラを作成することができる。 SVDプヺシの突然変異は、ムヅラハョミヺソを「コピシカラ」に分解し、各成分 を調整することで新たな可能性を探索する⼿法である。この⼿法は、ムヅラの潜 在的な能⼒を引き出し、より複雑なソシキに対応できるムヅラを開発するために 使⽤される。
結果と性能⽐較 CycleQDは、従来のビゟアヱタャヺドヱギや単純なムヅラボヺザを上回る性能を ⽰す。ケヺヅァヱギ、ヅヺソプヺシ操作、エヘリヺツァヱギサシツマ操作など、複 数のソシキで⾼いシケ゠を達成した。 CycleQDは、GPT-3.5 Turboと同等の性能を⽰す⼀⽅で、ハョミヺソ数は⼤幅に 少ない。これは、CycleQDが⾮常に効率的であることを⽰している。
応⽤例と汎⽤性 応⽤範囲 CycleQDは、様々な分野で応⽤可 能である。例えば、医療⽤画像の 病変検出や農業における葉のセグ メンテーションなど、画像分割タス クに有効である。また、複数の専 ⾨AIエージェントが協調して問題 を解決するマルチエージェントシ ステムにも適⽤できる。
例1: 医療応⽤ CycleQDは、⽪膚病変検出など、 医療分野における画像解柋に役⽴ つ。CycleQDを⽤いることで、よ り正確な診断や治療計画の⽴案が 可能になる。 例2: 農業応⽤ CycleQDは、農業分野においても活⽤できる。例えば、葉の分割タスクにお いて、CycleQDは⾼精度なセグメンテーションを実現し、農作物の⽣育状況 の把握や病害⾍の早期発⾒に貢献する。
今後の展望 ⽣涯学習の可能性 ⼀度学んだ知識やシカラを忘れずに蓄積する。AIが⻑期的に進化し 続けるサシツマである。 ボラタウヺザゥヱテサシツマ 各ウヺザゥヱテが異なる専⾨性を持ち、協調や競争を通じて新たな 解決策を発⾒する。
実験の詳細 1 実験設定 実験は、ケヺヅァヱギ (MBPP+) 、DB操作、OS操作 の3つのソシキで実施された。各 ソシキの成功率や品質シケ゠を 評価指標として⽤いた。 2
CycleQDの設定 CycleQDのネアハヺハョミヺソ を調整した。SVDの範囲や世代 数などを調整し、1200世代のテ リヺドヱギで性能向上を確認し た。 3 表やヨシテ ヅヺソスチテ名、ムヅラハョミヺソ、テリヺドヱギ条件をヨシテ゠チフし た。これにより、実験の詳細な設定を明確に⽰すことができた。
結論と募集 CycleQDは「質」と「多様性」を両⽴する⾰新的技術である。従来 のAI開発を超える可能性を⽰す。 応⽤分野の拡⼤、マルチエージェントや⽣涯学習への応⽤など、次 のステップへ進む。 Sakana AIと共にAIの未来を形作りましょう!
視覚的強化 ヅヺソの視覚化 ギョビやタメヺテを⽤いて、ヅヺソの視覚化 を⾏う。これにより、複雑な情報を分かりや すく伝えることができる。 ムヅラの可視化 AIムヅラの構造や動作を視覚的に表現する。 これにより、ムヅラの理解を深めることがで きる。 視覚的訴求
図やギョビを効果的に活⽤することで、聴衆 の関⼼を引き付け、理解を促進する。