Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ブロックチェーンによる自律AIのための遺伝的アルゴリズムの検討
Search
Keio Computer Society
November 10, 2021
0
25
ブロックチェーンによる自律AIのための遺伝的アルゴリズムの検討
Keio Computer Society
November 10, 2021
Tweet
Share
More Decks by Keio Computer Society
See All by Keio Computer Society
20211208.pdf
kcs
0
12
自然言語処理~Primer
kcs
0
94
Residual Network.pdf
kcs
0
130
Graph Neural Network
kcs
0
27
Kaggle上位者解法紹介.pdf
kcs
0
42
Scaling Laws for NL Models
kcs
0
44
音声合成の精度比較.pdf
kcs
0
160
Featured
See All Featured
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Faster Mobile Websites
deanohume
309
31k
Become a Pro
speakerdeck
PRO
29
5.5k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.7k
Why Our Code Smells
bkeepers
PRO
339
57k
A designer walks into a library…
pauljervisheath
207
24k
Speed Design
sergeychernyshev
32
1.1k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Automating Front-end Workflow
addyosmani
1370
200k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
How STYLIGHT went responsive
nonsquared
100
5.8k
Transcript
ブロックチェーンによる自律AIのための 遺伝的アルゴリズムの検討 佐賀大学
概要 生物学関係ないです。(めっちゃ勘違いしてた) ブロックチェーン上に構築した「仮想通貨」を報酬とした 遺伝的アルゴリズム
1.はじめに 2021/11/10 この論文では 特定の個人が設計/管理するAIでなく 個人から独立して自分のコードを 成長させる”自律AI”の実現に向けた 自律管理型遺伝的アルゴリズム (SA-GA Self-Administered Genetic
Algorithm)の提案 佐賀の捩り 自律思考型固定砲台(暗殺教室より)
遺伝的アルゴリズムとは 2021/11/10 遺伝子を模したデータを生物の進化のアルゴリズムを用いて より優位性の高い個体へと進化させること 組み合わせ最適化問題やNP困難な問題の解決に応用させることができる 選択、交叉、突然変異を通じて、個体に多様性を持たせる
SA-GAの概要 2021/11/10 ブロックチェーン上で実行される自律プログラムを実装 自律AIは仮想通貨をエネルギーに相当する存在として これをプログラム実行時に消費する。 仮想通貨を報酬として強化学習で学習をしていく。
自律AIの実装 2021/11/10 行動 : 仮想通貨を消費して実行 評価 : AI使用者はAIを 仮想通貨の支払いにより評価 選択
: 予め決めた選択方法により 個体を選択 交叉、突然変異 : 個体に多様性を持たせる 最終的に強いモデルが生き残る
実験概要 2021/11/10 ブロックチェーン上で探索するマッチングアプリを推定 6人の発注者に 18人の委託者 から最適なマッチングの組を 推薦する。
実験内容 2021/11/10 A, B, C 三種類のスキルがあると仮定する 必要スキル、報酬金額と 受注者の希望金額の組を 最適化する
自律AIによる推薦処理の流れ 2021/11/10 システム上に自律AIを60体作成 これらはそれぞれ 累計数テーブル 推薦する発注者の情報 仮想通貨10 を持つ 推薦時ノードに累計数テーブル を渡し、
受注者組み合わせ推薦部が 発注者に組み合わせを推薦
ルーレット選択 2021/11/10 ノードは累計数テーブルを利用して ルーレット選択 によって推薦組み合わせを指定 累計数が多い受注者ほど組み合わせとして選択されやすい ルーレット選択 各個体につけられた点数に応じて枠を作って それに応じてランダムなルーレット方式で次世代を決める
実験手順 2021/11/10 1. 自律AI作成 2. ノードは発注者へ推薦する自律AIを3体ランダムで選択する。 3. 自律AIは3体受注者を選択する。 4. 推薦:自律AIは仮想通貨1を消費して推薦
5. 発注者は3つの中で最も適した推薦をしたAIに もらった仮想通貨全てをあげる 6. 評価された自律AIは累計数テーブルのうち推薦された受注者の累計数を 10増やし、されなかった自律AIは受注者の累計数を2下げる 自律AIは所持仮想通貨15を超えると子AIを作成 仮想通貨0になると消滅 7. 2~6を繰り返す
結果 2021/11/10 それぞれの発注者に最適化された 自律AIは適切な推薦を行うようになった