Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ブロックチェーンによる自律AIのための遺伝的アルゴリズムの検討
Search
Keio Computer Society
November 10, 2021
0
24
ブロックチェーンによる自律AIのための遺伝的アルゴリズムの検討
Keio Computer Society
November 10, 2021
Tweet
Share
More Decks by Keio Computer Society
See All by Keio Computer Society
20211208.pdf
kcs
0
12
自然言語処理~Primer
kcs
0
93
Residual Network.pdf
kcs
0
110
Graph Neural Network
kcs
0
26
Kaggle上位者解法紹介.pdf
kcs
0
40
Scaling Laws for NL Models
kcs
0
40
音声合成の精度比較.pdf
kcs
0
140
Featured
See All Featured
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
46
2.4k
4 Signs Your Business is Dying
shpigford
183
22k
How STYLIGHT went responsive
nonsquared
99
5.4k
The World Runs on Bad Software
bkeepers
PRO
67
11k
Building Applications with DynamoDB
mza
93
6.2k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.1k
Documentation Writing (for coders)
carmenintech
68
4.6k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
11
1.3k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
How to train your dragon (web standard)
notwaldorf
91
5.9k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Writing Fast Ruby
sferik
628
61k
Transcript
ブロックチェーンによる自律AIのための 遺伝的アルゴリズムの検討 佐賀大学
概要 生物学関係ないです。(めっちゃ勘違いしてた) ブロックチェーン上に構築した「仮想通貨」を報酬とした 遺伝的アルゴリズム
1.はじめに 2021/11/10 この論文では 特定の個人が設計/管理するAIでなく 個人から独立して自分のコードを 成長させる”自律AI”の実現に向けた 自律管理型遺伝的アルゴリズム (SA-GA Self-Administered Genetic
Algorithm)の提案 佐賀の捩り 自律思考型固定砲台(暗殺教室より)
遺伝的アルゴリズムとは 2021/11/10 遺伝子を模したデータを生物の進化のアルゴリズムを用いて より優位性の高い個体へと進化させること 組み合わせ最適化問題やNP困難な問題の解決に応用させることができる 選択、交叉、突然変異を通じて、個体に多様性を持たせる
SA-GAの概要 2021/11/10 ブロックチェーン上で実行される自律プログラムを実装 自律AIは仮想通貨をエネルギーに相当する存在として これをプログラム実行時に消費する。 仮想通貨を報酬として強化学習で学習をしていく。
自律AIの実装 2021/11/10 行動 : 仮想通貨を消費して実行 評価 : AI使用者はAIを 仮想通貨の支払いにより評価 選択
: 予め決めた選択方法により 個体を選択 交叉、突然変異 : 個体に多様性を持たせる 最終的に強いモデルが生き残る
実験概要 2021/11/10 ブロックチェーン上で探索するマッチングアプリを推定 6人の発注者に 18人の委託者 から最適なマッチングの組を 推薦する。
実験内容 2021/11/10 A, B, C 三種類のスキルがあると仮定する 必要スキル、報酬金額と 受注者の希望金額の組を 最適化する
自律AIによる推薦処理の流れ 2021/11/10 システム上に自律AIを60体作成 これらはそれぞれ 累計数テーブル 推薦する発注者の情報 仮想通貨10 を持つ 推薦時ノードに累計数テーブル を渡し、
受注者組み合わせ推薦部が 発注者に組み合わせを推薦
ルーレット選択 2021/11/10 ノードは累計数テーブルを利用して ルーレット選択 によって推薦組み合わせを指定 累計数が多い受注者ほど組み合わせとして選択されやすい ルーレット選択 各個体につけられた点数に応じて枠を作って それに応じてランダムなルーレット方式で次世代を決める
実験手順 2021/11/10 1. 自律AI作成 2. ノードは発注者へ推薦する自律AIを3体ランダムで選択する。 3. 自律AIは3体受注者を選択する。 4. 推薦:自律AIは仮想通貨1を消費して推薦
5. 発注者は3つの中で最も適した推薦をしたAIに もらった仮想通貨全てをあげる 6. 評価された自律AIは累計数テーブルのうち推薦された受注者の累計数を 10増やし、されなかった自律AIは受注者の累計数を2下げる 自律AIは所持仮想通貨15を超えると子AIを作成 仮想通貨0になると消滅 7. 2~6を繰り返す
結果 2021/11/10 それぞれの発注者に最適化された 自律AIは適切な推薦を行うようになった