Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
定規とコンパスと ChainerRL
Search
horiem
June 09, 2018
Technology
0
1.1k
定規とコンパスと ChainerRL
強化学習を使って作図問題を解く
Chainer Meetup #07, 9th Jun 2018
horiem
June 09, 2018
Tweet
Share
More Decks by horiem
See All by horiem
Continuous Simplicial Neural Networks
yellowshippo
1
440
局所保存性・相似変換対称性を満たす機械学習モデルによる数値流体力学
yellowshippo
1
310
ICML 読み会: Graph Neural PDE Solvers with Conservation and Similarity-Equivariance
yellowshippo
1
490
物理シミュレーションと数理最適化の知見を導入した機械学習手法
yellowshippo
1
1.8k
対称性のある機械学習による物理現象の解析
yellowshippo
5
2.8k
Physics-Embedded Neural Networks: Graph Neural PDE Solvers with Mixed Boundary Conditions
yellowshippo
1
730
物理現象の性質を反映させたグラフニューラルネットワークによる偏微分方程式の学習
yellowshippo
2
1.2k
物理シミュレーションの機械学習 に関する近年の動向と研究紹介
yellowshippo
4
15k
有限要素法を機械学習したい!
yellowshippo
0
3.8k
Other Decks in Technology
See All in Technology
Practical Agentic AI in Software Engineering
uzyn
0
110
大「個人開発サービス」時代に僕たちはどう生きるか
sotarok
20
10k
ハードウェアとソフトウェアをつなぐ全てを内製している企業の E2E テストの作り方 / How to create E2E tests for a company that builds everything connecting hardware and software in-house
bitkey
PRO
1
160
AIエージェントで90秒の広告動画を制作!台本・音声・映像・編集をつなぐAWS最新アーキテクチャの実践
nasuvitz
3
300
研究開発と製品開発、両利きのロボティクス
youtalk
1
530
2つのフロントエンドと状態管理
mixi_engineers
PRO
3
110
AI開発ツールCreateがAnythingになったよ
tendasato
0
130
「Linux」という言葉が指すもの
sat
PRO
4
140
自作JSエンジンに推しプロポーザルを実装したい!
sajikix
1
190
Agile PBL at New Grads Trainings
kawaguti
PRO
1
440
2025年夏 コーディングエージェントを統べる者
nwiizo
0
180
Evolución del razonamiento matemático de GPT-4.1 a GPT-5 - Data Aventura Summit 2025 & VSCode DevDays
lauchacarro
0
210
Featured
See All Featured
The Art of Programming - Codeland 2020
erikaheidi
56
13k
The Invisible Side of Design
smashingmag
301
51k
Visualization
eitanlees
148
16k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
Building Applications with DynamoDB
mza
96
6.6k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
How STYLIGHT went responsive
nonsquared
100
5.8k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
The Language of Interfaces
destraynor
161
25k
Agile that works and the tools we love
rasmusluckow
330
21k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Transcript
ఆنͱίϯύεͱ ChainerRL Chainer Meetup #07, 9th Jun 2018 horiem@yellowshippo
ChainerRL Ͱ
࡞ਤΛղ͖͍ͨ
࡞ਤ • ఆنͱίϯύε͚ͩΛͬͯతͷਤܗΛඳ͘ http://mathworld.wolfram.com/GeometricConstruction.html
σϞ
ͷલʹ
ਤͷݟํ ֶशϞσϧʹ͢ใ ʢObservationʣ ਓؒ༻ తͷਤܗ ར༻Մೳͳ
σϞ
શମ૾ ڥ ΤʔδΣϯτ ߦಈ ؍ଌ
શମ૾ ڥ ΤʔδΣϯτ [p0_x, p0_y] [p1_x, p1_y] …… ը૾ ͷใ
[shape_flag, pi, pj] ৽͍͠ਤܗ
ωοτϫʔΫΞʔΩςΫνϟ Conv MLP MLP Conv MLP [p0_x, p0_y] [p1_x, p1_y]
…… ը૾ ͷใ [shape_flag, pi, pj] ৽͍͠ਤܗ
ωοτϫʔΫΞʔΩςΫνϟ (100, 100) (12, 3) Conv MLP MLP Conv MLP
(2, 12, 12) [p0_x, p0_y] [p1_x, p1_y] …… ը૾ ͷใ [shape_flag, pi, pj] ৽͍͠ਤܗ
ωοτϫʔΫΞʔΩςΫνϟ (100, 100) (12, 3) Conv MLP MLP Conv MLP
(2, 12, 12) [p0_x, p0_y] [p1_x, p1_y] …… ը૾ ͷใ [shape_flag, pi, pj] ৽͍͠ਤܗ = 288
ࢥͬͨ͜ͱͳͲ • ڧԽֶशͬͨ͜ͱͳ͔͚ͬͨͲָ͍͠ • ChainerRL ϥΫͰΑ͍ • ߦಈۭ͕ؒେ͖͍ͷͰݮΒ͍ͨ͠ • AlphaGO
͕ࢀߟʹͳΔ͔ʁ • ίʔυ͖Ε͍ʹͨ͠Βެ։ && ղઆ͠·͢ • n ࣍ํఔࣜΛ ChainerRL Ͱղ͚Δ͔ʁ • ՝֎׆ಈ͖ͳਓɺҰॹʹΓ·͠ΐ͏ʂ