Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
強化学習の実業務への応用について
Search
kitamuaratomokazu
February 16, 2019
Technology
0
810
強化学習の実業務への応用について
kitamuaratomokazu
February 16, 2019
Tweet
Share
More Decks by kitamuaratomokazu
See All by kitamuaratomokazu
Calling Julia from Python (Julia Time)
kitamuratomokazu
0
97
Calling Julia from Python
kitamuratomokazu
2
760
Other Decks in Technology
See All in Technology
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
2
110
Oracle Cloud Infrastructure:2025年9月度サービス・アップデート
oracle4engineer
PRO
0
440
Optuna DashboardにおけるPLaMo2連携機能の紹介 / PFN LLM セミナー
pfn
PRO
1
890
Modern_Data_Stack最新動向クイズ_買収_AI_激動の2025年_.pdf
sagara
0
220
生成AIで「お客様の声」を ストーリーに変える 新潮流「Generative ETL」
ishikawa_satoru
1
320
バイブコーディングと継続的デプロイメント
nwiizo
2
430
Why React!?? Next.jsそしてReactを改めてイチから選ぶ
ypresto
10
4.5k
PLaMoの事後学習を支える技術 / PFN LLMセミナー
pfn
PRO
9
3.9k
AI時代だからこそ考える、僕らが本当につくりたいスクラムチーム / A Scrum Team we really want to create in this AI era
takaking22
6
3.5k
Green Tea Garbage Collector の今
zchee
PRO
2
390
「AI駆動PO」を考えてみる - 作る速さから価値のスループットへ:検査・適応で未来を開発 / AI-driven product owner. scrummat2025
yosuke_nagai
4
600
多様な事業ドメインのクリエイターへ 価値を届けるための営みについて
massyuu
1
290
Featured
See All Featured
Testing 201, or: Great Expectations
jmmastey
45
7.7k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
30
2.9k
Context Engineering - Making Every Token Count
addyosmani
5
190
Writing Fast Ruby
sferik
629
62k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Embracing the Ebb and Flow
colly
88
4.8k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
358
30k
Transcript
ڧԽֶशͷ࣮ۀͷԠ༻ʹ͍ͭͯ .BUI$PEJOHڧԽֶशΛޠΖ͏ʂ גࣜձࣾεΫϥϜαΠϯɹදऔకɹଜ༑ LJUBNVSB!TDSVNTJHODPN 5JUMF
ଜɹ༑ ࣄɿגࣜձࣾεΫϥϜαΠϯɹ ɹɹػցֶशΞϓϦέʔγϣϯͷઃܭ։ൃ ɹɹσʔλੳνʔϜͷ্ཱͪ͛ࢧԉ ɹɹڧԽֶशͱ֬ϓϩάϥϛϯάʹؔ৺ɻੵۃతʹࣄྫΛ࡞͍ͬͯ·͢ɻ झຯίϛϡχςΟӡӦ .BUI$PEJOHओ࠵ ɹɹߨࢣ͕ڭ͑ΔͷͰͳ͘ɺࢀՃऀಉ͕࢜ޓ͍ʹࣝͱܙΛ࣋ͪدΓ ɹɹڭֶ͍͑͋Ϳʹָ͠͞Λײ͍ͯ͡·͢ɻ
ࣗݾհ
ʢήʔϜͷੈքͰͳ͘ʣ ڧԽֶशΛ࣮ۀͰԠ༻͍ͯͨ͘͠Ίʹ 5PEBZ`T.BJO5IFNF
ֶशϓϩηε ɹ୳ࡧͱར༻ ɹɹࢼߦࡨޡ͠ͳ͕ΒֶͿ͜ͱ͕Ͱ͖Δ͔ʁ Ϛϧίϑܾఆաఔ ɹݱ࣌ͷใ͔Β࣍ͷܾఆΛԼ͢͜ͱ͕Ͱ͖Δ͔ ɹͦͷܾఆʹΑΓ֬తʹ࣍ͷঢ়ଶભҠ͢Δ͔ʁ ڧԽֶशʹ͍͍ͯΔઃఆͷ֬ೝ
ࠓճҩྍؔͷΫϥΠΞϯτΑΓࣄྫఏڙͷڐՄΛ͍͖ͨͩ·ͨ͠ɻ ʢຊࢿྉͷσʔλͯ͢μϛʔͰ͋Γ࣮ࡍͷσʔλͰ͋Γ·ͤΜɻʣ ԼهͷέʔεΛఆͯ͠ڧԽֶशͰղ͍ͯΈ·ͨ͠ɻ ຖඦ໊ͷױऀ͕དྷӃ͠ελοϑʢޢࢣʣ͕࠾݂͍ͯ͠·͢ɻ ױऀʹΑͬͯ࠾݂͍͢͠ਓͱͦ͏Ͱͳ͍ਓ͕͍Δ͜ͱɻ ελοϑਓʹΑͬͯϕςϥϯ͔Β৽ਓ·Ͱٕྔʹ͕ࠩ͋Γ·͢ɻ Ұఆͷׂ߹Ͱɺ࠾݂ʹࣦഊ͠·͢ɻ ࣄྫɿපӃͷ࠾݂
࠾݂ͷࣦഊΛԼ͛ͯױऀͷຬΛ্͍͛ͨɻ ελοϑͷٕྔͷ্ΛਤΓ͍ͨɻ ղ͖͍ͨ՝
૬͢ΔཁٻΛຬͨ͢࠷దͳߦಈબΛڧԽֶशͰֶͿ͜ͱ͕Մೳ ͔ʁ ࣦഊΛԼ͛Δ ɹϕςϥϯελοϑ͕ରԠ͢Δ ٕೳͷ্ΛਤΔ ɹࣗͷٕྔΑΓগ͍͠͠ױऀʹτϥΠ͢Δ ɹࣦഊ͕͕͋Δ (PBMͷઃܭ
ελοϑ͕దͳқͷױऀΛ୲Ͱ͖Δ͜ͱ ߦಈΛ֤ελοϑ͝ͱʹ5SZ͔1BTT͔Λબͤͯͪ͞ߦ ྻͷঢ়گ͓Αͼελοϑͷۭ͖ঢ়گͱࣗͷྗྔʹԠͨ͡5SZ ͱ1BTTΛબͰ͖ΔΑ͏ʹֶश͍ͨ͠ɻ ݱঢ়Ϛωʔδϟʔ͕ܦݧͱצͰߦ͍ͬͯΔΑ͏Ͱ͢ɻ (PBMͷઃܭ
1P$ ֓೦ݕূ ػցֶश͕Ծʹ͏·͘ਐΉͱɺ ৽ਓࣗͷྗྔʹ͋ͬͨױऀΛબผɹࣦഊԼ͕Δ ϕςϥϯελοϑɹқ͕ߴ͍ױऀΛબผࣦഊ্͕Δ ͣʂ (PBMͷઃܭ
ױऀқελοϑٕྔ ਪఆ ֬Ϟσϧ ױऀͱελοϑ Ϛονϯά ҰͭͷϞσϧͰҰʹղ͘ͷ͍͠ͷͰ Λׂ͠·ͨ͠ ڧԽֶश ਪఆͨ͠Λಛྔ ใुͱͯ͠ར༻͢Δ
֬ϞσϧͱڧԽֶशΛ߹Θͤͯղ͍͍ͯ͘ ϞσϦϯάͷํ
ίϛϡχςΟϝϯόʔͱͷσΟεΧογϣϯ ॳ࿈ଓ࣌ؒͷ.%1Λߟ͍͑ͯ ͨɻ3FXBSEױऀͷͪ࣌ؒΛ ϖφϧςΟͱͯ͠༩͑ΔํࣜΛݕ ౼్͍͕ͯͨ͠தͰํసɻ ࢄ࣌ؒͷߦಈͱͯ͠ใु ٕྔɿTLJMMͱױऀࠔɿ EJGpDVMUZͰදݱ
࣮ɿϞσϦϯά ωοτϫʔΫ ɹ%2/ ӅΕʢೖྗ࣍ݩͱಉ͡GVMMDPOOFDUFESFMVʣɹग़ྗ࣍ݩɹMJOFBS ಛྔ ױऀࠔɿ࿈ଓ ελοϑٕྔ࿈ଓ
ελοϑͷۭ͖༧ఆ࣌ؒ࿈ଓ ରԠελοϑPOFIPU ߦಈ ɹUSZQBTT࣍ݩ ใु ޭEJGpDVMUZTLJMM ׂɹௐͣΈ ࣦഊTLJMMEJGpDVMUZ ׂ̌ɹௐͣΈ ͪ࣌ؒͳ͠ͷQBTT ͪ࣌ؒ͋ΓͷQBTTTLJMMEJGpDVMUZ ʢͪ࣌ؒ ͪ࣌ؒͷ࠷େ ؔۙࣅͰɺॳχϡʔϥϧωοτͰͳ͍ͷΛ࣮͠Α͏ͱ͕ͨ͠χϡʔϥϧωοτͷํָ͕ʹ࣮Ͱ͖ΔͷͰ ࣌ؒͷؔͰ%2/Ͱ࣮͢Δɻ
ֶशͷਪҠϥϯμϜʹߦಈબ
ֶशͷਪҠϥϯμϜʹߦಈબ
ֶशͷਪҠ%2/ͰͲ͏͔ʁ
ֶशͷਪҠ%2/ ֶशͷ݁Ռɹϕςϥϯʹ1BTT͢Δ͜ͱΛ֮͑ͨɻ
ϞσϦϯάͷݟ͠ ωοτϫʔΫ ɹ%2/ ೖྗ̍̎࣍ݩɹӅΕʢ࣍ݩGVMMDPOOFDUFESFMVʣɹग़ྗ࣍ݩɹMJOFBS MPTTGVODUJPONTF PQUJNJ[FS"EBN ɹMFBSOJOHSBUF ಛྔ ױऀࠔɿ࿈ଓ
ελοϑٕྔ࿈ଓ ελοϑͷۭ͖ঢ়گPOFIPU ରԠελοϑPOFIPU ߦಈ ɹUSZQBTTͷೋ ใु ޭ ࣦഊ ͪ࣌ؒͳ͠ͷQBTT ͪ࣌ؒ͋ΓͷQBTT ɹTUFQޙ·ͰΛߟྀͨ͠ใुͰֶश ʣใुؔͱಛϕΫτϧΛݟͨ͠ΓMFBSOJOHSBUFΛখͨ͘͞͠Γͨ͠ɻ
ֶशͷਪҠ%2/Ϟσϧͱใुؔݟ͠
ֶशͷਪҠ%2/Ϟσϧͱใुؔݟ͠ ࣗͷ࣮ྗʹԠͨ͡ױऀΛબΜͰ5SZ͢ΔΑ͏ʹͳͬͨɻ ͔͜͜Β͞ΒʹϒϥογϡΞοϓ͍͖ͯ͠·͢ɻ
ڧԽֶशͷָ͠͞ ͏·͍͔͘ͳ͍࣌ɺ"HFOUͷؾ࣋ͪΛߟ͑ͨΓ͢Δɻ ใुʹΑͬͯڍಈ͕͝Ζͬͱ͔ΘΔ ڧԽֶशʹ͍ͭͯͷจ͕ʑ͍͍͢͝Ͱൃද͞Ε͍ͯΔɻ ใुؔઃܭγϡϛϨʔλ࡞ɺֶशϞσϧͳͲߟ͑Δ͜ ͱ͕ଟ͘ΫϥΠΞϯτνʔϜϝϯόʔͱͷΓͱΓͳͲɺ େม͕ͩઃܭϓϩηεָ͕͍͠ɻ
͍֓͠೦ٕज़ɺγϯϓϧͳྫͰ֬ೝͨ͠Γϝϯόʔ͕ର͢Δ͜ͱͰຊ࣭తͳཧղ ΛಘΒΕΔͱߟ͑·͢ɻຊάϧʔϓɺͦͷΑ͏ͳ͜ͱ͕Ͱ͖ΔΑ͏ͳίϛϡχςΟͱͳ Δ͜ͱΛࢦͯ͠ӡӦ͍ͯ͠·͢ɻڵຯ͕͋Δํͥͻ͝ࢀՃ͍ͩ͘͞ɻ IUUQTNBUIDPEJOHDPOOQBTTDPN .BUI$PEJOHͷհ
͝੩ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ɻ -BTU