Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikke...
Search
Shotaro Ishihara
January 22, 2019
Business
8
10k
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikkei using Machine Learning
Data Driven Developer Meetup #4 (#d3m) での発表資料
https://d3m.connpass.com/event/115217/
Shotaro Ishihara
January 22, 2019
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
20
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
510
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
800
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
43
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
380
第19回YANSシンポジウムスポンサー資料 / yans2024-nikkei
upura
0
32
Quantifying Memorization of Domain-Specific Pre-trained Language Models using Japanese Newspaper and Paywalls
upura
0
50
「極意本」サンプルコードをクラウド上で動かそう
upura
1
2.4k
論文紹介: Generating News-Centric Crossword Puzzles As A Constraint Satisfaction and Optimization Problem
upura
0
310
Other Decks in Business
See All in Business
HireRoo Culture Deck(日本語)
kkosukeee
1
24k
HERBEST_about service
beat
0
620
merpay-Overview
mercari_inc
7
160k
株式会社リブセンス 会社説明資料(報道関係者様向け)
livesense
PRO
0
770
サバノミソニLT‐AWS認定資格合格への道のり
utosun
0
350
急成⻑スタートアップで働くことで得られるもの / 株式会社IVRy(社内LT会)
miyashino
0
1.2k
「観察」をチームで実践できるか!? チームの視座をレベルアップするための挑戦!
rakuraku0615
1
210
“難しい”をもっと楽に簡単に♪ 届出ダンジョンからの脱出
tokyo_metropolitan_gov_digital_hr
0
290
Firework Japan Corporate Deck 2024/11
steven11
0
160
受託開発のアジャイル奮闘記
mifujita
1
10k
株式会社Rehab for JAPAN会社概要
rehabrecruiting
4
67k
株式会社Beer and Tech/HitoHana(ひとはな) 採用資料 2024.11
beerandtech_recruiter
1
460
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
79
8.7k
Designing the Hi-DPI Web
ddemaree
280
34k
Measuring & Analyzing Core Web Vitals
bluesmoon
4
120
Faster Mobile Websites
deanohume
305
30k
Code Review Best Practice
trishagee
64
17k
Side Projects
sachag
452
42k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.2k
Large-scale JavaScript Application Architecture
addyosmani
510
110k
We Have a Design System, Now What?
morganepeng
50
7.2k
A Modern Web Designer's Workflow
chriscoyier
693
190k
10 Git Anti Patterns You Should be Aware of
lemiorhan
654
59k
Speed Design
sergeychernyshev
24
610
Transcript
ػցֶशΛ༻͍ͨ ܦిࢠ൛1SPͷϢʔβੳ ຊܦࡁ৽ฉࣾ ੴݪↅଠ %BUB%SJWFO%FWFMPQFS.FFUVQ +BOOE
ٕज़ॻయͰࣥචɾެ։ ٕज़ॻయ̑Ͱ൦ͨ͠ܦిࢠ൛ͷٕज़ॻΛ࠶ൢ͠·͢ɻ IUUQTOPUFNVOJLLFJ@TUBGGOODCBC • ୲ͨ͠ୈষʮػցֶशΛ༻͍ͨܦిࢠ൛1SP ͷϢʔβੳʯશͯແঈެ։த
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ࣗݾհ • ੴݪↅଠ !VQVSB • ຊܦࡁ৽ฉࣾ ݄ೖࣾ • σʔλΞφϦετˍΤϯδχΞ •
େֶ࣌ɿֶֶ෦ɺ՝֎׆ಈେֶ৽ฉ • झຯɿ,BHHMFɺڝϓϩɺϒϩά ʢ݄BEWFOUDBMFOEBSͳͲͰຊࣥචʣ
σʔλυϦϒϯνʔϜ • αʔϏεاըɾ։ൃӦۀɾϚʔέςΟϯάͰ ʮσʔλΛۙʹʯ • ୯ͳΔੳ͚ͩͰͳ͘ɺج൫ͷඋɺଌఆ߲ͷ ઃܭɺۀޮԽʹ͚ͨڥඋͳͲ • ར༻ݴޠɿ42- 1ZUIPO
3 /PEFKT ຊޠ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
σʔλಓ • σʔλυϦϒϯΛՃ͢Δڭҭ੍ʢʙʣ • ੳ୲ऀ͚ͩͰͳ͘ฤूɾӦۀɾࠂͷؔऀΒ ͕ɺ42-σʔλʹجͮ͘1%$"ͷճ͠ํΛֶͿ • Χ݄ʹΘͨΓिʹҰɺۀ࣌ؒͷ࣌ؒ ͷͰूதతʹऔΓΉ
ۀͷݹ͍ձࣾͰσʔλͷຽओԽΛਐΊͨ IUUQTTQFBLFSEFDLDPNZPTVLFTV[VLJOJLLFJEBUBESJWFO
ػցֶशτϨʔχϯά • σʔλಓͷൃల൛ • ֎෦ߨࢣট͖ɺػցֶशͷཧϏδωεԠ༻ ͢ΔͨΊͷϊϋͳͲΛֶͿ • ύοέʔδΛΘͳ͍ػցֶशΞϧΰϦζϜͷ࣮ ͔Β࢝Ίɺ࠷ऴతʹػցֶशΛ༻͍ͯࣗࣾαʔϏε ͷσʔλΛੳ
ܦిࢠ൛1SP • ๏ਓ͚ͷʮܦిࢠ൛ʯ IUUQTQSOJLLFJDPNQSP • ෳਓͰهࣄͷίϝϯτڞ༗͕Ͱ͖Δάϧʔϓ ػೳͳͲɺݸਓܖͷܦిࢠ൛ʹͳ͍ػೳɾ ίϯςϯπ͕ॆ࣮ • ຊܖલͷແྉτϥΠΞϧΛఏڙ
• ແྉτϥΠΞϧ͔ΒຊܖʹࢸΔׂ߹ɺ͢ͳΘͪ ʮຊܖʯɺച্ʹ݁͢Δॏཁͳࢦඪ
ࠓճͷੳͷత • ຊܖͷ্Λࢦ͠ɺաڈʹແྉτϥΠΞϧ ͔Βຊܖͨ͠ʗ͠ͳ͔ͬͨϢʔβΛରʹ͠ɺ ͦΕͧΕͲͷΑ͏ͳಛ͕͋Δ͔Ѳ • Ϣʔβͷଐੑใར༻ʹؔ͢Δใ͔Βɺ ػցֶशΛ༻͍Δ͜ͱͰେྔͷσʔλΛॲཧ͠ɺ ຊܖ͢Δ͔൱͔ʹؔΘΔಛΛఆੑతͰͳ͘ ఆྔతʹಛఆ
ಛྔͷॏཁ આ໌ม !ɿ Ϣʔβଐੑར༻ user_id "# "$ ... "%
& 00000001 0 00000002 1 00000003 0 తม yɿ ຊܖʹࢸ͔ͬͨ൱͔ ػցֶशϞσϧ ಗ໊Խ͞Εͨ*% ༧ଌʹ༻͍ͨಛͷॏཁΛࢉग़ ˠຊܖʹӨڹ͢ΔಛͱԿ͔ʁ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
"UMBT • ͨ͠ϦΞϧλΠϜσʔλॲཧج൫ʮ"UMBTʯ ϦΞϧλΠϜσʔλॲཧج൫ ʮ"UMBTʯ ͷιʔείʔυΛެ։͠·͢ IUUQTIBDLOJLLFJDPNCMPHBUMBT@PQFOTPVSDF@QSPKFDU
42- 1ZUIPOͰੳ • 3FEBTI্Ͱ42-Λॻ͖ɺσʔλΛऔಘ • ࠓճػցֶशΛ༻͍ͨൺֱతෳࡶͳੳΛߦ͏ ߹্ɺ42-Ͱσʔλऔಘ·ͰΛѻ͍ɺΓͷ ॲཧ1ZUIPOΛར༻ • ˞,JCBOB
%0.0 34UVEJPͳͲར༻Ͱ͖Δ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
୳ࡧతσʔλੳʢ&%"ʣ • औಘͨ͠σʔλͷ֤ಛͷɺܽམͷ༗ແ ͳͲΛ֬ೝ • ݸਓతͳݟղͱͯ͠ɺϏδωεͷੈքͰσʔλΛ ѻ্͍ͬͯ͘Ͱಛʹॏཁͳաఔ • ,BHHMFͳͲͱൺɺϏδωεͰղܾ͖͢ Λಛఆ͠ԾઆΛཱͯΔ͜ͱʹՁ͕͋Δ
σʔλΛදࣔ͢Δ • ଐੑใ͕ఔɺΞΫηεใ͕ఔ
σʔλͷ֓ཁΛ͔ͭΉ • جૅ౷ܭྔܽଛΛோΊΔ • ! == 0 ͕ଟ͍ෆۉߧσʔλ • ʮอଘهࣄʯʮࣗ༝ճͷଐੑใʯʹܽଛ
• ˞લऀ42-ͷॻ͖ํͷʢKPJOʣ
U4/&ͰՄࢹԽ • ߴ࣍ݩσʔλͷ࣍ݩݮͷख๏ • ԫ৭ͷ ! == 1 ͕ൺֱత·ͱ·ͬͨҐஔʹ
ܽଛΧςΰϦมͷॲཧ • ܽଛ͕ଟ͗͢Δมআ • ʮอଘهࣄʯͷܽଛͰຒΊΔ • ΧςΰϦมμϛʔมʹ
-FBLBHFͷআ • ༧ଌͷରͱͳΔʹؔ͢Δ༧ظͤ͵ใֶ͕श σʔλʹଘࡏ͢ΔͨΊɺػցֶशΞϧΰϦζϜ ͕ඇݱ࣮తʹߴ͍ਫ਼Λࣔ͢ݱ • ࠓճʮຊܖਃ͠ࠐΈखଓ͖ϖʔδͷӾཡʯ ͕-FBLBHFʹ • ຊܖΛਃ͠ࠐΉखଓ͖ϖʔδΛӾཡ͍ͯ͠Δ
Ϣʔβɺવ΄΅ͷ֬ͰຊܖʹࢸΔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ػցֶशϞσϧͷબఆ • ਖ਼ղ"6$ͰϞσϧͷਫ਼Λൺֱ
(SBEJFOU#PPTUJOH$MBTTJGJFS • TLMFBSOͷޯϒʔεςΟϯάܾఆΛ࠾༻ • ཧ༝ᶃ ಛͷॏཁΛࢉग़Ͱ͖ɺతʹ߹க • ཧ༝ᶄ 47$ͱൺೋྨҎ֎ʹԠ༻͍͢͠ •
(SJE4FBSDI$7ͰϋΠύʔύϥϝʔλௐ • ަࠩݕূͷ"6$Ͱఔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ಛͷॏཁ • ࠓճͷ༧ଌϞσϧʹ͓͚ΔಛͷॏཁΛग़ྗ • ˞աʹಛͷॏཁΛ৴ͣ͡ɺཧతഎܠΛҙࣝ ͯ͠৻ॏʹղऍ͢Δඞཁ͕͋Δ • αʔϏεӦۀɾϚʔέςΟϯάͷ୲ऀʹڞ༗ ͠ɺࠓޙͷࢪࡦʹ͚ͨٞͷࡐྉʹ
·ͱΊ • ػցֶशΛ༻͍ͯܦిࢠ൛1SPͷϢʔβੳΛ ࣮ࢪ͠ɺແྉτϥΠΞϧ͔ΒຊܖʹࢸΔཁҼͱ ͳΔಛΛఆྔతʹಛఆͨ͠ • Ұݟʮݹष͍ʯຊܦࡁ৽ฉࣾͰɺσʔλ׆༻͕ ੵۃతʹల։͞Ε͍ͯΔ ʢσʔλಓɾσʔλج൫ɾػցֶशͳͲʣ