Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikke...
Search
Shotaro Ishihara
January 22, 2019
Business
8
10k
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikkei using Machine Learning
Data Driven Developer Meetup #4 (#d3m) での発表資料
https://d3m.connpass.com/event/115217/
Shotaro Ishihara
January 22, 2019
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
54
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
140
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
210
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
680
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
880
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
49
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
430
第19回YANSシンポジウムスポンサー資料 / yans2024-nikkei
upura
0
48
Quantifying Memorization of Domain-Specific Pre-trained Language Models using Japanese Newspaper and Paywalls
upura
0
62
Other Decks in Business
See All in Business
workx-company-profile
eastfields
0
21k
株式会社miibo|採用デック
natsumidnx
0
140
ドローンを活用した汚泥焼却炉内点検のDX
tokyo_metropolitan_gov_digital_hr
0
320
Sasuke Financial Lab_会社説明資料
mayuko_nishida
1
5k
成功をつなげる プロジェクトマネジメントの探求 / Exploring Project Management to Continuous Success
tunepolo
0
170
ドコドア_採用ピッチ資料_20241205
docodoor_hr
3
7.6k
AWS re:Invent参加のリアル 〜女性目線で考える健康・美容・安全のベストプラクティス〜
o2mami
1
320
知識を超えて実践するためのマインドの作り方
mayforblue
0
1.6k
株式会社JMDC データウェアハウス開発部 採用ピッチ資料
jmdc
3
1.2k
Ampersand Company Profile
cuebicventures
PRO
0
480
合議で決めたいわけではないけれど、 集合知で助けてほしい。_pmconf_2024
tomosooon
1
5.1k
(16枚)組織と集団の違いとは? 組織の「3要素」とは?
nyattx
PRO
3
2.1k
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
28
4.3k
The World Runs on Bad Software
bkeepers
PRO
65
11k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7k
Put a Button on it: Removing Barriers to Going Fast.
kastner
59
3.6k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
1.9k
Into the Great Unknown - MozCon
thekraken
33
1.5k
Code Reviewing Like a Champion
maltzj
520
39k
The Invisible Side of Design
smashingmag
298
50k
Testing 201, or: Great Expectations
jmmastey
40
7.1k
A better future with KSS
kneath
238
17k
Transcript
ػցֶशΛ༻͍ͨ ܦిࢠ൛1SPͷϢʔβੳ ຊܦࡁ৽ฉࣾ ੴݪↅଠ %BUB%SJWFO%FWFMPQFS.FFUVQ +BOOE
ٕज़ॻయͰࣥචɾެ։ ٕज़ॻయ̑Ͱ൦ͨ͠ܦిࢠ൛ͷٕज़ॻΛ࠶ൢ͠·͢ɻ IUUQTOPUFNVOJLLFJ@TUBGGOODCBC • ୲ͨ͠ୈষʮػցֶशΛ༻͍ͨܦిࢠ൛1SP ͷϢʔβੳʯશͯແঈެ։த
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ࣗݾհ • ੴݪↅଠ !VQVSB • ຊܦࡁ৽ฉࣾ ݄ೖࣾ • σʔλΞφϦετˍΤϯδχΞ •
େֶ࣌ɿֶֶ෦ɺ՝֎׆ಈେֶ৽ฉ • झຯɿ,BHHMFɺڝϓϩɺϒϩά ʢ݄BEWFOUDBMFOEBSͳͲͰຊࣥචʣ
σʔλυϦϒϯνʔϜ • αʔϏεاըɾ։ൃӦۀɾϚʔέςΟϯάͰ ʮσʔλΛۙʹʯ • ୯ͳΔੳ͚ͩͰͳ͘ɺج൫ͷඋɺଌఆ߲ͷ ઃܭɺۀޮԽʹ͚ͨڥඋͳͲ • ར༻ݴޠɿ42- 1ZUIPO
3 /PEFKT ຊޠ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
σʔλಓ • σʔλυϦϒϯΛՃ͢Δڭҭ੍ʢʙʣ • ੳ୲ऀ͚ͩͰͳ͘ฤूɾӦۀɾࠂͷؔऀΒ ͕ɺ42-σʔλʹجͮ͘1%$"ͷճ͠ํΛֶͿ • Χ݄ʹΘͨΓिʹҰɺۀ࣌ؒͷ࣌ؒ ͷͰूதతʹऔΓΉ
ۀͷݹ͍ձࣾͰσʔλͷຽओԽΛਐΊͨ IUUQTTQFBLFSEFDLDPNZPTVLFTV[VLJOJLLFJEBUBESJWFO
ػցֶशτϨʔχϯά • σʔλಓͷൃల൛ • ֎෦ߨࢣট͖ɺػցֶशͷཧϏδωεԠ༻ ͢ΔͨΊͷϊϋͳͲΛֶͿ • ύοέʔδΛΘͳ͍ػցֶशΞϧΰϦζϜͷ࣮ ͔Β࢝Ίɺ࠷ऴతʹػցֶशΛ༻͍ͯࣗࣾαʔϏε ͷσʔλΛੳ
ܦిࢠ൛1SP • ๏ਓ͚ͷʮܦిࢠ൛ʯ IUUQTQSOJLLFJDPNQSP • ෳਓͰهࣄͷίϝϯτڞ༗͕Ͱ͖Δάϧʔϓ ػೳͳͲɺݸਓܖͷܦిࢠ൛ʹͳ͍ػೳɾ ίϯςϯπ͕ॆ࣮ • ຊܖલͷແྉτϥΠΞϧΛఏڙ
• ແྉτϥΠΞϧ͔ΒຊܖʹࢸΔׂ߹ɺ͢ͳΘͪ ʮຊܖʯɺച্ʹ݁͢Δॏཁͳࢦඪ
ࠓճͷੳͷత • ຊܖͷ্Λࢦ͠ɺաڈʹແྉτϥΠΞϧ ͔Βຊܖͨ͠ʗ͠ͳ͔ͬͨϢʔβΛରʹ͠ɺ ͦΕͧΕͲͷΑ͏ͳಛ͕͋Δ͔Ѳ • Ϣʔβͷଐੑใར༻ʹؔ͢Δใ͔Βɺ ػցֶशΛ༻͍Δ͜ͱͰେྔͷσʔλΛॲཧ͠ɺ ຊܖ͢Δ͔൱͔ʹؔΘΔಛΛఆੑతͰͳ͘ ఆྔతʹಛఆ
ಛྔͷॏཁ આ໌ม !ɿ Ϣʔβଐੑར༻ user_id "# "$ ... "%
& 00000001 0 00000002 1 00000003 0 తม yɿ ຊܖʹࢸ͔ͬͨ൱͔ ػցֶशϞσϧ ಗ໊Խ͞Εͨ*% ༧ଌʹ༻͍ͨಛͷॏཁΛࢉग़ ˠຊܖʹӨڹ͢ΔಛͱԿ͔ʁ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
"UMBT • ͨ͠ϦΞϧλΠϜσʔλॲཧج൫ʮ"UMBTʯ ϦΞϧλΠϜσʔλॲཧج൫ ʮ"UMBTʯ ͷιʔείʔυΛެ։͠·͢ IUUQTIBDLOJLLFJDPNCMPHBUMBT@PQFOTPVSDF@QSPKFDU
42- 1ZUIPOͰੳ • 3FEBTI্Ͱ42-Λॻ͖ɺσʔλΛऔಘ • ࠓճػցֶशΛ༻͍ͨൺֱతෳࡶͳੳΛߦ͏ ߹্ɺ42-Ͱσʔλऔಘ·ͰΛѻ͍ɺΓͷ ॲཧ1ZUIPOΛར༻ • ˞,JCBOB
%0.0 34UVEJPͳͲར༻Ͱ͖Δ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
୳ࡧతσʔλੳʢ&%"ʣ • औಘͨ͠σʔλͷ֤ಛͷɺܽམͷ༗ແ ͳͲΛ֬ೝ • ݸਓతͳݟղͱͯ͠ɺϏδωεͷੈքͰσʔλΛ ѻ্͍ͬͯ͘Ͱಛʹॏཁͳաఔ • ,BHHMFͳͲͱൺɺϏδωεͰղܾ͖͢ Λಛఆ͠ԾઆΛཱͯΔ͜ͱʹՁ͕͋Δ
σʔλΛදࣔ͢Δ • ଐੑใ͕ఔɺΞΫηεใ͕ఔ
σʔλͷ֓ཁΛ͔ͭΉ • جૅ౷ܭྔܽଛΛோΊΔ • ! == 0 ͕ଟ͍ෆۉߧσʔλ • ʮอଘهࣄʯʮࣗ༝ճͷଐੑใʯʹܽଛ
• ˞લऀ42-ͷॻ͖ํͷʢKPJOʣ
U4/&ͰՄࢹԽ • ߴ࣍ݩσʔλͷ࣍ݩݮͷख๏ • ԫ৭ͷ ! == 1 ͕ൺֱత·ͱ·ͬͨҐஔʹ
ܽଛΧςΰϦมͷॲཧ • ܽଛ͕ଟ͗͢Δมআ • ʮอଘهࣄʯͷܽଛͰຒΊΔ • ΧςΰϦมμϛʔมʹ
-FBLBHFͷআ • ༧ଌͷରͱͳΔʹؔ͢Δ༧ظͤ͵ใֶ͕श σʔλʹଘࡏ͢ΔͨΊɺػցֶशΞϧΰϦζϜ ͕ඇݱ࣮తʹߴ͍ਫ਼Λࣔ͢ݱ • ࠓճʮຊܖਃ͠ࠐΈखଓ͖ϖʔδͷӾཡʯ ͕-FBLBHFʹ • ຊܖΛਃ͠ࠐΉखଓ͖ϖʔδΛӾཡ͍ͯ͠Δ
Ϣʔβɺવ΄΅ͷ֬ͰຊܖʹࢸΔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ػցֶशϞσϧͷબఆ • ਖ਼ղ"6$ͰϞσϧͷਫ਼Λൺֱ
(SBEJFOU#PPTUJOH$MBTTJGJFS • TLMFBSOͷޯϒʔεςΟϯάܾఆΛ࠾༻ • ཧ༝ᶃ ಛͷॏཁΛࢉग़Ͱ͖ɺతʹ߹க • ཧ༝ᶄ 47$ͱൺೋྨҎ֎ʹԠ༻͍͢͠ •
(SJE4FBSDI$7ͰϋΠύʔύϥϝʔλௐ • ަࠩݕূͷ"6$Ͱఔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ಛͷॏཁ • ࠓճͷ༧ଌϞσϧʹ͓͚ΔಛͷॏཁΛग़ྗ • ˞աʹಛͷॏཁΛ৴ͣ͡ɺཧతഎܠΛҙࣝ ͯ͠৻ॏʹղऍ͢Δඞཁ͕͋Δ • αʔϏεӦۀɾϚʔέςΟϯάͷ୲ऀʹڞ༗ ͠ɺࠓޙͷࢪࡦʹ͚ͨٞͷࡐྉʹ
·ͱΊ • ػցֶशΛ༻͍ͯܦిࢠ൛1SPͷϢʔβੳΛ ࣮ࢪ͠ɺແྉτϥΠΞϧ͔ΒຊܖʹࢸΔཁҼͱ ͳΔಛΛఆྔతʹಛఆͨ͠ • Ұݟʮݹष͍ʯຊܦࡁ৽ฉࣾͰɺσʔλ׆༻͕ ੵۃతʹల։͞Ε͍ͯΔ ʢσʔλಓɾσʔλج൫ɾػցֶशͳͲʣ