Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikke...
Search
Shotaro Ishihara
January 22, 2019
Business
8
10k
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikkei using Machine Learning
Data Driven Developer Meetup #4 (#d3m) での発表資料
https://d3m.connpass.com/event/115217/
Shotaro Ishihara
January 22, 2019
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
59
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
190
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
240
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
750
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
940
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
58
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
460
第19回YANSシンポジウムスポンサー資料 / yans2024-nikkei
upura
0
61
Quantifying Memorization of Domain-Specific Pre-trained Language Models using Japanese Newspaper and Paywalls
upura
0
70
Other Decks in Business
See All in Business
コンセンサスゲーム「NASAゲーム カード版」
chibanba1982
PRO
0
1.8k
ヘリウムリング&フープリレーアクティビティ
chibanba1982
PRO
0
650
Progmat-ST-Market-Outlook-2025
progmat
0
1k
Sales Marker Culture book
salesmarker
PRO
10
28k
プロダクトを次々にPMFさせるためのPlayBook - pmconf2024 落選セッションお披露目会
kubotaku
1
610
ハラスメントについての認識のズレを可視化する「ハラスメントフラグ」
chibanba1982
PRO
0
150
ABCash会社紹介資料「Culture Deck2025」
abcash_recruit
0
10k
FY2025_ASK会社案内
asking
1
150
リンククロスシステム 会社案内
linkc19
0
590
コンセンサスゲーム「NASAゲーム オンライン版」
chibanba1982
PRO
0
630
トレードオフの連続解決を通して対立を協力に変えるプロダクトマネジメントを実現するぞ/continuous management of Trade offs rsgt2025
moriyuya
10
4.5k
コンセンサスゲーム「無人島での出来事」
chibanba1982
PRO
0
460
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
98
18k
Adopting Sorbet at Scale
ufuk
74
9.2k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Making Projects Easy
brettharned
116
6k
Building Your Own Lightsaber
phodgson
104
6.2k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3.1k
VelocityConf: Rendering Performance Case Studies
addyosmani
327
24k
Making the Leap to Tech Lead
cromwellryan
133
9k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
173
51k
Transcript
ػցֶशΛ༻͍ͨ ܦిࢠ൛1SPͷϢʔβੳ ຊܦࡁ৽ฉࣾ ੴݪↅଠ %BUB%SJWFO%FWFMPQFS.FFUVQ +BOOE
ٕज़ॻయͰࣥචɾެ։ ٕज़ॻయ̑Ͱ൦ͨ͠ܦిࢠ൛ͷٕज़ॻΛ࠶ൢ͠·͢ɻ IUUQTOPUFNVOJLLFJ@TUBGGOODCBC • ୲ͨ͠ୈষʮػցֶशΛ༻͍ͨܦిࢠ൛1SP ͷϢʔβੳʯશͯແঈެ։த
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ࣗݾհ • ੴݪↅଠ !VQVSB • ຊܦࡁ৽ฉࣾ ݄ೖࣾ • σʔλΞφϦετˍΤϯδχΞ •
େֶ࣌ɿֶֶ෦ɺ՝֎׆ಈେֶ৽ฉ • झຯɿ,BHHMFɺڝϓϩɺϒϩά ʢ݄BEWFOUDBMFOEBSͳͲͰຊࣥචʣ
σʔλυϦϒϯνʔϜ • αʔϏεاըɾ։ൃӦۀɾϚʔέςΟϯάͰ ʮσʔλΛۙʹʯ • ୯ͳΔੳ͚ͩͰͳ͘ɺج൫ͷඋɺଌఆ߲ͷ ઃܭɺۀޮԽʹ͚ͨڥඋͳͲ • ར༻ݴޠɿ42- 1ZUIPO
3 /PEFKT ຊޠ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
σʔλಓ • σʔλυϦϒϯΛՃ͢Δڭҭ੍ʢʙʣ • ੳ୲ऀ͚ͩͰͳ͘ฤूɾӦۀɾࠂͷؔऀΒ ͕ɺ42-σʔλʹجͮ͘1%$"ͷճ͠ํΛֶͿ • Χ݄ʹΘͨΓिʹҰɺۀ࣌ؒͷ࣌ؒ ͷͰूதతʹऔΓΉ
ۀͷݹ͍ձࣾͰσʔλͷຽओԽΛਐΊͨ IUUQTTQFBLFSEFDLDPNZPTVLFTV[VLJOJLLFJEBUBESJWFO
ػցֶशτϨʔχϯά • σʔλಓͷൃల൛ • ֎෦ߨࢣট͖ɺػցֶशͷཧϏδωεԠ༻ ͢ΔͨΊͷϊϋͳͲΛֶͿ • ύοέʔδΛΘͳ͍ػցֶशΞϧΰϦζϜͷ࣮ ͔Β࢝Ίɺ࠷ऴతʹػցֶशΛ༻͍ͯࣗࣾαʔϏε ͷσʔλΛੳ
ܦిࢠ൛1SP • ๏ਓ͚ͷʮܦిࢠ൛ʯ IUUQTQSOJLLFJDPNQSP • ෳਓͰهࣄͷίϝϯτڞ༗͕Ͱ͖Δάϧʔϓ ػೳͳͲɺݸਓܖͷܦిࢠ൛ʹͳ͍ػೳɾ ίϯςϯπ͕ॆ࣮ • ຊܖલͷແྉτϥΠΞϧΛఏڙ
• ແྉτϥΠΞϧ͔ΒຊܖʹࢸΔׂ߹ɺ͢ͳΘͪ ʮຊܖʯɺച্ʹ݁͢Δॏཁͳࢦඪ
ࠓճͷੳͷత • ຊܖͷ্Λࢦ͠ɺաڈʹແྉτϥΠΞϧ ͔Βຊܖͨ͠ʗ͠ͳ͔ͬͨϢʔβΛରʹ͠ɺ ͦΕͧΕͲͷΑ͏ͳಛ͕͋Δ͔Ѳ • Ϣʔβͷଐੑใར༻ʹؔ͢Δใ͔Βɺ ػցֶशΛ༻͍Δ͜ͱͰେྔͷσʔλΛॲཧ͠ɺ ຊܖ͢Δ͔൱͔ʹؔΘΔಛΛఆੑతͰͳ͘ ఆྔతʹಛఆ
ಛྔͷॏཁ આ໌ม !ɿ Ϣʔβଐੑར༻ user_id "# "$ ... "%
& 00000001 0 00000002 1 00000003 0 తม yɿ ຊܖʹࢸ͔ͬͨ൱͔ ػցֶशϞσϧ ಗ໊Խ͞Εͨ*% ༧ଌʹ༻͍ͨಛͷॏཁΛࢉग़ ˠຊܖʹӨڹ͢ΔಛͱԿ͔ʁ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
"UMBT • ͨ͠ϦΞϧλΠϜσʔλॲཧج൫ʮ"UMBTʯ ϦΞϧλΠϜσʔλॲཧج൫ ʮ"UMBTʯ ͷιʔείʔυΛެ։͠·͢ IUUQTIBDLOJLLFJDPNCMPHBUMBT@PQFOTPVSDF@QSPKFDU
42- 1ZUIPOͰੳ • 3FEBTI্Ͱ42-Λॻ͖ɺσʔλΛऔಘ • ࠓճػցֶशΛ༻͍ͨൺֱతෳࡶͳੳΛߦ͏ ߹্ɺ42-Ͱσʔλऔಘ·ͰΛѻ͍ɺΓͷ ॲཧ1ZUIPOΛར༻ • ˞,JCBOB
%0.0 34UVEJPͳͲར༻Ͱ͖Δ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
୳ࡧతσʔλੳʢ&%"ʣ • औಘͨ͠σʔλͷ֤ಛͷɺܽམͷ༗ແ ͳͲΛ֬ೝ • ݸਓతͳݟղͱͯ͠ɺϏδωεͷੈքͰσʔλΛ ѻ্͍ͬͯ͘Ͱಛʹॏཁͳաఔ • ,BHHMFͳͲͱൺɺϏδωεͰղܾ͖͢ Λಛఆ͠ԾઆΛཱͯΔ͜ͱʹՁ͕͋Δ
σʔλΛදࣔ͢Δ • ଐੑใ͕ఔɺΞΫηεใ͕ఔ
σʔλͷ֓ཁΛ͔ͭΉ • جૅ౷ܭྔܽଛΛோΊΔ • ! == 0 ͕ଟ͍ෆۉߧσʔλ • ʮอଘهࣄʯʮࣗ༝ճͷଐੑใʯʹܽଛ
• ˞લऀ42-ͷॻ͖ํͷʢKPJOʣ
U4/&ͰՄࢹԽ • ߴ࣍ݩσʔλͷ࣍ݩݮͷख๏ • ԫ৭ͷ ! == 1 ͕ൺֱత·ͱ·ͬͨҐஔʹ
ܽଛΧςΰϦมͷॲཧ • ܽଛ͕ଟ͗͢Δมআ • ʮอଘهࣄʯͷܽଛͰຒΊΔ • ΧςΰϦมμϛʔมʹ
-FBLBHFͷআ • ༧ଌͷରͱͳΔʹؔ͢Δ༧ظͤ͵ใֶ͕श σʔλʹଘࡏ͢ΔͨΊɺػցֶशΞϧΰϦζϜ ͕ඇݱ࣮తʹߴ͍ਫ਼Λࣔ͢ݱ • ࠓճʮຊܖਃ͠ࠐΈखଓ͖ϖʔδͷӾཡʯ ͕-FBLBHFʹ • ຊܖΛਃ͠ࠐΉखଓ͖ϖʔδΛӾཡ͍ͯ͠Δ
Ϣʔβɺવ΄΅ͷ֬ͰຊܖʹࢸΔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ػցֶशϞσϧͷબఆ • ਖ਼ղ"6$ͰϞσϧͷਫ਼Λൺֱ
(SBEJFOU#PPTUJOH$MBTTJGJFS • TLMFBSOͷޯϒʔεςΟϯάܾఆΛ࠾༻ • ཧ༝ᶃ ಛͷॏཁΛࢉग़Ͱ͖ɺతʹ߹க • ཧ༝ᶄ 47$ͱൺೋྨҎ֎ʹԠ༻͍͢͠ •
(SJE4FBSDI$7ͰϋΠύʔύϥϝʔλௐ • ަࠩݕূͷ"6$Ͱఔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ಛͷॏཁ • ࠓճͷ༧ଌϞσϧʹ͓͚ΔಛͷॏཁΛग़ྗ • ˞աʹಛͷॏཁΛ৴ͣ͡ɺཧతഎܠΛҙࣝ ͯ͠৻ॏʹղऍ͢Δඞཁ͕͋Δ • αʔϏεӦۀɾϚʔέςΟϯάͷ୲ऀʹڞ༗ ͠ɺࠓޙͷࢪࡦʹ͚ͨٞͷࡐྉʹ
·ͱΊ • ػցֶशΛ༻͍ͯܦిࢠ൛1SPͷϢʔβੳΛ ࣮ࢪ͠ɺແྉτϥΠΞϧ͔ΒຊܖʹࢸΔཁҼͱ ͳΔಛΛఆྔతʹಛఆͨ͠ • Ұݟʮݹष͍ʯຊܦࡁ৽ฉࣾͰɺσʔλ׆༻͕ ੵۃతʹల։͞Ε͍ͯΔ ʢσʔλಓɾσʔλج൫ɾػցֶशͳͲʣ