Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikke...
Search
Shotaro Ishihara
January 22, 2019
Business
8
10k
機械学習を⽤いた⽇経電⼦版Proのユーザ分析 / Data Analysis in Nikkei using Machine Learning
Data Driven Developer Meetup #4 (#d3m) での発表資料
https://d3m.connpass.com/event/115217/
Shotaro Ishihara
January 22, 2019
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
Semantic Shift Stability: 学習コーパス内の単語の意味変化を用いた事前学習済みモデルの時系列性能劣化の監査
upura
0
12
日本語ニュース記事要約支援に向けたドメイン特化事前学習済みモデルの構築と活用 / t5-news-summarization
upura
0
13
Web からのデータ収集と探究事例の紹介 / no94_jsai_seminar
upura
0
200
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
83
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
270
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
300
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
870
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
1k
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
75
Other Decks in Business
See All in Business
株式会社FLINTERS 会社紹介資料
flinters
0
380
株式会社ジグザグ_新規投資家向け資料.pdf
zig_zag
0
3.1k
[採用資料] Quollio Technologies
rytmq
PRO
2
8.3k
大城エネルギー 会社紹介スライド
daijyou
0
4.6k
LINEヤフー会社説明資料
lycorp_recruit_jp
0
390
GMOフィナンシャルHD 会社紹介資料
gmofh_hr_team
0
46k
Introduction of Elastic Infra INC.
elasticinfra
0
190
Josh Blyskal | Profound | We analyed 10,000,000 AI Search Results...
joshbly
1
840
(43枚)絶対達成インバスケット研修の特徴と3つのメリット
nyattx
PRO
0
120
CSオンボーディング改善におけるCRE的アプローチ / CRE approach to improving CS onboarding
woody_kawagoe
0
700
i3DESIGN_Culture_Book / We-are-hiring
i3design
0
34k
DWANGO(旧KADOKAWA Connected)|事業紹介資料
kadokawaconnected
4
76k
Featured
See All Featured
What's in a price? How to price your products and services
michaelherold
245
12k
Embracing the Ebb and Flow
colly
85
4.6k
Code Review Best Practice
trishagee
67
18k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Unsuck your backbone
ammeep
670
57k
Designing Experiences People Love
moore
141
23k
How STYLIGHT went responsive
nonsquared
99
5.5k
How to train your dragon (web standard)
notwaldorf
91
6k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
28
1.6k
YesSQL, Process and Tooling at Scale
rocio
172
14k
Statistics for Hackers
jakevdp
798
220k
Transcript
ػցֶशΛ༻͍ͨ ܦిࢠ൛1SPͷϢʔβੳ ຊܦࡁ৽ฉࣾ ੴݪↅଠ %BUB%SJWFO%FWFMPQFS.FFUVQ +BOOE
ٕज़ॻయͰࣥචɾެ։ ٕज़ॻయ̑Ͱ൦ͨ͠ܦిࢠ൛ͷٕज़ॻΛ࠶ൢ͠·͢ɻ IUUQTOPUFNVOJLLFJ@TUBGGOODCBC • ୲ͨ͠ୈষʮػցֶशΛ༻͍ͨܦిࢠ൛1SP ͷϢʔβੳʯશͯແঈެ։த
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ࣗݾհ • ੴݪↅଠ !VQVSB • ຊܦࡁ৽ฉࣾ ݄ೖࣾ • σʔλΞφϦετˍΤϯδχΞ •
େֶ࣌ɿֶֶ෦ɺ՝֎׆ಈେֶ৽ฉ • झຯɿ,BHHMFɺڝϓϩɺϒϩά ʢ݄BEWFOUDBMFOEBSͳͲͰຊࣥචʣ
σʔλυϦϒϯνʔϜ • αʔϏεاըɾ։ൃӦۀɾϚʔέςΟϯάͰ ʮσʔλΛۙʹʯ • ୯ͳΔੳ͚ͩͰͳ͘ɺج൫ͷඋɺଌఆ߲ͷ ઃܭɺۀޮԽʹ͚ͨڥඋͳͲ • ར༻ݴޠɿ42- 1ZUIPO
3 /PEFKT ຊޠ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
σʔλಓ • σʔλυϦϒϯΛՃ͢Δڭҭ੍ʢʙʣ • ੳ୲ऀ͚ͩͰͳ͘ฤूɾӦۀɾࠂͷؔऀΒ ͕ɺ42-σʔλʹجͮ͘1%$"ͷճ͠ํΛֶͿ • Χ݄ʹΘͨΓिʹҰɺۀ࣌ؒͷ࣌ؒ ͷͰूதతʹऔΓΉ
ۀͷݹ͍ձࣾͰσʔλͷຽओԽΛਐΊͨ IUUQTTQFBLFSEFDLDPNZPTVLFTV[VLJOJLLFJEBUBESJWFO
ػցֶशτϨʔχϯά • σʔλಓͷൃల൛ • ֎෦ߨࢣট͖ɺػցֶशͷཧϏδωεԠ༻ ͢ΔͨΊͷϊϋͳͲΛֶͿ • ύοέʔδΛΘͳ͍ػցֶशΞϧΰϦζϜͷ࣮ ͔Β࢝Ίɺ࠷ऴతʹػցֶशΛ༻͍ͯࣗࣾαʔϏε ͷσʔλΛੳ
ܦిࢠ൛1SP • ๏ਓ͚ͷʮܦిࢠ൛ʯ IUUQTQSOJLLFJDPNQSP • ෳਓͰهࣄͷίϝϯτڞ༗͕Ͱ͖Δάϧʔϓ ػೳͳͲɺݸਓܖͷܦిࢠ൛ʹͳ͍ػೳɾ ίϯςϯπ͕ॆ࣮ • ຊܖલͷແྉτϥΠΞϧΛఏڙ
• ແྉτϥΠΞϧ͔ΒຊܖʹࢸΔׂ߹ɺ͢ͳΘͪ ʮຊܖʯɺച্ʹ݁͢Δॏཁͳࢦඪ
ࠓճͷੳͷత • ຊܖͷ্Λࢦ͠ɺաڈʹແྉτϥΠΞϧ ͔Βຊܖͨ͠ʗ͠ͳ͔ͬͨϢʔβΛରʹ͠ɺ ͦΕͧΕͲͷΑ͏ͳಛ͕͋Δ͔Ѳ • Ϣʔβͷଐੑใར༻ʹؔ͢Δใ͔Βɺ ػցֶशΛ༻͍Δ͜ͱͰେྔͷσʔλΛॲཧ͠ɺ ຊܖ͢Δ͔൱͔ʹؔΘΔಛΛఆੑతͰͳ͘ ఆྔతʹಛఆ
ಛྔͷॏཁ આ໌ม !ɿ Ϣʔβଐੑར༻ user_id "# "$ ... "%
& 00000001 0 00000002 1 00000003 0 తม yɿ ຊܖʹࢸ͔ͬͨ൱͔ ػցֶशϞσϧ ಗ໊Խ͞Εͨ*% ༧ଌʹ༻͍ͨಛͷॏཁΛࢉग़ ˠຊܖʹӨڹ͢ΔಛͱԿ͔ʁ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
"UMBT • ͨ͠ϦΞϧλΠϜσʔλॲཧج൫ʮ"UMBTʯ ϦΞϧλΠϜσʔλॲཧج൫ ʮ"UMBTʯ ͷιʔείʔυΛެ։͠·͢ IUUQTIBDLOJLLFJDPNCMPHBUMBT@PQFOTPVSDF@QSPKFDU
42- 1ZUIPOͰੳ • 3FEBTI্Ͱ42-Λॻ͖ɺσʔλΛऔಘ • ࠓճػցֶशΛ༻͍ͨൺֱతෳࡶͳੳΛߦ͏ ߹্ɺ42-Ͱσʔλऔಘ·ͰΛѻ͍ɺΓͷ ॲཧ1ZUIPOΛར༻ • ˞,JCBOB
%0.0 34UVEJPͳͲར༻Ͱ͖Δ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
୳ࡧతσʔλੳʢ&%"ʣ • औಘͨ͠σʔλͷ֤ಛͷɺܽམͷ༗ແ ͳͲΛ֬ೝ • ݸਓతͳݟղͱͯ͠ɺϏδωεͷੈքͰσʔλΛ ѻ্͍ͬͯ͘Ͱಛʹॏཁͳաఔ • ,BHHMFͳͲͱൺɺϏδωεͰղܾ͖͢ Λಛఆ͠ԾઆΛཱͯΔ͜ͱʹՁ͕͋Δ
σʔλΛදࣔ͢Δ • ଐੑใ͕ఔɺΞΫηεใ͕ఔ
σʔλͷ֓ཁΛ͔ͭΉ • جૅ౷ܭྔܽଛΛோΊΔ • ! == 0 ͕ଟ͍ෆۉߧσʔλ • ʮอଘهࣄʯʮࣗ༝ճͷଐੑใʯʹܽଛ
• ˞લऀ42-ͷॻ͖ํͷʢKPJOʣ
U4/&ͰՄࢹԽ • ߴ࣍ݩσʔλͷ࣍ݩݮͷख๏ • ԫ৭ͷ ! == 1 ͕ൺֱత·ͱ·ͬͨҐஔʹ
ܽଛΧςΰϦมͷॲཧ • ܽଛ͕ଟ͗͢Δมআ • ʮอଘهࣄʯͷܽଛͰຒΊΔ • ΧςΰϦมμϛʔมʹ
-FBLBHFͷআ • ༧ଌͷରͱͳΔʹؔ͢Δ༧ظͤ͵ใֶ͕श σʔλʹଘࡏ͢ΔͨΊɺػցֶशΞϧΰϦζϜ ͕ඇݱ࣮తʹߴ͍ਫ਼Λࣔ͢ݱ • ࠓճʮຊܖਃ͠ࠐΈखଓ͖ϖʔδͷӾཡʯ ͕-FBLBHFʹ • ຊܖΛਃ͠ࠐΉखଓ͖ϖʔδΛӾཡ͍ͯ͠Δ
Ϣʔβɺવ΄΅ͷ֬ͰຊܖʹࢸΔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ػցֶशϞσϧͷબఆ • ਖ਼ղ"6$ͰϞσϧͷਫ਼Λൺֱ
(SBEJFOU#PPTUJOH$MBTTJGJFS • TLMFBSOͷޯϒʔεςΟϯάܾఆΛ࠾༻ • ཧ༝ᶃ ಛͷॏཁΛࢉग़Ͱ͖ɺతʹ߹க • ཧ༝ᶄ 47$ͱൺೋྨҎ֎ʹԠ༻͍͢͠ •
(SJE4FBSDI$7ͰϋΠύʔύϥϝʔλௐ • ަࠩݕূͷ"6$Ͱఔ
ຊͷ • ࣗݾհ • σʔλಓͱʮܦిࢠ൛1SPʯ • σʔλͷऔಘ • ୳ࡧతσʔλੳͱલॲཧ •
༧ଌϞσϧͷߏங • ݁ՌͷղऍͱϏδωε׆༻
ಛͷॏཁ • ࠓճͷ༧ଌϞσϧʹ͓͚ΔಛͷॏཁΛग़ྗ • ˞աʹಛͷॏཁΛ৴ͣ͡ɺཧతഎܠΛҙࣝ ͯ͠৻ॏʹղऍ͢Δඞཁ͕͋Δ • αʔϏεӦۀɾϚʔέςΟϯάͷ୲ऀʹڞ༗ ͠ɺࠓޙͷࢪࡦʹ͚ͨٞͷࡐྉʹ
·ͱΊ • ػցֶशΛ༻͍ͯܦిࢠ൛1SPͷϢʔβੳΛ ࣮ࢪ͠ɺແྉτϥΠΞϧ͔ΒຊܖʹࢸΔཁҼͱ ͳΔಛΛఆྔతʹಛఆͨ͠ • Ұݟʮݹष͍ʯຊܦࡁ৽ฉࣾͰɺσʔλ׆༻͕ ੵۃతʹల։͞Ε͍ͯΔ ʢσʔλಓɾσʔλج൫ɾػցֶशͳͲʣ