Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
東海高校OBが語るマスコミでのデータサイエンティストの仕事 / data scientist ...
Search
Shotaro Ishihara
February 24, 2021
Education
0
1.8k
東海高校OBが語るマスコミでのデータサイエンティストの仕事 / data scientist in news media at satprogram38
中止となった「第38回サタデープログラム」で発表予定だった資料を、一般公開用に編集しました。
https://www.satprogram.net/list.html
Shotaro Ishihara
February 24, 2021
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
4
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
140
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
200
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
670
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
870
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
47
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
420
第19回YANSシンポジウムスポンサー資料 / yans2024-nikkei
upura
0
47
Quantifying Memorization of Domain-Specific Pre-trained Language Models using Japanese Newspaper and Paywalls
upura
0
61
Other Decks in Education
See All in Education
Tableau トレーニング【株式会社ニジボックス】
nbkouhou
0
22k
HCI and Interaction Design - Lecture 2 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
860
Image compression
hachama
0
180
Lisätty todellisuus opetuksessa
matleenalaakso
1
2.3k
2409_CompanyInfo_Hanji_published.pdf
yosukemurata
0
620
Web 2.0 Patterns and Technologies - Lecture 8 - Web Technologies (1019888BNR)
signer
PRO
0
2.4k
1127
cbtlibrary
0
170
Nodiレクチャー 「CGと数学」講義資料 2024/11/19
masatatsu
1
250
ThingLink
matleenalaakso
28
3.8k
Blogit opetuksessa
matleenalaakso
0
1.7k
Evaluation Methods - Lecture 6 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
730
Use Cases and Course Review - Lecture 8 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
780
Featured
See All Featured
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
48k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.2k
A better future with KSS
kneath
238
17k
Designing for humans not robots
tammielis
250
25k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
28
8.3k
The Invisible Side of Design
smashingmag
298
50k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
2
270
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
800
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Transcript
౦ւߴߍ0#͕ޠΔ ϚείϛͰͷ σʔλαΠΤϯςΟετͷࣄ ੴݪↅଠ ౦ւߴߍճଔʢʣ ୈճαλσʔϓϩάϥϜʢதࢭʣ ˞ൃද༧ఆͩͬͨࢿྉΛɺҰൠެ։༻ʹฤू ݄
ٕज़ֵ৽ͰมΘΔϚείϛ σʔλαΠΤϯςΟετ l"*z͕ͨΒ͢՝ͱઓ z"*z࣌Λੜ͖͍ͯ͘
χϡʔεϝσΟΞ º σʔλαΠΤϯε
໊ݹͰੜ·ΕΔ த৽ฉ ಡച৽ฉ ΛಡΜͰҭͭ ౦ւߴߍʹೖֶ ౦େ ཧᶗ ʹೖֶˍ ެӹࡒஂ๏ਓ౦ژେֶ৽ฉࣾʹೖࣾ
౦ژେֶ৽ฉࣾʹͯ • هऀɺ൛ɺฤू • σδλϧ൛ͷ্ཱͪ͛ • Πϕϯτओ࠵ • ࠂӦۀ
౦େͰֶ෦ʹਐֶ͠ɺσʔλੳ ΛςʔϚʹݚڀ ଔɿίϛϡχςΟͷಛΛߟྀͨ͠ ݟकΓαʔϏεઃܭख๏ͷ։ൃ ˞ֶ෦ͷଔ༏लΛड
⚔χϡʔεϝσΟΞºσʔλαΠΤϯε • ࠃࡍχϡʔεϝσΟΞڠձʹΑΔ ʮੈքͷࡀҎԼਓʯʹબग़ • ੳͷੈքେձͰ༏উ • ʰ,BHHMFελʔτϒοΫʱग़൛
ٕज़ֵ৽ͰมΘΔ χϡʔεϝσΟΞ
ຊͷ৽ฉͷൃߦ෦ͷਪҠ IUUQTXXXQSFTTOFUPSKQEBUBDJSDVMBUJPODJSDVMBUJPOQIQ ੈଳ୯Ґ
എܠʹٕज़ֵ৽ • ΠϯλʔωοτɾεϚϗͷීٴ • 4/4ొʢ୭͕ൃ৴Ͱ͖Δ࣌ʣ • ʮϚείϛʯͷ่յ • ൃ৴ ༰ݕূ
ݸਓ࠷దԽ
ຖ͍ͬͯΔɾαʔϏεʁ✋ • εϚϗɾλϒϨοτɾύιίϯ ͳͲ • 4/4ɾಈը৴ ͳͲ • χϡʔεαΠτ •
ʢࢴͷʣ৽ฉ
ओઓΠϯλʔωοτ • Մॲ࣌ؒͷୣ͍߹͍ • ڝ߹4/4ɾಈը৴ ͳͲ • ৽ฉΠϯλʔωοτਐग़ • ΩʔϫʔυʮσδλϧԽɾࠃࡍԽʯ
৽ฉࣾͷࡏΓํ͕มΘͬͨ • ࢴͷ৽ฉΛ࡞Δਓ • 🆕 ిࢠ൛Λ࡞Δਓ • 🆕 ϢʔβͷԠΛݟΔਓ •
🆕 ϢʔβͷԠΛݟͯվળ͢Δਓ
σʔλαΠΤϯςΟετ ͱԿऀ͔
ࢴͷ৽ฉ͚ͩͩͬͨ࣌
Πϯλʔωοτ͕ීٴͨ࣌͠ 🆕 ిࢠ൛Λ࡞Δਓ 🆕 ϢʔβͷԠΛ ݟΔਓ 🆕 ϢʔβͷԠΛ ݟͯվળ͢Δਓ
ଟ͘ͷۀքͰى͖͍ͯΔྲྀΕ • ϢϏΩλε *OUFSOFUPG5IJOHT %JHJUBM5SBOTGPSNBUJPO • ͋ΒΏΔͷΛܭଌ͠׆༻͢Δ • ڭҭɾεϙʔπɾྲྀ௨ɾ ͳͲ
ʮσʔλʯ͕ՁΛ࢈Ή σʔλʢӳEBUBʣͱɺࣄ࣮ࢿྉΛ ͢͞ݴ༿ɻ ݴޠతʹෳܗͰ͋ΔͨΊɺ ݫີʹෳͷࣄͷू·Γͷ͜ͱ Λࢦ͠ɺ୯ܗ EBUVNʢσʔλϜʣͰ ͋Δɻ ຊޠXJLJQFEJBΑΓ
σʔλαΠΤϯςΟετͱ ʮσʔλ͔ΒՁΛग़͠ɺ Ϗδωε՝ʹ͑Λग़͢ ϓϩϑΣογϣφϧʯ σʔλαΠΤϯςΟετڠձ IUUQXXXEBUBTDJFOUJTUPSKQGJMFTOFXTQEG
खஈ • ͷઐࣝ • ֶɾ౷ܭͷࣝʢ࣌ʹʮ"*ʯʣ • ϓϩάϥϛϯάͷٕज़ ϓϩάϥϚɾ*5ΤϯδχΞͷҰछ
IUUQTICSPSHEBUBTDJFOUJTUUIFTFYJFTUKPCPGUIFTUDFOUVSZ ੈلɺ࠷ηΫγʔͳࣄ
IUUQTCMPHPTDPN BSUJDMF
۩ମతʹ͍ͬͯΔ͜ͱͷൈਮ • Ϣʔβͷߦಈੳ • هࣄاۀͷਪન • ۀͷࣗಈԽɾޮԽ
• σʔλऩूج൫ͷߏங • ར༻ಈͷੳ • ࢪࡦͷʮ"#ςετʯ • ݟग़͠ͷग़͚͠ʢڧԽֶशʣ
ࢪࡦͷʮ"#ςετʯ " ΫϦοΫ ΫϦοΫ
۩ମతʹ͍ͬͯΔ͜ͱͷൈਮ • Ϣʔβͷߦಈੳ • هࣄاۀͷਪન • ۀͷࣗಈԽɾޮԽ
هࣄاۀͷਪન աڈʹಡΜͩهࣄ ৽͍͠هࣄʢຊʣ Λֶश ਪન
จষΛʮϕΫτϧʯʹม աڈʹಡΜͩهࣄ Λֶश (𝒙, 𝒚) = (𝟕, 𝟐)
ϢʔβͷʮΈʯϕΫτϧΛࢉग़ աڈʹಡΜͩهࣄ Λֶश (𝒙, 𝒚) = (𝟕, 𝟐) ✗
ʮΈʯʹ͍ۙهࣄΛਪન աڈʹಡΜͩهࣄ Λֶश (𝒙, 𝒚) = (𝟕, 𝟐) ✗ (𝒙,
𝒚) = (𝟕, −𝟐) (𝒙, 𝒚) = (𝟑, 𝟔) ڑΛܭࢉ
จষΛʮϕΫτϧʯʹม ౦ւߴߍ0#͕ޠΔʂϚείϛʹ͓͚ΔσʔλαΠΤϯςΟ ετͷࣄ 𝑨 = (𝟏, 𝟏, 𝟏) ςϨϏہ͕౦ւߴߍʹऔࡐʹདྷͨΒ͍͠ 𝑨
= (𝟏, 𝟎, 𝟎) σʔλαΠΤϯςΟετʹͳΔͨΊʹ 𝑨 = (𝟎, 𝟎, 𝟏) ໊ݹʹདྷͨΒखӋઌͱϥʔϝϯͩ 𝑨 = (𝟎, 𝟎, 𝟎)
ϧʔϧ࡞Γқ͕ߴ͍ • Ͳͷ୯ޠΛ࠾༻͢Δʁ • Կݸͷ୯ޠΛج४ʹ͢Δʁ • ʮϚείϛʯʮςϨϏہʯҧ͏ʁ • ͲΕ͚͚ͩۙΕਪન͢Δʁ
ػցֶशʢڭࢣ͋Γֶशʣ
ʮܾఆڥքʯΛֶश աڈʹಡΜͩهࣄ Λֶश
ڭࢣ͋Γֶशͷ۩ମྫ • ը૾ೝࣝʢ(PPHMFը૾ݕࡧʣ • Իೝࣝʢ4JSJʣ • ໎ϝʔϧͷࣗಈྨʢ(NBJMʣ
σʔλੳͷੈքେձʢࢲͷ࣮ʣ • ϖοτͷҾ͖औΓ༧ଌʢ,BHHMF Ґʣ • ѱ࣭ͳίϝϯτͷྨʢ,BHHMF Ґʣ • $07*%ͷ3/"ͷ׆ੑ༧ଌʢ,BHHMF Ґʣ
• පͷ༧ଌʢ4*(/"5& Ґʣ • ٿͷདྷ༧ଌʢύɾϦʔά Ґʣ
۩ମతʹ͍ͬͯΔ͜ͱͷൈਮ • Ϣʔβͷߦಈੳ • هࣄاۀͷਪન • ۀͷࣗಈԽɾޮԽ
• هࣄͷࣗಈཁɾࣗಈੜ • จষͷߍӾɾߍਖ਼ • όΠΞεͷݕ
l"*z͕ͨΒ͢ ՝ͱઓ
• ѱҙΛ͍࣋ͬͨํ • ݸਓ࠷దԽͷฐ • "*ͷެฏੑɾղऍੑ
ѱҙΛ࣋ͬͨίϯςϯπͷੜ • ϑΣΠΫχϡʔεͷ֦ࢄ • ੜٕज़ͷߴԽʼݕূ IUUQTZPVUVCFD2(%NF- IUUQTZPVUVCFG+3O&@)N"
("/ɿఢରతੜωοτϫʔΫͱԿ͔ ʙʮڭࢣͳֶ͠शʯʹΑΔը૾ੜ
ِ͔Λఆ͢Δίϯςετ͕։࠵ ༏উۚສԁ IUUQTXXXLBHHMFDPNDEFFQGBLFEFUFDUJPODIBMMFOHF
ϑΟϧλʔόϒϧ ࣗͷΈͷ༰͚͕ͩ৴͞Εͯࢹ͕ڱ͘ͳΔ ΤίʔνΣϯόʔ ࣗͱಉ͡ҙݟ͔Γʹ͢Δ͜ͱͰɺࣗͷҙݟ ͕ઈରతͩͱޡղͯ͠͠·͏
ηϨϯσΟϐςΟ ૉఢͳۮવɻࢴͷ৽ฉʹ٭ޫʁ 6*69Ͱͷ 4NBSU/FXTͷྫ IUUQTUFDIDSVODIDPNTNBSUOFXTMBUFTU OFXTEJTDPWFSZGFBUVSFTIPXTVTFSTBSUJDMFTGSPNBDSPTT UIFQPMJUJDBMTQFDUSVN
"*ͷஅͰਓੜΛࠨӈ͞ΕΔࣄྫ • "*ͳͥͦͷஅΛԼ͔ͨ͠ʁ • அྙཧతɾಓಙతʹଥ͔ • ઃܭࣗମʹͳ͍ͷ͔ʁ
ۙͰٞΛݺΜͩྫ • ࠾༻ʹؔ͢Δ"* • ۚ༥ʹؔ͢Δ"* • ਓछʹؔ͢Δ"*
l"*z࣌Λ ੜ͖͍ͯ͘
ຊͷ·ͱΊ • ٕज़ֵ৽ͰۀքʹมԽ͕ى͖ͨ • σʔλ͔ΒՁΛग़͢Δ࣌ • େͳͷ͍ํ
དྷऀͷϝοηʔδ ʮ"*ʯͷൃల͕͞·͟·ʹͳΔதɺਓؒʹ͔͠Ͱ͖ͳ͍ͷ ʮఆٛʯ͢Δ͜ͱͩͱݸਓతʹࢥ͍ͬͯ·͢ɻٕज़ͰԿͰՄೳʹ ͳͬͨͱ͖ɺԿΛͬͯΑ͍͔ܾΊΔͷ͕େͰ͢ɻʮཧܥɾจܥʯ ͱ͍͏ΈʹनΘΕͳ͍ɺΑΓྖҬԣஅతͳ͕ٞඞཁͰɺதߴੜ ͷօ͞Μʹͥͻ෯͘ઓͯ͠Έͯ΄͍͠Ͱ͢ɻࣗʮχϡʔε ϝσΟΞºσʔλαΠΤϯεʯͷֻ͚߹ΘͤͰࣄΛ͍ͯ͠·͢ɻ