Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
対話型AIの構築における工夫とデータセットの重要性 - 素早くデータを構築し検証するためには
Search
yag_ays
September 30, 2022
Research
3
5.9k
対話型AIの構築における工夫とデータセットの重要性 - 素早くデータを構築し検証するためには
「自然言語MLエンジニアから学ぶ!対話型AIにおける高品質なデータセット作成ノウハウ」
https://campaign.fastlabel.ai/20220930-seminar
yag_ays
September 30, 2022
Tweet
Share
More Decks by yag_ays
See All by yag_ays
目と耳を持った自然言語処理 - スタートアップにおける価値創出のために
yag_ays
1
1.7k
時間情報表現抽出とルールベース解析器のこれから / Temporal Expression Analysis in Japanese and Future of Rule-based Approach
yag_ays
1
1.8k
Pythonで始める ドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
yag_ays
9
8.2k
"医者の言葉、患者の言葉、エンジニアの言葉" / MNTSQ Ubie Vertical ai
yag_ays
3
13k
LT at nlp_career
yag_ays
0
290
Review: "Recommending Investors for Crowdfunding Projects"
yag_ays
1
1.1k
Other Decks in Research
See All in Research
SSII2024 [SS1] 拡散モデルの今 〜 2024年の研究動向 〜
ssii
PRO
2
2.1k
自動運転・AIシステムの問題を賢く探す・賢く直す / Smart Search & Repair Techniques for Automated Driving Systems and AI Systems
ishikawafyu
0
180
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
100
SSII2024 [OS3] 企業における基盤モデル開発の実際
ssii
PRO
0
560
出生抑制策と少子化
morimasao16
0
390
独立成分分析を用いた埋め込み表現の視覚的な理解
momoseoyama
4
900
LLMとの共同執筆は文章の多様性を減らすか?
kuri8ive
4
790
[CV勉強会@関東 CVPR2024] Visual Layout Composer: Image-Vector Dual Diffusion Model for Design Layout Generation / kantocv 61th CVPR 2024
shunk031
1
280
DiscordにおけるキャラクターIPを活用したUGCコンテンツ生成サービスの ラピッドプロトタイピング ~国際ハッカソンでの事例研究
o_ob
0
210
Weekly AI Agents News! 7月号 プロダクト/ニュースのアーカイブ
masatoto
0
120
SSII2024 [OS2] 大規模言語モデルとVision & Languageのこれから
ssii
PRO
5
1.4k
大規模言語モデル (LLM) の技術と最新動向
ikuyamada
32
18k
Featured
See All Featured
Faster Mobile Websites
deanohume
304
30k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
502
140k
Designing Experiences People Love
moore
138
23k
Debugging Ruby Performance
tmm1
72
12k
How to train your dragon (web standard)
notwaldorf
85
5.6k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
278
13k
GitHub's CSS Performance
jonrohan
1029
450k
Music & Morning Musume
bryan
46
6k
Clear Off the Table
cherdarchuk
91
320k
Designing for humans not robots
tammielis
248
25k
A better future with KSS
kneath
235
17k
Rebuilding a faster, lazier Slack
samanthasiow
78
8.6k
Transcript
ରܕAIͷߏஙʹ͓͚Δͱσʔληοτͷॏཁੑ ૉૣ͘σʔλΛߏங͠ݕূ͢ΔͨΊʹ 2022/09/30 Ubieגࣜձࣾ Ԟా ༟थ
2 Ԟా ༟थ Yuki Okuda Recruit → Sansan → Ubie
@yag_ays ࣗݾհ https://yag-ays.github.io/
3 ࠓ͢͜ͱ / ͞ͳ͍͜ͱ ͢͜ͱ • ʮίΤΧϧςʯʹ͓͚Δର͔ΒͷΧϧςੜ • ͲͷΑ͏ͳλεΫͷσʔλΛΞϊςʔγϣϯʹΑΓ࡞͔ͨ͠ •
σʔλ࡞ͷ࣮ྫհ • ґཔܕͷΫϥυιʔγϯάͷσʔλ࡞ґཔ • ΞϊςʔγϣϯαʔϏεձࣾͷσʔλ࡞ґཔ • σʔλ࡞ʹ͓͚Δૉૣ͍Ձݕূͷॏཁੑ • Ξϊςʔγϣϯ࡞ۀʹ͓͚Δෆ࣮֬ੑʹ͍ͭͯ ͞ͳ͍͜ͱ • Ξϊςʔγϣϯͨ͠σʔλΛར༻ͨ͠ػցֶशͷ۩ମٕज़ɺΞΫςΟϒϥʔχϯάͳͲ
4 • ࡞ۀऀ • Ξϊςʔγϣϯ࡞ۀΛߦ͏ਓɻΞϊςʔλʔɺΫϥυϫʔΧʔͱݴ͏ • ୀ۶ͳσʔλ࡞࡞ۀΛࠜؾڧ͘ߦͬͯ͘ΕΔ༗Γ͍ଘࡏ • ґཔऀ •
Ξϊςʔγϣϯ࡞ۀΛґཔ͢Δਓ • ࠓճͰݴ͏ͱࢲͷ͜ͱɻଵଦͰظͰίϛϡχέʔγϣϯ͕ۤख • ΞϊςʔγϣϯαʔϏεձࣾ • ػցֶशͷσʔλ࡞Ξϊςʔγϣϯ࡞ۀΛ͚ෛ͏ձࣾͷ͜ͱ • ࠓճͷ߹FastLabel͞ΜͷΑ͏ͳձࣾ ొਓɾ༻ޠ
5 ʮίΤΧϧςʯʹ͓͚Δର͔ΒͷΧϧςੜ
6 ʮίΤΧϧςʯձ͔ΒࣗಈͰΧϧςΛੜ͢ΔϓϩμΫτ ʮࠓͲ͏͞Ε·͔ͨ͠ʁʯ ʮࠓே͔Β಄͕௧ͯ͘ɺు͖ؾগ͋͠ΔΜͰ͢ʯ ɾࠓே͔Β಄௧ ɾᅅؾ • ҩࢣͷͷԻ͔ΒϦΞϧλΠϜͰจࣈى͜͠ & ΧϧςੜΛߦ͏
• ҩࢣͷΧϧςهࡌෛՙͷݮ • จࣈى݁͜͠ՌʹΑΔه (ΠϯϑΥʔϜυίϯηϯτ) ͷׂ
7 • Իೝࣝɿҩࢣͱױऀͷձͷจࣈى͜͠ • ҩྍͷઐ༻ޠͷରԠɺಉԻҟٛޠͷରԠ • e.g. A1cʢ͑ʔΘΜ͠ʔ, ݂ӷݕࠪͷ໊߲ʣɺײછͱסᚔ •
ҩࢣͱױऀͷऀೝࣝɺϚΠΫͷਫ਼ɺࣨͷϊΠζɺ • ࣗવݴޠॲཧɿจࣈىͨ͜͠͠ձςΩετ͔ΒͷΧϧςهࡌจͷ࡞ • ձจͷॻ͖ى͜͠Λೖྗͱͯ͠ѻ͏ • ޱޠௐɺϑΟϥʔɺݴ͍ؒҧ͍ɺͦͦจࣈى͜͠ͷೝࣝؒҧ͍ • ձͷҙຯΛཧղ͠ɺΧϧςจΛநग़/ੜ͢ΔͨΊͷཁλεΫ • ױऀͷݴ༿͔Βҩࢣͷݴ༿ͷมɺࣗવͳΧϧςهࡌจΛ࡞͢Δඞཁ ίΤΧϧςʹ͓͚ΔػցֶशλεΫ ࠓճࣗવݴޠॲཧͷΧϧςจੜλεΫʹ͍͓ͭͯ͠·͢
8 • ύϒϦοΫʹར༻Մೳͳσʔληοτͷෆࡏ • ݸਓใ؍Ͱױऀσʔλ৻ॏʹऔΓѻΘΕɺݚڀͱ͍͑Ͳ༰қʹެ։Ͱ͖ͳ͍ • ҰํͰɺප໊ҩྍτϐοΫͷࣙॻͳͲެ։͞Ε͍ͯΔ • ҩࢣޢࢣͱ͍ͬͨҩྍैࣄऀߴ୯Ձ •
ઐٕೳΛ༗͢Δҩྍैࣄऀͷ୯Ձߴ͍ • ·ͱ·ͬͨ༧ࢉ͕ͳ͚ΕେنʹσʔληοτΛ࡞͢Δ͜ͱ͍͠ ҰൠతͳҩྍυϝΠϯʹ͓͚Δσʔληοτ࡞ͷϋʔυϧ → λεΫʹ߹ͬͨσʔληοτΛ͍͔ʹޮΑ͘࡞͢Δ͔ʁ
9 • ҰൠతʹػցֶशʹΑͬͯ༧ଌ/ੜ͢ΔతมΛɺ࡞ۀऀ͕࡞͢Δ • ࠓճͷ߹ɺ࡞ۀऀΧϧςΛॻ͚ΔҩࢣͰͳ͍ͱͰ͖ͳ͍ → ߴ୯ՁͰֻ͓͕͔ۚΔ ҩࢣͰͳ͍ී௨ͷ࡞ۀऀ͕σʔλ࡞Ͱ͖ΔΑ͏ʹλεΫΛม͢Δ ௨ৗ ʮࠓͲ͏͞Ε·͔ͨ͠ʁʯ
ʮࠓே͔Β಄͕௧ͯ͘ɺు͖ؾ গ͋͠ΔΜͰ͢ʯ ೖྗ ग़ྗ ɾࠓே͔Β಄௧ ɾᅅؾ
10 • ҰൠతʹػցֶशʹΑͬͯ༧ଌ/ੜ͢ΔతมΛɺ࡞ۀऀ͕࡞͢Δ • ࠓճͷ߹ɺ࡞ۀऀΧϧςΛॻ͚ΔҩࢣͰͳ͍ͱͰ͖ͳ͍ → ߴ୯ՁͰֻ͓͕͔ۚΔ • ͠తม͕ܾ·͍ͬͯΔͷͰ͋Εɺٯʹσʔλ෦Λ࡞͢Δͱ͍͏λεΫʹมͰ͖Δ •
ͷձױऀʹ͔ΔΑ͏ʹฏқͳݴ༿Ͱ͞ΕΔ͜ͱ͕ଟ͍ ҩࢣͰͳ͍ී௨ͷ࡞ۀऀ͕σʔλ࡞Ͱ͖ΔΑ͏ʹλεΫΛม͢Δ ௨ৗ มޙ ʮࠓͲ͏͞Ε·͔ͨ͠ʁʯ ʮࠓே͔Β಄͕௧ͯ͘ɺు͖ؾ গ͋͠ΔΜͰ͢ʯ ೖྗ ग़ྗ ɾࠓே͔Β಄௧ ɾᅅؾ ɾࠓே͔Β಄௧ ɾᅅؾ ʮࠓͲ͏͞Ε·͔ͨ͠ʁʯ ʮࠓே͔Β಄͕௧ͯ͘ɺు͖ؾ গ͋͠ΔΜͰ͢ʯ
11 σʔλ࡞ͷ࣮ྫ - ґཔܕ
12 • ୈ1εςοϓͱͯ͠ΫϥυιʔγϯάΛར༻ͯ͠σʔλऩू • ͱʹ͔͘ਫ਼͕ͯ͘ྑ͍ͷͰσʔλ͕͋ΕΧϧςੜ͕Ͱ͖Δ͜ͱΛݕূ͍ͨ͠ • Σϒ্Ͱґཔऀͱ࡞ۀऀ͕ΓऔΓ͢ΔΫϥυιʔγϯάͷϓϥοτϑΥʔϜΛར༻ • ґཔ༰ •
6໊ʹґཔʢσʔληοτΛ3ׂɺಉҰλεΫΛ2໊ʹׂΓৼΓʣ • λεΫࣗମ1ਓ͋ͨΓ4࣌ؒ΄ͲͰऴྃ͢Δྔ • ΞϊςʔγϣϯπʔϧOSSͷDoccano*Λར༻ ୈ1εςοϓɿґཔܕͷΫϥυιʔγϯάαʔϏεΛར༻ * https://github.com/doccano/doccano
13 ϝϦοτ • Ձ֨ަব͕ՄೳͰɺൺֱత҆Ձʹ͑ΒΕΔ • ࢧ͍ํ๏: ݻఆใु / ࣌ؒ୯Ձ Λબ
• ࡞ۀऀͷϦιʔεΛؾʹ͢Δඞཁ͕ͳ͍ ʢܖ࣌ʹظՔಇఆΛ߹ҙʣ • ৬छઐٕೳΛߟྀͨ͠ґཔ͕Մೳ • ҩࢣޢࢣͱ͍ͬͨ৬छΛެ։͍ͯ͠ Δਓʹରͯ͠ɺݸผʹґཔՄೳ ґཔܕͷΫϥυιʔγϯάαʔϏε σϝϦοτ • ४උґཔ࣌ͷཧ͕͔͔Δ • ࡞ۀऀ͝ͱʹ࡞ۀγʔτid/passwordΛɹ ͍ग़ͯ͠ݸผʹ࿈བྷ • ࡞ۀऀͷ࣭࿈བྷʹճ͕ඞཁ • ґཔ͕ଟ͘ͳΕͳΔ΄Ͳཧ૿େ • ܧଓతͳґཔ͕͍͠߹͕͋Δ • ༏ྑͳ࡞ۀऀ͕͍ͨͱͯ͠ɺܧଓతʹ࡞ۀΛ ґཔͰ͖Δ͔ͦͷ࡞ۀऀ࣍ୈ
14 ΫϥυιʔγϯάʹΑΔΞϊςʔγϣϯ࡞ۀͷྲྀΕ ࣄલ४උ ืूɾܖక݁ɾґཔ ࡞ۀ ࡞ۀྃ ݕ ݁Ռͷूܭ
15 • Ξϊςʔγϣϯ༻ͷσʔληοτ࡞ • ࡞ۀऀ͝ͱʹσʔλΛׂ͢Δ • શϥϯμϜ͕ྑ͍ͷ͔ɺಉҰ࡞ۀऀʹಉ ͡ͷσʔλΛͤͨ΄͏͕ྑ͍ͷ͔ • ΞϊςʔγϣϯΨΠυϥΠϯΛ࡞
• ࡞ۀํ๏Λهड़ͨ͠υΩϡϝϯτ • ΨΠυϥΠϯ͕ਫ਼៛ʹఆ·͍ͬͯͳ͍ͱɹ ظ͢ΔΞτϓοτ͕ग़ͯ͜ͳ͍ • ࡞ۀऀͷ࣭ͳͲʹԠͯ͡ਵ࣌Ξοϓσʔτ͠ ͍ͯ͘ ࡞ۀͷྲྀΕ: ࣄલ४උ ࣄલ४උ ืूɾܖక݁ɾґཔ ࡞ۀ ࡞ۀྃ ݕ ݁Ռͷूܭ
16 ࣮ࡍʹ࡞ͨ͠ΞϊςʔγϣϯΨΠυϥΠϯ
17 ࣮ࡍʹ࡞ͨ͠ΞϊςʔγϣϯΨΠυϥΠϯ ࡞ۀํ๏ πʔϧͷ͍ํखॱ ۩ମྫ ྑ͍ೖྗ/ѱ͍ೖྗͷྫࣔ શମͷ֓ཁ ɾͳͥ͜ͷλεΫΛ͢Δͷ͔
18 • ฏқͳݴ༿ͰΘ͔Γ͘͢આ໌͠ɺεΫϦʔϯγϣοτಈըΛଟ༻͢Δ • ࡞ۀऀҰൠͷਓͳͷͰɺͳΔ͘ԣจࣈઐ༻ޠΘͣʹฏқͳݴ༿Λ͏ • ࣮ࡍͷπʔϧͷ͍ํΛը૾ಈըͰઆ໌͢Δͱཧղ͕ૣ͍ • ࡞ۀͷ۩ମྫΛఏࣔ͢Δ •
ͲΜͳΞτϓοτΛظ͞Ε͍ͯΔͷ͔Λཧղͯ͠Β͏ • ͨͩ͠ྫࣔͷΠϝʔδ͕ڧ͗͢ΔͱͦΕʹҾͬுΒΕͯ͠·͏ͷͰɺඞཁ࠷খݶʹ͢Δ • (ඞཁʹԠͯ͡) ಡΜͩޙʹ؆୯ͳ࡞ۀΛͬͯΒ͏ • υΩϡϝϯτΛಡΜ͚ͩͩͰᘳʹͰ͖ΔΘ͚Ͱͳ͍ • ࡞ۀऀͷཧղٕྔΛଌΔͨΊʹɺٖతͳλεΫΛ࣮ߦͯ͠Β͏ ΞϊςʔγϣϯΨΠυϥΠϯͷίπ
19 • ืू • ืूจΛ࡞ͯ͠ग़ߘ • ࡞ۀ༰ͷઆ໌ • ୯Ձ /
ใुͷछྨ (ݻఆใु or ࣌ؒ୯Ձ) • ఆ࣌ؒ • ඞཁεΩϧܦݧ • ϓϥοτϑΥʔϜʹΑͬͯґཔଆ͔Β࡞ۀऀ Λબͯ͠࡞ۀґཔΛૹΔ͜ͱՄೳ • ܖక݁ɾґཔ • Ԡืऀʹ͕ͳ͚Εґཔ͠ۀΛ։࢝ ࡞ۀͷྲྀΕ: ืूɾܖక݁ ࣄલ४උ ืूɾܖక݁ɾґཔ ࡞ۀ ࡞ۀྃ ݕ ݁Ռͷूܭ
20 ࡞ۀલͷίϛϡχέʔγϣϯɿ࡞ۀऀͱͷίϛϡχέʔγϣϯ ܖޙͷѫࡰͱґཔ ݕͱՃରԠ
21 • جຊతʹ࡞ۀऀͷ࡞ۀ͕ྃ͢ΔͷΛͭ • ͨͩ͠ฒྻͰෳͷ࡞ۀऀʹґཔ͍ͯ͠Δͱɹ ίϛϡχέʔγϣϯ͕ൃੜ͢ΔͨΊຖேϓϥο τϑΥʔϜͷνϟοτཝΛνΣοΫ͢Δ • ࡞ۀʹؔ͢Δ࣭ͷճରԠ •
͕ࣗґཔͨ͠ํ͔ͳΓஸೡʹͬͯ͘ΕΔ ਓ͔ΓͩͬͨͷͰɺࡉ͔͍෦࣭ͯ͘͠ Εͨ • ݕ • Ռͷ࠷ऴνΣοΫ • ࡞ۀͷൈ͚࿙Ε͕͋ΔͱՃͰ࡞ۀͯ͠Β͏ ࡞ۀͷྲྀΕ: ࡞ۀˠྃˠݕ ࣄલ४උ ืूɾܖక݁ɾґཔ ࡞ۀ ࡞ۀྃ ݕ ݁Ռͷूܭ
22 • ϓϩδΣΫτ։࢝ޙͷԾઆݕূʹྑ͍ • ४උ͕ྃ࣍͠ୈ͙͢ʹ࡞ۀΛ։࢝ͯ͘͠ΕΔͷͰɺগྔσʔλͳΒ͙͢ʹू·Δ • ఆ͍ͯ͠ͳ͔ͬͨΞϊςʔγϣϯΨΠυϥΠϯͷෆඋʹؾ͘͜ͱ͕Ͱ͖Δ • ෳͷ࡞ۀऀͱͷίϛϡχέʔγϣϯ/Ϛωʔδϝϯτ͕ϘτϧωοΫʹͳΓεέʔϧࠔ •
࡞ۀऀͷ࡞ۀ༰ࢦಋ࣭ͷճͳͲɺࢥͬͨҎ্ʹ࡞ۀ͕ൃੜ͢Δ • εέʔϧͤ͞ΔʹґཔऀଆʹཧऀΛཱͯͯɺ࡞ۀ༰ʹशख़ͯ͠Β͏ඞཁ͕͋Δ ґཔܕͷ·ͱΊ → ཧͷݮͱσʔλ࡞ͷεέʔϧΞτͷͨΊʹ ɹΞϊςʔγϣϯ࡞ձࣾґཔ͢Δ͜ͱʹ
23 σʔλ࡞ͷ࣮ྫ - ΞϊςʔγϣϯαʔϏεܕ
24 • ࣍ʹΞϊςʔγϣϯαʔϏεͷձࣾʹґཔ͢Δ͜ͱʹ • ཧͷݮͱσʔλऩू্ͷͨΊ • ॳظݕূΛૉૣ͘ߦ͏ͨΊʹҰ࣌తͳίετ૿ߏΘͳ͍ • ෳࣾʹݟੵΓΛґཔ •
ࢥ͍ͭ͘ΞϊςʔγϣϯαʔϏεΛఏڙ͍ͯ͠ΔձࣾΛϦετΞοϓ͠ɺϝʔϧΛૹΔ • ࠓճλεΫ͕গ͠ෳࡶʢର/ੜλεΫʣͳͷͰɺϦϞʔτϛʔςΟϯάͷґཔߦͬͨ • ࠓճFastLabel͞Μʹґཔ͢Δ͜ͱʹ • ܾΊखஈ + ରԠͷஸೡ͞ • (ੲTwitterͰΓऔΓ͕͋ΓΞϊςʔγϣϯπʔϧ࡞ͬͯͯ໘നͦ͏ͳձࣾͩͬͨͱ͍͏ͷ) ୈ2εςοϓɿΞϊςʔγϣϯ࡞ձࣾͷґཔ
25 ΞϊςʔγϣϯαʔϏεʹґཔ͢Δ͜ͱͰɺ֤ఔ͕Ͳ͏ͳΔ͔ ΞϊςʔγϣϯαʔϏε ࣄલ४උ ืूɾܖక݁ɾґཔ ࡞ۀ ࡞ۀྃ ݕ ݁Ռͷूܭ ࣄલ४උɾґཔ
ݕ ݁Ռड͚औΓ
26 • ࡞ۀऀͷϚωʔδϝϯτ͓Αͼ֤छίϛϡχέʔγϣϯϥΠϯ͕؆ུԽ • େ෯ͳཧݮ ࡞ۀऀͱͷίϛϡχέʔγϣϯϥΠϯ͕؆ུԽ ΫϥυιʔγϯάϓϥοτϑΥʔϜͷ߹ ΞϊςʔγϣϯαʔϏεͷ߹
27 • ࡞ۀ༰΄΅มߋͤͣ • ΞϊςʔγϣϯΨΠυϥΠϯͦͷ··ར༻ • ࡞ۀϓϥοτϑΥʔϜ͚ͩFastLabelಠࣗͷΣϒΞϓϦέʔγϣϯΛར༻ • ίϛϡχέʔγϣϯखஈ͕Slackʹʂ •
ϚϧνϫʔΫεϖʔενϟϯωϧΛ࡞͠ɺslack্ͰίϛϡχέʔγϣϯՄೳʹ • UbieଆͷϓϩμΫτΦʔφʔ։ൃऀࢀՃ͠ɺٞใڞ༗ʹࢀՃͰ͖Δ • ϝʔϧͱҧ͍ɺίϛϡχέʔγϣϯͷ৺ཧతϋʔυϧ͕Լ͕Δ (ΤϯδχΞʹخ͍͠) Ϋϥυιʔγϯά͔Βͷ࡞ۀͷมߋ
28 ୲ऀͱͷίϛϡχέʔγϣϯ ݟੵΓґཔʢܧଓґཔͷ࣌ʣ ࡞ۀ༰ͷ֬ೝ Ξϊςʔγϣϯ݁Ռͷೲ
29 • σʔλͷ࣭มΘΒͣ • ΫϥυιʔγϯάͰࣗͰίϯτϩʔϧͨ࣌͠ͱൺֱͯ͠ɺ࣭શ͘มΘΒͣ • ࡞ۀऀͷཧ͕େ෯ʹݮ͞Εͨ • Ϋϥυιʔγϯάͱൺֱͯ͠ɺࣄతͳ࡞ۀΛେ෯ʹݮΒͤΔ •
Πϯλϥϓτ͕গͳ͘ͳΔɺ͕ࣗશମͷϘτϧωοΫʹͳΔ͜ͱ͕ແ͍ • ݸʑͷ࡞ۀऀͷ࡞ۀ݁ՌͷूܭͳͲͷࡉ͔͍࡞ۀݮͬͨ • ࠷ॳͷλεΫઆ໌ґཔ࣌ͷίϛϡχέʔγϣϯίετ͚ͩඍ૿ • ग़ΓΛͳͨ͘͢Ίʹ͜ͷ෦ඞਢ ΞϊςʔγϣϯαʔϏεར༻ͷ݁Ռ
30 • తͱ͍ͯͨ͠ཧݮ͓Αͼσʔλ࡞ͷεέʔϧԽୡͰ͖ͨ • ॳظݕূʹඞཁͳ͚ͩͷσʔλΛूΊΔ͜ͱ͕Ͱ͖ͨ • ΞϊςʔγϣϯαʔϏεଆʹɺ͍͔ʹ࡞ۀΛཧղͯ͠Β͏/దٓํमਖ਼Ͱ͖Δ͔ • ࡞ۀऀʹࢦࣔ͠ͳ͘ͳͬͨ͜ͱͰɺؒతʹΞϊςʔγϣϯͷ࣭Λίϯτϩʔϧ͢Δ͜ͱ ʹͳΔ
• σʔλ࡞Λεέʔϧͤ͞Δ or ܧଓతͳґཔ͕༰қ • ಉ͡ํ๏ͷΞϊςʔγϣϯͳΒɺઆ໌ͷॳظίετ͕ෆཁʹͳΔ͕େ͖͍ • ࡞ۀऀͷՔಇΛαʔϏεଆͰࣄલʹ֬อͰ͖ΔͷϝϦοτ ΞϊςʔγϣϯαʔϏεܕͷ·ͱΊ
31 σʔλ࡞ʹ͓͚Δૉૣ͍Ձݕূͷॏཁੑ
32 • ϓϥοτϑΥʔϜͷબͦΕͧΕಘखෆಘख͕͋Δ • Ϋϥυιʔγϯάɿͱʹ͔͘ॳಈ͕ૣ͍ɺίετΛ͑ΒΕΔ • ΞϊςʔγϣϯαʔϏεձࣾɿґཔऀ(ࣗ)ͷରԠίετΛݮΒͤΔɺεέʔϧͤ͞ΒΕΔ • ͰPoCஈ֊ͷϓϩδΣΫτελʔτΞοϓʹ͓͍ͯͲ͏ཱͪճΕΑ͍ͷ͔ʁ •
ͱΓ͋͑ͣΑ͔͘Βͳ͍͚ͲΞϊςʔγϣϯαʔϏεձࣾʹ͛ΔɺͰવͳ͕Βବ • ෆ࣮֬ੑͷղফͱߴͳݕূ͕ඞཁ ࠓճͷܦݧΛ౿·͑ͨΞϊςʔγϣϯσʔλͷ࡞Γํ
33 • Ξϊςʔγϣϯͷ࡞ۀ • ৗʹఆͰ͖ͳ͍σʔλᐆດͳϧʔϧɺྫ֎έʔε͕ग़ͯ͘Δ • ΞϊςʔγϣϯΨΠυϥΠϯΛ࠷ॳ͔Βᘳʹ࡞Δ͜ͱෆՄೳ • ࡞ۀऀͷೳྗΞτϓοτͷ࣭ •
࡞ۀऀͷϨϕϧҰఆίϯτϩʔϧՄೳͳର͕ͩɺͦͷೳྗΞτϓοτͷ࣭ʹવ Β͖͕ͭ͋Δ • ͦͷΒ͖ͭΞϊςʔγϣϯ͕݅૿͑Δ͝ͱʹ૿େ͍ͯ͘͠ • ඞཁʹͳΔσʔλྔ • ػցֶशʹ͓͍ͯʮͲΕ͘Β͍σʔλ͕͋Ε͍͍Ͱ͔͢ʁʯͱ͍͏࣭͔Βಀ͛ΒΕͳ͍ • ࣮ࡍʹ࡞ͨ͠σʔλΛݩʹػցֶशϞσϧΛֶश/ධՁ͠ͳ͍ͱΘ͔Βͳ͍ զʑԿΛΒͳ͍͔ʁ
34 • Ξϊςʔγϣϯͷ࡞ۀ • ৗʹఆͰ͖ͳ͍σʔλᐆດͳϧʔϧɺྫ֎έʔε͕ग़ͯ͘Δ • ΞϊςʔγϣϯΨΠυϥΠϯΛ࠷ॳ͔Βᘳʹ࡞Δ͜ͱෆՄೳ • ࡞ۀऀͷೳྗΞτϓοτͷ࣭ •
࡞ۀऀͷϨϕϧҰఆίϯτϩʔϧՄೳͳର͕ͩɺͦͷೳྗΞτϓοτͷ࣭ʹવ Β͖͕ͭ͋Δ • ͦͷΒ͖ͭΞϊςʔγϣϯ͕݅૿͑Δ͝ͱʹ૿େ͍ͯ͘͠ • ඞཁʹͳΔσʔλྔ • ػցֶशʹ͓͍ͯʮͲΕ͘Β͍σʔλ͕͋Ε͍͍Ͱ͔͢ʁʯͱ͍͏࣭͔Βಀ͛ΒΕͳ͍ • ࣮ࡍʹ࡞ͨ͠σʔλΛݩʹػցֶशϞσϧΛֶश/ධՁ͠ͳ͍ͱΘ͔Βͳ͍ զʑԿΛΒͳ͍͔ʁ λεΫͷઃܭऀ = ґཔऀ ͔͠அͰ͖ͳ͍ ΞϊςʔγϣϯαʔϏεଆʹ ͤΔ͜ͱՄೳ ػցֶशΤϯδχΞ = ґཔऀ ͔͠ධՁͰ͖ͳ͍
35 • λεΫઃܭਓʹͤΒΕͳ͍ • ػցֶशʹͲ͏͍͏Πϯϓοτ/ΞτϓοτΛظ͢Δ͔Λߟ͑ଓ͚ͳ͚Ε͍͚ͳ͍ • ૉૣ͘ݕূ͠ํमਖ਼Λ܁Γฦ͍ͯ͘͠ɺมԽʹదԠ͢Δ • ιϑτΣΞ։ൃͰ͍͏ΞδϟΠϧ։ൃ •
ΞϊςʔγϣϯΑΔσʔλ࡞ʹ͓͍ͯಉ༷ • ·͔ͣࣗΒɺͦͯ͠पΓΛר͖ࠐΜͰ͍͘ • ·ͣࣗࣗͰݕূదԠͷαΠΫϧΛճͤΔΑ͏ʹͳΔ • ͦΕΛΑΓߴʹճ͢͜ͱ͕Ͱ͖Δํ๏Λࡧ͍ͯ͘͠ • Ұॹʹݕূͯ͘͠ΕΔΞϊςʔγϣϯαʔϏεΛݟ͚͍ͭͯ͘͜ͱ͕େࣄ ෆ࣮֬ੑʹରԠ͢ΔͨΊʹ
36 • ʮίΤΧϧςʯʹ͓͚Δର͔ΒͷΧϧςੜλεΫͷσʔλ࡞ • ҩࢣͷΑ͏ͳߴ୯Ձͳ࿑ྗΛඞཁͱ͢ΔλεΫΛɺͯ͠Ұൠͷ࡞ۀऀͰՄೳʹ • 2छྨͷํ๏ͰΞϊςʔγϣϯσʔλΛ࡞ • ΫϥυιʔγϯάϓϥοτϑΥʔϜͱΞϊςʔγϣϯαʔϏεͦΕͧΕʹಘखෆಘख͕͋Δ •
ཧͱۚમతίετͷτϨʔυΦϑͳͳ͔ɺ͍͔ʹσʔλ࡞Λεέʔϧ͍͔ͤͯ͘͞ • ૉૣ͘σʔλΛߏங͠ݕূΛճͨ͢Ίʹ • λεΫઃܭऀ͕ओମతʹෆ࣮֬ੑΛ௵͍ͯ͘͠ඞཁ͕͋Δ • ҰॹʹݕূΛճ͢ύʔτφʔͱͯ͠ͷɺΫϥυιʔγϯάΞϊςʔγϣϯαʔϏε શମͷ·ͱΊ
37 ͓͢͢Ίࢀߟจݙ • ʮΫϥυιʔγϯά͕ෆՄೳΛՄೳʹ͢Δʯౢ ްߦ ஶ ڞཱग़൛ • ΫϥυιʔγϯάͷશମײΛ௫Ήͷʹ࠷ద •
ಡΈͱͯ͠ॻ͔Ε͓ͯΓɺ۩ମࣄྫ͕๛Ͱɺ͕ࣜগͳ͍ • ʮHuman-in-the-Loop ػցֶश ʯ Yukino Baba • https://speakerdeck.com/yukinobaba/human-in-the-loop-machine-learning • ΫϥυιʔγϯάͰ͍͔ʹ࣭Λ୲อ͢Δ͔ͷݚڀࣄྫ͕๛ʹհ͞Ε͍ͯΔ • σʔλͷ࣭ʹରͯ͠ͷΞϓϩʔν͕ࢀߟʹͳΔ Appendix