Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
自然言語処理の基礎と応用 〜 料理と医療を題材として 〜 /JADI2021
j.harashima
September 10, 2021
0
990
自然言語処理の基礎と応用 〜 料理と医療を題材として 〜 /JADI2021
j.harashima
September 10, 2021
Tweet
Share
More Decks by j.harashima
See All by j.harashima
日本語レシピデータセットの継続的な構築と複合的な利用/JED2022
junharashima
0
690
企業での研究開発の楽しさと苦労/WAP-Tech-Talk
junharashima
1
4.9k
クックパッドにおける研究開発/HCG2020
junharashima
0
320
Calorie Estimation in a Real-World Recipe Service/iaai-20
junharashima
0
9.1k
クックパッドと機械学習(短縮版)/MLTBP
junharashima
0
3k
クックパッドと NLP/CV/nlpaper-challenge
junharashima
0
61
AI 部門の実戦投入/repro-tech-meetup
junharashima
0
300
クックパッドと機械学習/uec-aix-seminar
junharashima
0
6.1k
実データにふれる自然言語処理インターンシップ/internship2018
junharashima
1
11k
Featured
See All Featured
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
7
1k
The World Runs on Bad Software
bkeepers
PRO
56
5.2k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
29
4.3k
Stop Working from a Prison Cell
hatefulcrawdad
261
17k
Six Lessons from altMBA
skipperchong
14
1.3k
Rails Girls Zürich Keynote
gr2m
86
12k
Infographics Made Easy
chrislema
233
17k
Designing with Data
zakiwarfel
91
3.8k
A Modern Web Designer's Workflow
chriscoyier
689
180k
Designing for Performance
lara
596
63k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
226
15k
Web Components: a chance to create the future
zenorocha
303
40k
Transcript
ࣗવݴޠॲཧ ͷجૅͱԠ༻ ʙྉཧͱҩྍΛࡐͱͯ͠ʙ ݪౡ७
ژେֶʹͯࣗવݴޠॲཧͷݚڀࣨʹ ଐ ത࢜ʢใֶʣΛऔಘɺΫοΫύου ʹೖࣾ ݪౡ७ ݚڀ։ൃ෦Λ৽ઃ
ϨγϐݕࡧνʔϜΛ৽ઃɺϦʔμʔʹ बʢݚڀ։ൃ෦෦݉ʣ ಉ෦෦ʹब
໔ࣄ߲ ࠓͷൃදʮΩονϯɾΠϯϑΥϚςΟΫεʯͷ ༰Λϕʔεʹ͍ͯ͠·͢ɻ ͜ͷຊɺΫοΫύουͷࣾһͱͯ͠Ͱͳ͘ɺ ݸਓͱͯ͠ॻ͍ͨͷͰ͢ɻ ൃදʹؔ͢Δ࣭͝ɺձࣾʹͰͳ͘ɺ ݪౡݸਓʹ͓د͍ͤͩ͘͞ɻ
࣍ ࣗવݴޠॲཧͷجૅ ྉཧυϝΠϯʹ͓͚ΔԠ༻ ҩྍυϝΠϯʹ͓͚ΔԠ༻ ·ͱΊ
ࣗવݴޠॲཧͱʁ ࣗવݴޠʢʹݴ༿ʣΛίϯϐϡʔλͰѻ͏ͨΊͷٕज़ ࣗવݴޠࣗવൃੜతʹੜ·ΕͨݴޠʢFH ຊޠʣ ਓݴޠਓతʹ࡞ΒΕͨݴޠʢFH $ݴޠʣ
ใݕࡧʜϢʔβ͕ٻΊΔใΛจॻू߹͔Βݕࡧ ػց༁ʜҙຯΛอͬͨ··ɺ͋ΔݴޠͷจॻΛผͷݴޠͷจॻʹม จॻྨʜ༧ΊఆΊΒΕͨೋͭҎ্ͷΫϥεͷ͍ͣΕ͔ʢPS͍͔ͭ͘ʣʹจॻΛྨ จॻཁʜใΛอͬͨ··ɺҰͭʢPSෳʣͷจॻΛॖ ใநग़ʜจॻ͔ΒॏཁͳใΛநग़ FUD Ԡ༻ྫ ใݕࡧͷҰྫ
ػցֶशͱʁ ɾσʔλʹજΉύλʔϯΛػցతʹݟ͚ͭΔͨΊͷٕज़ ػցֶशʢಛʹχϡʔϥϧωοτϫʔΫʣʹΑΔ༷ʑͳൃల ɾ8PSE7FDʹΑΔҙຯͷϕΫτϧԽʢ.JLPMPWFUBM ʣ ɾ#&35ʹΑΔ֤छݴޠཧղλεΫͷੑೳվળʢ%FWMJOFUBM ʣ ۙɺଟ͘ͷاۀ͕ࣗવݴޠॲཧʹ ػցֶशͷ಄
ε ϙ ϯ α ồ ਓೳֶձશࠃେձ ը૾ͷೝࣝɾཧղγϯϙδϜ ݴޠॲཧֶձ࣍େձ ˞ʹεϙϯαʔ͕ݮ͍ͬͯΔͷίϩφͷӨڹ
ຊޠʹ͓͚Δࣗવݴޠॲཧ ୯ޠ୯Ґ จઅ୯Ґ จ୯Ґ Ԡ༻ʢFH ใݕࡧɺػց༁ʣ ߏจղੳ ܗଶૉղੳɹݻ༗දݱೝࣝ ड़ޠ߲ߏղੳɹڞࢀরղੳ ҙຯ୯Ґ
ಉٛؔೝࣝ ؚҙؔೝࣝ ຊൃදͰࣈͷٕज़ʹ͍ͭͯͷΈհʢͦͷଞʹ͍ͭͯஶΛ͝ཡ͍ͩ͘͞ʣ
ܗଶૉղੳ จதͷܗଶૉʢ㲈୯ޠʣͷڥքͱࢺɺݪܗΛೝࣝ͢Δॲཧ ຊޠ୯ޠ͕εϖʔεͰ۠ΒΕ͍ͯͳ͍ˠܗଶૉղੳຊޠॲཧͷୈҰา ϑϥϯε ଠ Λ ৯ ύϯ c
໊ࢺ ໊ࢺ ಈࢺ ॿࢺ ໊ࢺ c c c ৯Δ ଠ Λ ϑϥϯε ύϯ ݪܗ ڥք ࢺ c ॿࢺ ଠϑϥϯεύϯΛ৯ͨ ೖྗ ग़ྗ ͨ ͨ c ॿಈࢺ จ
ݻ༗දݱೝࣝ จதͷݻ༗දݱʢFH ਓ໊ɺ໊ɺʜʣΛೝࣝ͢Δॲཧ ܗଶૉղੳͷग़ྗΛೖྗͱ͠ɺݻ༗දݱͷϥϕϧΛग़ྗ ϑϥϯε ଠ Λ ৯ ύϯ
c ໊ࢺ ໊ࢺ ಈࢺ ॿࢺ ໊ࢺ c c c ৯Δ ଠ Λ ϑϥϯε ύϯ ݪܗ ڥք ࢺ c ॿࢺ ೖྗ ͨ ͨ c ॿಈࢺ ग़ྗ ਓ໊ ͦͷଞ ͦͷଞ ͦͷଞ ͦͷଞ ͦͷଞ ໊ ϥϕϧ
ಉٛؔೝࣝ ͋Δޠ۟ͱผͷޠ͕۟ಉ͡ҙຯ͔ҧ͏ҙຯ͔Λೝࣝ͢Δॲཧ ୯ޠಉ࢜Ͱಉ͡ҧ͏ҙຯͰɺผͷ୯ޠͱ߹ΘͤΔͱҧ͏ಉ͡ҙຯʹͳΔ͜ͱ ৯Δ ͨΔ ৯Δ ৯͏ ৯Δ ҿΉ ୯ޠϖΞ
ೖྗ ग़ྗ ೝࣝ݁Ռ ಉ͡ ҧ͏ ಉ͡ ৯͏ ͏ ҧ͏ ϑϨʔζϖΞ ೝࣝ݁Ռ ϝϞϦΛ৯͏ ϝϞϦΛ͏ ಉ͡ Ұഋ৯͏ Ұഋ৯Δ ҧ͏ ʢͩ·͞ΕΔʣ ೖྗ ग़ྗ
ࣗવݴޠॲཧͷπʔϧɾσʔλ .F$BCʢܗଶૉղੳثʣ ຊޠϫʔυωοτʢγιʔϥεʣ γιʔϥεʢྨޠࣙయʣ ྨޠኮදɺຊޠޠኮେܥɺʜ ੜίʔύε ੨ۭจݿɺ8JLJQFEJBɺʜ ऍ͖ίʔύε ژେֶςΩετίʔύεɺ/"*455FYU$PSQVTɺʜ ʜ
ܗଶૉղੳث 4VEBDIJɺ+6."/ʢ+6."/ ʣɺʜ ߏจղੳث ,/1ɺ$BCP$IBɺʜ ػցֶशϥΠϒϥϦ 1Z5PSDIɺ5FOTPS'MPXɺʜ ʜ
࣍ ࣗવݴޠॲཧͷجૅ ྉཧυϝΠϯʹ͓͚ΔԠ༻ ҩྍυϝΠϯʹ͓͚ΔԠ༻ ·ͱΊ
༷ʑͳՄೳੑ Ϩετϥϯ Ϩγϐ ϝχϡʔ ޱίϛ ใݕࡧ ػց༁ จॻྨ ʜ ྉཧυϝΠϯʹ͓͚ΔԠ༻
ʹ º ྉཧυϝΠϯʹ ͓͚ΔςΩετ ࣗવݴޠॲཧͷ Ԡ༻ ʜ ใநग़ ʢͷհϖʔδʣ
Ϩγϐºใݕࡧ ͨ·Ͷ͗ πφͱͨ·Ͷ͗ͷ ෩ύελ ߜΓࠐΉ ۄೢͱੜᇙͷ ͔͋ͬͨຯो
ΧϦΧϦ̇ ΦχΦϯϦϯά ۄͶ͗ͱτϚτͷ αϥμ ΦχΦϯάϥλϯ εʔϓ ܗଶૉղੳݻ༗දݱೝࣝΛ֤Ϩγϐʹద༻͠ɺ Ϩγϐதͷ୯ޠݻ༗දݱΛೝࣝ ֤୯ޠʹ͍ͭͯಉٛޠΛల։ FH ͨ·Ͷ͗ʹۄೢʹۄͶ͗ʹΦχΦϯ ΫΤϦʢ͓Αͼɺͦͷಉٛޠʣ͕ग़ݱ͢ΔϨγϐΛ ݕࡧ݁Ռͱͯ͠ఏࣔ
Ϩγϐºจॻྨ ͨ·Ͷ͗ ओࡊ ओ৯ ۄೢͱੜᇙͷ ͔͋ͬͨຯो ෭ࡊ ो ߜΓࠐΉ
ΦχΦϯάϥλϯ εʔϓ ཛͱ౾ͱۄೢͷ ༏͍͠εʔϓ ͨ·Ͷ͗ͱਓࢀͱ Ωϟϕπͷϙτϑ ܗଶૉղੳݻ༗දݱೝࣝΛ֤Ϩγϐʹద༻͠ɺ Ϩγϐதͷ୯ޠݻ༗දݱΛೝࣝ ֤୯ޠʹ͍ͭͯಉٛޠΛల։ FH ͨ·Ͷ͗ʹۄೢʹۄͶ͗ʹΦχΦϯ ֤ΫϥεʢFH ोʣʹॴଐ͖͢ϨγϐΛਓखͰ ऩू͠ɺͦΕΒʹग़ݱ͢Δ୯ޠͷύλʔϯΛѲ Ͱऩूͨ͠ϨγϐҎ֎ͷϨγϐʹύλʔϯΛద༻͠ɺ ֤Ϋϥεʹྨ
y1 yJ y2 … canonical form of the ingredient decoder
original string of an ingredient encoder x1 x2 xI … softmax softmax softmax … Ϩγϐதͷදه ৯දதͷදه දه༳Ε ਓࢀ ʹΜ͡Μ ུه ৽ͨ· ৽ͨ·Ͷ͗ εϖϧϛε ͋΅͕Ͳ ΞϘΧυ ͦͷଞ അླḕ ͡Ό͕͍ dense amount encoder xa1 xa2 xaJ … title encoder xt1 xt2 xtI … softmax y serving λΠτϧ .ࡼ /ਓ ίίφοπΦΠϧೖΓ΄͏ΕΜΧϨʔ ࡼ ͜ΜͿɾͻ͖͡ɾ΄ͨͯ͝Μ ߹ άϥϊʔϥΫοΩʔ ຕ ύϯϓΩϯλϧτ DNλϧτܕ ৄ͘͠ɺJun Harashima, Makoto Hiramatsu, and Satoshi Sanjo. Calorie Estimation in a Real-World Recipe Service. In Proceedings of the 32nd Annual Conference on Innovative Applications of Arti fi cial Intelligence (IAAI-20), 2020. Λ͝ཡ͍ͩ͘͞ɻ Ϩγϐºػց༁ʢΧϩϦʔܭࢉʣ Ϩγϐதͷ֤ࡐྉͷදهΛ৯දதͷදهʹม ʮ.ࡼʯʮ.߹ʯɺʮ.ຕʯͳͲΛʮ/ਓʯʹม ֤ࡐྉͷΧϩϦʔΛ৯ද͔Βऔಘ͠ɺ߹ܭ ߹ܭΛ/ͰׂͬͯɺਓͷΧϩϦʔΛऔಘ ˞ผݴޠͷ༁ʢҰൠతͳػց༁ʣͰͳ͘ɺಉҰݴޠͷ༁ʢݴ͍͑ʣ
࣍ ࣗવݴޠॲཧͷجૅ ྉཧυϝΠϯʹ͓͚ΔԠ༻ ҩྍυϝΠϯʹ͓͚ΔԠ༻ ·ͱΊ
༷ʑͳՄೳੑ Χϧς จ Ϩηϓτ αϚϦ ใݕࡧ ػց༁ จॻྨ ʜ ҩྍυϝΠϯʹ͓͚ΔԠ༻
ʹ º ҩྍυϝΠϯʹ ͓͚ΔςΩετ ࣗવݴޠॲཧͷ Ԡ༻ ʜ ใநग़
จºใݕࡧ Ϩγϐºใݕࡧͱಉ͡ϩδοΫʢͷͣʣ
Χϧςºใநग़ʢ͍ΘΏΔɺϏοάσʔλͷ׆༻ʣ ܦ95&$)ʮΧϧςղੳͰਫ਼ਆ࣬ױױऀͷ༧ޙΛ༧ଌʯ IUUQTYUFDIOJLLFJDPNENBUDMGFBUVSF
ҩྍºࣗવݴޠॲཧͷ͠͞ σʔλͷॴࡏ͕Θ͔Βͳ͍ ɾ·ͩੵ͞Εͯͳ͍ʁ ɾ͞Εͯͯɺར༻ͮ͠Β͍ʁ ɾσʔλ͕ͳ͍ͱɺࣗવݴޠॲཧແྗ ɹɹɹɹσʔλͷੵɾڞ༗͕ෆՄܽ σʔλͷ༰͕Θ͔Βͳ͍ ɾΠϯεϦϯʁϔϞάϩϏϯʁܕʁܕʁ ɾࣗવݴޠॲཧʢFH ใநग़ʣͷ݁Ռ͕ղऍෆೳ
ɾղऍ͕ෆೳͩͱɺվળෆೳ ɹɹɹɹҩྍͷϓϩͱͷ࿈ܞ͕ෆՄܽ ҩྍͷૉਓ͔Βݟͨ
࣍ ࣗવݴޠॲཧͷجૅ ྉཧυϝΠϯʹ͓͚ΔԠ༻ ҩྍυϝΠϯʹ͓͚ΔԠ༻ ·ͱΊ
ࣗવݴޠॲཧͷجૅͱԠ༻ʙྉཧͱҩྍΛࡐͱͯ͠ʙ ࣗવݴޠॲཧͱʁ ɾࣗવݴޠʢʹݴ༿ʣΛίϯϐϡʔλͰѻ͏ͨΊͷٕज़ ɾ͜͜Ͱٸܹʹൃలɺଟ͘ͷاۀ͕ ςΩετσʔλ͑͋͞Εɺ༷ʑͳԠ༻͕ߟ͑ΒΕΔ ɾྉཧυϝΠϯʹ͓͚ΔςΩετºࣗવݴޠॲཧͷԠ༻ྉཧυϝΠϯʹ͓͚ΔԠ༻ ɾҩྍυϝΠϯʹ͓͚ΔςΩετºࣗવݴޠॲཧͷԠ༻ҩྍυϝΠϯʹ͓͚ΔԠ༻ ҩྍºࣗવݴޠॲཧͷ͠͞ ɾσʔλͷॴࡏ͕Θ͔Βͳ͍ˠσʔλͷੵɾڞ༗͕ෆՄܽ ɾσʔλͷ༰͕Θ͔Βͳ͍ˠҩྍͷϓϩͱͷ࿈ܞ͕ෆՄܽ