Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
感性を考慮した日本語俗語の標準語変換
Search
kakubari
February 13, 2017
Technology
400
0
Share
感性を考慮した日本語俗語の標準語変換
長岡技術科学大学 自然言語処理研究室
学部3年 角張竜晴
文献紹介:人工知能学会論文誌Vol.32(2017) No.1
kakubari
February 13, 2017
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
130
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
190
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
110
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
110
Labeling the Semantic Roles of Commas
kakubari
0
96
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
130
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
97
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
150
述語項構造と照応関係のアノテーション
kakubari
0
260
Other Decks in Technology
See All in Technology
オライリーイベント登壇資料「鉄リサイクル・産廃業界におけるAI技術実応用のカタチ」
takarasawa_
0
370
知ってた?JavaScriptの"正しさ"を検証するテストが5万以上もあること(Test262)
riyaamemiya
1
180
試作とデモンストレーション / Prototyping and Demonstrations
ks91
PRO
0
200
Building Production-Ready Agents Microsoft Agent Framework
_mertmetin
0
160
20260507-ACL-seminar
satoshi5884
0
110
(きっとたぶん)人材育成や教育のような何かの話
sejima
0
680
【技術書典20】OpenFOAM(自宅で深める流体解析)流れと熱移動(2)
kamakiri1225
0
390
サンプリングは「作る」のか「使う」のか? 分散トレースのコストと運用を両立する実践的戦略 / Why you need the tail sampling and why you don't want it
ymotongpoo
4
160
カオナビに Suspenseを導入するまで / The Road to Suspense at kaonavi
kaonavi
1
440
Shiny New Tools Won't Fix Your Problem
trishagee
1
120
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
15
100k
「QA=テスト」「シフトレフト=スクラムイベントの参加者の一員」の呪縛を解く。アジャイルな開発を止めないために、10Xで挑んだ「右側のしわ寄せ」解消記 #scrumniigata
nihonbuson
PRO
5
980
Featured
See All Featured
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
740
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
270
[SF Ruby Conf 2025] Rails X
palkan
2
1k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
320
For a Future-Friendly Web
brad_frost
183
10k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
180
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
Navigating Team Friction
lara
192
16k
Prompt Engineering for Job Search
mfonobong
0
300
Reality Check: Gamification 10 Years Later
codingconduct
0
2.1k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
350
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ֯ ு ཽ 感性を考慮した日本語俗語の標準語変換 Conversion of Japanese Slang into Standard Japanese Considering Sensibility 松本 和幸, 土屋 誠司, 芋野 美紗子, 吉田 稔, 北 研二 人工知能学会論文誌 7PM /P Q8MM"@ จಛूʮΣϒΠϯςϦδΣϯεͱΠϯλϥΫγϣϯʯ ਤදจΑΓҾ༻
概要 ˔एऀݴ༿Λҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ ม͢Δ ଟ࣍ݩͷҹ࣠ ҙຯϕΫτϧ ˔͔ͬͨ͜ͱ
ϕʔεϥΠϯख๏ΑΓߴ͍.33ͷ͕ߴ͍ ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟ ϧλϦϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘อͯ Δ
はじめに ˔एऀݴ༿ͷதʹɺඪ४ޠΛݴ͍͑ͨදݱ͕ଟ͘ ଘࡏ͢Δɻ एऀݴ༿Λඪ४ޠʹม͢Δͱʜ ɹҙݟɾධੳײೝࣝͷਫ਼Λվળ ˔एऀݴ༿ΘΕΔظؒ໘ɺίϛϡχςΟʹ Β͖͕ͭ͋Γɺҙຯ༻๏࣌ͱͱʹมԽ͢Δɻ
8FC্ͷ4/4͔Βऩूͨ͠ςΩετͷίʔύε ײੑධՁ࣠ͱҙຯϕΫτϧΛ༻͍ͯʜ ɹҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ͢Δ
実験手法 ˔एऀݴ༿ͷײੑੳ एऀݴ༿ͷײੑධՁΞϯέʔτ एऀݴ༿ͱඪ४ޠͷײੑൺֱ ˔ίʔύεͷߏங एऀ5XFFUίʔύε ˔एऀݴ༿͔Βඪ४ޠͷมख๏
จ຺ྨࣅੑʹجͮ͘ྨޠͷऔಘ ଏޠΒ͠͞ͷܭࢉ ײੑྨࣅʹجͮ͘ީิநग़
若者言葉の感性評価アンケート ˔एऀײίʔύε χίχίେඦՊ ɹޠΛબఆ ˔ධՁํ๏ ඃݧऀʹޠ ֤ޠʹରͯ͠ɺ໊̎Ҏ্͕ճ
छྨͷײੑධՁର ֤ஈ֊ͰධՁ ࣍ݩͷײੑධՁϕΫτϧʹมɾਖ਼ نԽ͠ɺࣗݾ৫ԽϚοϓΛ༻͍ͯੳ ˔ධՁ݁Ռ Α͘ࣅͨҹͷݴ༿͕͍ۙҐஔʹදࣔ 感性評価ベクトルに基づき自己組織化マップに より若者言葉を配置した例 アンケートに用いた感性評価軸
若者言葉と標準語の感性比較 ˔ޠͷதͰɺҎԼͷ݅ʹͯ·ΔޠΛநग़ ಉҰදهޠ͕طଘ͢Δඪ४ޠʹొ͞Ε͍ͯͳ͍ ҙຯ͕ಉҰ·ͨྨࣅ͢Δදݱ͕ࣙॻʹొ͞Ε͍ͯΔ ˔एऀݴ༿ͱରԠ͢Δඪ४ޠͷ QPTJUJWFOFHBUJWFOFVUSBMͷ༁ Ұக͢Δ߹ɺ
Ұக͠ͳ͍߹͋Δ एऀݴ༿͔Βඪ४ޠม͢Δͱ ɹײੑ͕มԽ͢Δ एऀݴ༿QPTJUJWFඪ४ޠOFHBUJWF͕ 若者言葉と対応する標準語の感性比較
俗語らしさの計算 ˔ޠͷಛʢ/Pd/P·ͰͷಛྔʣΛϕΫτϧͰදݱ ଏޠͱඪ४ޠͷํͰදಛྔΛநग़ɺྨࣅΛٻΊΔ ˔ଏޠΒ͠͞ͷείΞ4D XJ ɹ͕ᮢҎ্ͳΒग़ྗީิ͔Βআ֎ 文字列から抽出する表層特徴量
感性類似度に基づく候補抽出 ײੑධՁରͷछྨΛײੑධՁϕΫτϧͱ͢Δɻ ΞϯέʔτऔಘࡁΈͷएऀݴ༿ͷ֓೦ϕΫτϧʹ͓͚Δ֤࣍ݩͷ ؔ࿈ΛٻΊɺײੑධՁॏΈߦྻΛٻΊΔɻ ͦͯ͠ɺײੑධՁϕΫτϧͷಋग़Λߦ͏ɻ ೖྗ͞Εͨएऀݴ༿͔Βਪఆ͞ΕͨײੑධՁϕΫτϧͱɺม
ީิͱͯ͠ಘΒΕͨ୯ޠͷײੑධՁϕΫτϧͷײੑྨࣅΛܭࢉ ͢Δɻ ͜ͷ݁Ռͱඪ४ޠΒ͠͞ͷείΞʢ4D XJ º ʣΛֻ͚߹Θͤ ͨͰɺมީิΛॱҐ͚͢Δɻ
若者言葉の標準語への変換候補 Ұͭͷएऀݴ༿ʹ̏ޠͷඪ४ޠީิ͕ਖ਼ղީิͱͯ͠༩ ͞ΕΔɻ 若者言葉と対応する標準語の例
実験結果 ˔ϕʔεϥΠϯख๏ ඪ४ޠΒ͠͞ͷείΞܭࢉٴͼײੑྨࣅͷܭࢉ͠ͳ͍ ֓೦ϕΫτϧͷྨࣅͷΈͰͷஅ ˔ධՁํ๏ .33 .FBO3FDJQSPDBM3BOL
ͷฏۉ ݕࡧ݁Ռͷ͏ͪɺਖ਼ղͱͳΔ୯ޠ͕/ݸग़ྗ͞Εͨ߹ɺ ͦͷ୯ޠͷग़ྗॱҐ3J ͷٯͷ૯Λਖ਼ղ୯ޠͰׂͬͨ
実験結果 .33 ඪ४ޠͷਖ਼ղީิΛ࣋ͭଏޠʹରͯ͠ܭࢉ ʢඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦϯάख๏ʣ .33 ΞϯέʔτʹΑΓਖ਼ղީิΛܾఆͨ͠ଏޠʹରͯ͠ܭࢉ ʢϕʔεϥΠϯख๏ʣ
˔.33 ͕.33 ΑΓ͍ ෆཁͳޠΛϑΟϧλϦϯάͰআڈ ɹ͢Δ͜ͱ͕Ͱ͖͍ͯΔɻ MRR平均の比較
実験結果 ఏҊख๏Ͱɺਖ਼ղҎ֎ͷྨࣅޠީิΛϑΟϧλϦϯά͢Δ ͜ͱͰɺਖ਼ղީิͷॱҐΛߴ͘อ͍ͯͯΔɻ 変換候補の例
実験結果 ײੑྨࣅɺ֓೦ϕΫτϧͷ࣍ݩ͕গͳ͍࣌ʹɺͦΕΛΧόʔ͢Δ ޮՌ͕େ͖͍ɻ ඪ४ޠΒ͠͞ͷείΞʹΑΔϑΟϧλϦϯάͰɺਖ਼ղΛ͢͜ͱ͕ Ͱ͖ͳ͍߹͕͋Δɻ 感性類似度のみを適用した場合の比較 標準語らしさのスコアによるフィルタリングのみを適 用した場合の比較
まとめ ˔ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦ ϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘Ͱ͖Δɻ ˔ඪ४ޠΒ͠͞ͷείΞͷܭࢉํ๏ͷվળʹΑΓɺϑΟϧλ Ϧϯάͷਫ਼Λ্ͤ͞Δඞཁ͕͋Δɻ