Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
感性を考慮した日本語俗語の標準語変換
Search
kakubari
February 13, 2017
Technology
0
380
感性を考慮した日本語俗語の標準語変換
長岡技術科学大学 自然言語処理研究室
学部3年 角張竜晴
文献紹介:人工知能学会論文誌Vol.32(2017) No.1
kakubari
February 13, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
150
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
73
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
99
Labeling the Semantic Roles of Commas
kakubari
0
66
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
86
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
120
述語項構造と照応関係のアノテーション
kakubari
0
220
Other Decks in Technology
See All in Technology
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
7.2k
マルチテナント+マルチプロダクト SaaS への AI Agent の組み込み方
kworkdev
PRO
2
310
AIエージェントの継続的改善のためオブザーバビリティ
pharma_x_tech
6
1.1k
AIコーディング新時代を生き残るための試行錯誤 / AI Coding Survival Guide
tomohisa
9
12k
Devin(Deep) Wiki/Searchの活用で変わる開発の世界観/devin-wiki-search-impact
tomoki10
0
300
Tensix Core アーキテクチャ解説
tenstorrent_japan
0
350
In Praise of "Normal" Engineers (LDX3)
charity
0
730
新規プロダクト開発、AIでどう変わった? #デザインエンジニアMeetup
bengo4com
0
440
ユーザーのプロフィールデータを活用した推薦精度向上の取り組み
yudai00
0
270
New Cache Hierarchy for Container Images and OCI Artifacts in Kubernetes Clusters using Containerd / KubeCon + CloudNativeCon Japan
pfn
PRO
0
150
生成AIをテストプロセスに活用し"よう"としている話 #jasstnano
makky_tyuyan
0
140
新卒3年目の後悔〜機械学習モデルジョブの運用を頑張った話〜
kameitomohiro
0
190
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
24
1.7k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
Writing Fast Ruby
sferik
628
61k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Documentation Writing (for coders)
carmenintech
71
4.9k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.8k
Why You Should Never Use an ORM
jnunemaker
PRO
56
9.4k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Code Reviewing Like a Champion
maltzj
524
40k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
130
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ֯ ு ཽ 感性を考慮した日本語俗語の標準語変換 Conversion of Japanese Slang into Standard Japanese Considering Sensibility 松本 和幸, 土屋 誠司, 芋野 美紗子, 吉田 稔, 北 研二 人工知能学会論文誌 7PM /P Q8MM"@ จಛूʮΣϒΠϯςϦδΣϯεͱΠϯλϥΫγϣϯʯ ਤදจΑΓҾ༻
概要 ˔एऀݴ༿Λҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ ม͢Δ ଟ࣍ݩͷҹ࣠ ҙຯϕΫτϧ ˔͔ͬͨ͜ͱ
ϕʔεϥΠϯख๏ΑΓߴ͍.33ͷ͕ߴ͍ ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟ ϧλϦϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘อͯ Δ
はじめに ˔एऀݴ༿ͷதʹɺඪ४ޠΛݴ͍͑ͨදݱ͕ଟ͘ ଘࡏ͢Δɻ एऀݴ༿Λඪ४ޠʹม͢Δͱʜ ɹҙݟɾධੳײೝࣝͷਫ਼Λվળ ˔एऀݴ༿ΘΕΔظؒ໘ɺίϛϡχςΟʹ Β͖͕ͭ͋Γɺҙຯ༻๏࣌ͱͱʹมԽ͢Δɻ
8FC্ͷ4/4͔Βऩूͨ͠ςΩετͷίʔύε ײੑධՁ࣠ͱҙຯϕΫτϧΛ༻͍ͯʜ ɹҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ͢Δ
実験手法 ˔एऀݴ༿ͷײੑੳ एऀݴ༿ͷײੑධՁΞϯέʔτ एऀݴ༿ͱඪ४ޠͷײੑൺֱ ˔ίʔύεͷߏங एऀ5XFFUίʔύε ˔एऀݴ༿͔Βඪ४ޠͷมख๏
จ຺ྨࣅੑʹجͮ͘ྨޠͷऔಘ ଏޠΒ͠͞ͷܭࢉ ײੑྨࣅʹجͮ͘ީิநग़
若者言葉の感性評価アンケート ˔एऀײίʔύε χίχίେඦՊ ɹޠΛબఆ ˔ධՁํ๏ ඃݧऀʹޠ ֤ޠʹରͯ͠ɺ໊̎Ҏ্͕ճ
छྨͷײੑධՁର ֤ஈ֊ͰධՁ ࣍ݩͷײੑධՁϕΫτϧʹมɾਖ਼ نԽ͠ɺࣗݾ৫ԽϚοϓΛ༻͍ͯੳ ˔ධՁ݁Ռ Α͘ࣅͨҹͷݴ༿͕͍ۙҐஔʹදࣔ 感性評価ベクトルに基づき自己組織化マップに より若者言葉を配置した例 アンケートに用いた感性評価軸
若者言葉と標準語の感性比較 ˔ޠͷதͰɺҎԼͷ݅ʹͯ·ΔޠΛநग़ ಉҰදهޠ͕طଘ͢Δඪ४ޠʹొ͞Ε͍ͯͳ͍ ҙຯ͕ಉҰ·ͨྨࣅ͢Δදݱ͕ࣙॻʹొ͞Ε͍ͯΔ ˔एऀݴ༿ͱରԠ͢Δඪ४ޠͷ QPTJUJWFOFHBUJWFOFVUSBMͷ༁ Ұக͢Δ߹ɺ
Ұக͠ͳ͍߹͋Δ एऀݴ༿͔Βඪ४ޠม͢Δͱ ɹײੑ͕มԽ͢Δ एऀݴ༿QPTJUJWFඪ४ޠOFHBUJWF͕ 若者言葉と対応する標準語の感性比較
俗語らしさの計算 ˔ޠͷಛʢ/Pd/P·ͰͷಛྔʣΛϕΫτϧͰදݱ ଏޠͱඪ४ޠͷํͰදಛྔΛநग़ɺྨࣅΛٻΊΔ ˔ଏޠΒ͠͞ͷείΞ4D XJ ɹ͕ᮢҎ্ͳΒग़ྗީิ͔Βআ֎ 文字列から抽出する表層特徴量
感性類似度に基づく候補抽出 ײੑධՁରͷछྨΛײੑධՁϕΫτϧͱ͢Δɻ ΞϯέʔτऔಘࡁΈͷएऀݴ༿ͷ֓೦ϕΫτϧʹ͓͚Δ֤࣍ݩͷ ؔ࿈ΛٻΊɺײੑධՁॏΈߦྻΛٻΊΔɻ ͦͯ͠ɺײੑධՁϕΫτϧͷಋग़Λߦ͏ɻ ೖྗ͞Εͨएऀݴ༿͔Βਪఆ͞ΕͨײੑධՁϕΫτϧͱɺม
ީิͱͯ͠ಘΒΕͨ୯ޠͷײੑධՁϕΫτϧͷײੑྨࣅΛܭࢉ ͢Δɻ ͜ͷ݁Ռͱඪ४ޠΒ͠͞ͷείΞʢ4D XJ º ʣΛֻ͚߹Θͤ ͨͰɺมީิΛॱҐ͚͢Δɻ
若者言葉の標準語への変換候補 Ұͭͷएऀݴ༿ʹ̏ޠͷඪ४ޠީิ͕ਖ਼ղީิͱͯ͠༩ ͞ΕΔɻ 若者言葉と対応する標準語の例
実験結果 ˔ϕʔεϥΠϯख๏ ඪ४ޠΒ͠͞ͷείΞܭࢉٴͼײੑྨࣅͷܭࢉ͠ͳ͍ ֓೦ϕΫτϧͷྨࣅͷΈͰͷஅ ˔ධՁํ๏ .33 .FBO3FDJQSPDBM3BOL
ͷฏۉ ݕࡧ݁Ռͷ͏ͪɺਖ਼ղͱͳΔ୯ޠ͕/ݸग़ྗ͞Εͨ߹ɺ ͦͷ୯ޠͷग़ྗॱҐ3J ͷٯͷ૯Λਖ਼ղ୯ޠͰׂͬͨ
実験結果 .33 ඪ४ޠͷਖ਼ղީิΛ࣋ͭଏޠʹରͯ͠ܭࢉ ʢඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦϯάख๏ʣ .33 ΞϯέʔτʹΑΓਖ਼ղީิΛܾఆͨ͠ଏޠʹରͯ͠ܭࢉ ʢϕʔεϥΠϯख๏ʣ
˔.33 ͕.33 ΑΓ͍ ෆཁͳޠΛϑΟϧλϦϯάͰআڈ ɹ͢Δ͜ͱ͕Ͱ͖͍ͯΔɻ MRR平均の比較
実験結果 ఏҊख๏Ͱɺਖ਼ղҎ֎ͷྨࣅޠީิΛϑΟϧλϦϯά͢Δ ͜ͱͰɺਖ਼ղީิͷॱҐΛߴ͘อ͍ͯͯΔɻ 変換候補の例
実験結果 ײੑྨࣅɺ֓೦ϕΫτϧͷ࣍ݩ͕গͳ͍࣌ʹɺͦΕΛΧόʔ͢Δ ޮՌ͕େ͖͍ɻ ඪ४ޠΒ͠͞ͷείΞʹΑΔϑΟϧλϦϯάͰɺਖ਼ղΛ͢͜ͱ͕ Ͱ͖ͳ͍߹͕͋Δɻ 感性類似度のみを適用した場合の比較 標準語らしさのスコアによるフィルタリングのみを適 用した場合の比較
まとめ ˔ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦ ϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘Ͱ͖Δɻ ˔ඪ४ޠΒ͠͞ͷείΞͷܭࢉํ๏ͷվળʹΑΓɺϑΟϧλ Ϧϯάͷਫ਼Λ্ͤ͞Δඞཁ͕͋Δɻ