Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
感性を考慮した日本語俗語の標準語変換
Search
kakubari
February 13, 2017
Technology
0
380
感性を考慮した日本語俗語の標準語変換
長岡技術科学大学 自然言語処理研究室
学部3年 角張竜晴
文献紹介:人工知能学会論文誌Vol.32(2017) No.1
kakubari
February 13, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
110
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
150
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
78
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
99
Labeling the Semantic Roles of Commas
kakubari
0
71
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
110
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
87
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
120
述語項構造と照応関係のアノテーション
kakubari
0
220
Other Decks in Technology
See All in Technology
LTに影響を受けてテンプレリポジトリを作った話
hol1kgmg
0
350
Google Cloud で学ぶデータエンジニアリング入門 2025年版 #GoogleCloudNext / 20250805
kazaneya
PRO
20
4.7k
JAWS AI/ML #30 AI コーディング IDE "Kiro" を触ってみよう
inariku
3
350
Kiroから考える AIコーディングツールの潮流
oikon48
4
680
ロールが細分化された組織でSREと協働するインフラエンジニアは何をするか? / SRE Lounge #18
kossykinto
0
210
【新卒研修資料】数理最適化 / Mathematical Optimization
brainpadpr
26
13k
マルチプロダクト×マルチテナントを支えるモジュラモノリスを中心としたアソビューのアーキテクチャ
disc99
1
420
Findy Freelance 利用シーン別AI活用例
ness
0
420
生成AI時代におけるAI・機械学習技術を用いたプロダクト開発の深化と進化 #BetAIDay
layerx
PRO
1
1.1k
AWS DDoS攻撃防御の最前線
ryutakondo
1
150
Google Agentspaceを実際に導入した効果と今後の展望
mixi_engineers
PRO
3
400
形式手法特論:位相空間としての並行プログラミング #kernelvm / Kernel VM Study Tokyo 18th
ytaka23
3
1.3k
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
30
6k
How STYLIGHT went responsive
nonsquared
100
5.7k
A designer walks into a library…
pauljervisheath
207
24k
Designing for humans not robots
tammielis
253
25k
Typedesign – Prime Four
hannesfritz
42
2.7k
The World Runs on Bad Software
bkeepers
PRO
70
11k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Designing Experiences People Love
moore
142
24k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
800
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ֯ ு ཽ 感性を考慮した日本語俗語の標準語変換 Conversion of Japanese Slang into Standard Japanese Considering Sensibility 松本 和幸, 土屋 誠司, 芋野 美紗子, 吉田 稔, 北 研二 人工知能学会論文誌 7PM /P Q8MM"@ จಛूʮΣϒΠϯςϦδΣϯεͱΠϯλϥΫγϣϯʯ ਤදจΑΓҾ༻
概要 ˔एऀݴ༿Λҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ ม͢Δ ଟ࣍ݩͷҹ࣠ ҙຯϕΫτϧ ˔͔ͬͨ͜ͱ
ϕʔεϥΠϯख๏ΑΓߴ͍.33ͷ͕ߴ͍ ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟ ϧλϦϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘อͯ Δ
はじめに ˔एऀݴ༿ͷதʹɺඪ४ޠΛݴ͍͑ͨදݱ͕ଟ͘ ଘࡏ͢Δɻ एऀݴ༿Λඪ४ޠʹม͢Δͱʜ ɹҙݟɾධੳײೝࣝͷਫ਼Λվળ ˔एऀݴ༿ΘΕΔظؒ໘ɺίϛϡχςΟʹ Β͖͕ͭ͋Γɺҙຯ༻๏࣌ͱͱʹมԽ͢Δɻ
8FC্ͷ4/4͔Βऩूͨ͠ςΩετͷίʔύε ײੑධՁ࣠ͱҙຯϕΫτϧΛ༻͍ͯʜ ɹҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ͢Δ
実験手法 ˔एऀݴ༿ͷײੑੳ एऀݴ༿ͷײੑධՁΞϯέʔτ एऀݴ༿ͱඪ४ޠͷײੑൺֱ ˔ίʔύεͷߏங एऀ5XFFUίʔύε ˔एऀݴ༿͔Βඪ४ޠͷมख๏
จ຺ྨࣅੑʹجͮ͘ྨޠͷऔಘ ଏޠΒ͠͞ͷܭࢉ ײੑྨࣅʹجͮ͘ީิநग़
若者言葉の感性評価アンケート ˔एऀײίʔύε χίχίେඦՊ ɹޠΛબఆ ˔ධՁํ๏ ඃݧऀʹޠ ֤ޠʹରͯ͠ɺ໊̎Ҏ্͕ճ
छྨͷײੑධՁର ֤ஈ֊ͰධՁ ࣍ݩͷײੑධՁϕΫτϧʹมɾਖ਼ نԽ͠ɺࣗݾ৫ԽϚοϓΛ༻͍ͯੳ ˔ධՁ݁Ռ Α͘ࣅͨҹͷݴ༿͕͍ۙҐஔʹදࣔ 感性評価ベクトルに基づき自己組織化マップに より若者言葉を配置した例 アンケートに用いた感性評価軸
若者言葉と標準語の感性比較 ˔ޠͷதͰɺҎԼͷ݅ʹͯ·ΔޠΛநग़ ಉҰදهޠ͕طଘ͢Δඪ४ޠʹొ͞Ε͍ͯͳ͍ ҙຯ͕ಉҰ·ͨྨࣅ͢Δදݱ͕ࣙॻʹొ͞Ε͍ͯΔ ˔एऀݴ༿ͱରԠ͢Δඪ४ޠͷ QPTJUJWFOFHBUJWFOFVUSBMͷ༁ Ұக͢Δ߹ɺ
Ұக͠ͳ͍߹͋Δ एऀݴ༿͔Βඪ४ޠม͢Δͱ ɹײੑ͕มԽ͢Δ एऀݴ༿QPTJUJWFඪ४ޠOFHBUJWF͕ 若者言葉と対応する標準語の感性比較
俗語らしさの計算 ˔ޠͷಛʢ/Pd/P·ͰͷಛྔʣΛϕΫτϧͰදݱ ଏޠͱඪ४ޠͷํͰදಛྔΛநग़ɺྨࣅΛٻΊΔ ˔ଏޠΒ͠͞ͷείΞ4D XJ ɹ͕ᮢҎ্ͳΒग़ྗީิ͔Βআ֎ 文字列から抽出する表層特徴量
感性類似度に基づく候補抽出 ײੑධՁରͷछྨΛײੑධՁϕΫτϧͱ͢Δɻ ΞϯέʔτऔಘࡁΈͷएऀݴ༿ͷ֓೦ϕΫτϧʹ͓͚Δ֤࣍ݩͷ ؔ࿈ΛٻΊɺײੑධՁॏΈߦྻΛٻΊΔɻ ͦͯ͠ɺײੑධՁϕΫτϧͷಋग़Λߦ͏ɻ ೖྗ͞Εͨएऀݴ༿͔Βਪఆ͞ΕͨײੑධՁϕΫτϧͱɺม
ީิͱͯ͠ಘΒΕͨ୯ޠͷײੑධՁϕΫτϧͷײੑྨࣅΛܭࢉ ͢Δɻ ͜ͷ݁Ռͱඪ४ޠΒ͠͞ͷείΞʢ4D XJ º ʣΛֻ͚߹Θͤ ͨͰɺมީิΛॱҐ͚͢Δɻ
若者言葉の標準語への変換候補 Ұͭͷएऀݴ༿ʹ̏ޠͷඪ४ޠީิ͕ਖ਼ղީิͱͯ͠༩ ͞ΕΔɻ 若者言葉と対応する標準語の例
実験結果 ˔ϕʔεϥΠϯख๏ ඪ४ޠΒ͠͞ͷείΞܭࢉٴͼײੑྨࣅͷܭࢉ͠ͳ͍ ֓೦ϕΫτϧͷྨࣅͷΈͰͷஅ ˔ධՁํ๏ .33 .FBO3FDJQSPDBM3BOL
ͷฏۉ ݕࡧ݁Ռͷ͏ͪɺਖ਼ղͱͳΔ୯ޠ͕/ݸग़ྗ͞Εͨ߹ɺ ͦͷ୯ޠͷग़ྗॱҐ3J ͷٯͷ૯Λਖ਼ղ୯ޠͰׂͬͨ
実験結果 .33 ඪ४ޠͷਖ਼ղީิΛ࣋ͭଏޠʹରͯ͠ܭࢉ ʢඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦϯάख๏ʣ .33 ΞϯέʔτʹΑΓਖ਼ղީิΛܾఆͨ͠ଏޠʹରͯ͠ܭࢉ ʢϕʔεϥΠϯख๏ʣ
˔.33 ͕.33 ΑΓ͍ ෆཁͳޠΛϑΟϧλϦϯάͰআڈ ɹ͢Δ͜ͱ͕Ͱ͖͍ͯΔɻ MRR平均の比較
実験結果 ఏҊख๏Ͱɺਖ਼ղҎ֎ͷྨࣅޠީิΛϑΟϧλϦϯά͢Δ ͜ͱͰɺਖ਼ղީิͷॱҐΛߴ͘อ͍ͯͯΔɻ 変換候補の例
実験結果 ײੑྨࣅɺ֓೦ϕΫτϧͷ࣍ݩ͕গͳ͍࣌ʹɺͦΕΛΧόʔ͢Δ ޮՌ͕େ͖͍ɻ ඪ४ޠΒ͠͞ͷείΞʹΑΔϑΟϧλϦϯάͰɺਖ਼ղΛ͢͜ͱ͕ Ͱ͖ͳ͍߹͕͋Δɻ 感性類似度のみを適用した場合の比較 標準語らしさのスコアによるフィルタリングのみを適 用した場合の比較
まとめ ˔ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦ ϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘Ͱ͖Δɻ ˔ඪ४ޠΒ͠͞ͷείΞͷܭࢉํ๏ͷվળʹΑΓɺϑΟϧλ Ϧϯάͷਫ਼Λ্ͤ͞Δඞཁ͕͋Δɻ