Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
感性を考慮した日本語俗語の標準語変換
Search
kakubari
February 13, 2017
Technology
0
400
感性を考慮した日本語俗語の標準語変換
長岡技術科学大学 自然言語処理研究室
学部3年 角張竜晴
文献紹介:人工知能学会論文誌Vol.32(2017) No.1
kakubari
February 13, 2017
Tweet
Share
More Decks by kakubari
See All by kakubari
動詞クエリの語間の関係性に基づくクエリマイニング
kakubari
0
120
Neural Modeling of Multi-Predicate Interactions for Japanese Predicate Argument Structure Analysis
kakubari
1
190
Leveraging Crowdsourcing for Paraphrase Recognition
kakubari
0
100
Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis
kakubari
0
110
Labeling the Semantic Roles of Commas
kakubari
0
94
Integrating Case Frame into Japanese to Chinese Hierarchical Phrase-based Translation Model
kakubari
0
120
Improving Chinese Semantic Role Labelingusing High-quality Surface and Deep Case Frames
kakubari
0
96
Exploring Verb Frames for Sentence Simplification in Hindi
kakubari
0
150
述語項構造と照応関係のアノテーション
kakubari
0
250
Other Decks in Technology
See All in Technology
Sansanでの認証基盤内製化と移行
sansantech
PRO
0
550
AI時代のSaaSとETL
shoe116
1
180
猫でもわかるKiro CLI(AI 駆動開発への道編)
kentapapa
0
250
OpenClaw を Amazon Lightsail で動かす理由
uechishingo
0
170
OCHaCafe S11 #2 コンテナ時代の次の一手:Wasm 最前線
oracle4engineer
PRO
2
150
Yahoo!ショッピングのレコメンデーション・システムにおけるML実践の一例
lycorptech_jp
PRO
1
220
"作る"から"使われる"へ:Backstage 活用の現在地
sbtechnight
0
180
[E2]CCoEはAI指揮官へ。Bedrock×MCPで構築するコスト・セキュリティ自律運用基盤
taku1418
0
190
複数クラスタ運用と検索の高度化:ビズリーチにおけるElastic活用事例 / ElasticON Tokyo2026
visional_engineering_and_design
0
170
PMとしての意思決定とAI活用状況について
lycorptech_jp
PRO
0
140
Claude Code のコード品質がばらつくので AI に品質保証させる仕組みを作った話 / A story about building a mechanism to have AI ensure quality, because the code quality from Claude Code was inconsistent
nrslib
13
8.5k
スクリプトの先へ!AIエージェントと組み合わせる モバイルE2Eテスト
error96num
0
180
Featured
See All Featured
エンジニアに許された特別な時間の終わり
watany
106
240k
Optimizing for Happiness
mojombo
378
71k
30 Presentation Tips
portentint
PRO
1
250
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
150
Statistics for Hackers
jakevdp
799
230k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Rails Girls Zürich Keynote
gr2m
96
14k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
63
51k
The Cult of Friendly URLs
andyhume
79
6.8k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
92
Amusing Abliteration
ianozsvald
0
130
Transcript
Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ֯ ு ཽ 感性を考慮した日本語俗語の標準語変換 Conversion of Japanese Slang into Standard Japanese Considering Sensibility 松本 和幸, 土屋 誠司, 芋野 美紗子, 吉田 稔, 北 研二 人工知能学会論文誌 7PM /P Q8MM"@ จಛूʮΣϒΠϯςϦδΣϯεͱΠϯλϥΫγϣϯʯ ਤදจΑΓҾ༻
概要 ˔एऀݴ༿Λҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ ม͢Δ ଟ࣍ݩͷҹ࣠ ҙຯϕΫτϧ ˔͔ͬͨ͜ͱ
ϕʔεϥΠϯख๏ΑΓߴ͍.33ͷ͕ߴ͍ ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟ ϧλϦϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘อͯ Δ
はじめに ˔एऀݴ༿ͷதʹɺඪ४ޠΛݴ͍͑ͨදݱ͕ଟ͘ ଘࡏ͢Δɻ एऀݴ༿Λඪ४ޠʹม͢Δͱʜ ɹҙݟɾධੳײೝࣝͷਫ਼Λվળ ˔एऀݴ༿ΘΕΔظؒ໘ɺίϛϡχςΟʹ Β͖͕ͭ͋Γɺҙຯ༻๏࣌ͱͱʹมԽ͢Δɻ
8FC্ͷ4/4͔Βऩूͨ͠ςΩετͷίʔύε ײੑධՁ࣠ͱҙຯϕΫτϧΛ༻͍ͯʜ ɹҙຯతʹײੑతʹྨࣅͨ͠ඪ४ޠʹ͢Δ
実験手法 ˔एऀݴ༿ͷײੑੳ एऀݴ༿ͷײੑධՁΞϯέʔτ एऀݴ༿ͱඪ४ޠͷײੑൺֱ ˔ίʔύεͷߏங एऀ5XFFUίʔύε ˔एऀݴ༿͔Βඪ४ޠͷมख๏
จ຺ྨࣅੑʹجͮ͘ྨޠͷऔಘ ଏޠΒ͠͞ͷܭࢉ ײੑྨࣅʹجͮ͘ީิநग़
若者言葉の感性評価アンケート ˔एऀײίʔύε χίχίେඦՊ ɹޠΛબఆ ˔ධՁํ๏ ඃݧऀʹޠ ֤ޠʹରͯ͠ɺ໊̎Ҏ্͕ճ
छྨͷײੑධՁର ֤ஈ֊ͰධՁ ࣍ݩͷײੑධՁϕΫτϧʹมɾਖ਼ نԽ͠ɺࣗݾ৫ԽϚοϓΛ༻͍ͯੳ ˔ධՁ݁Ռ Α͘ࣅͨҹͷݴ༿͕͍ۙҐஔʹදࣔ 感性評価ベクトルに基づき自己組織化マップに より若者言葉を配置した例 アンケートに用いた感性評価軸
若者言葉と標準語の感性比較 ˔ޠͷதͰɺҎԼͷ݅ʹͯ·ΔޠΛநग़ ಉҰදهޠ͕طଘ͢Δඪ४ޠʹొ͞Ε͍ͯͳ͍ ҙຯ͕ಉҰ·ͨྨࣅ͢Δදݱ͕ࣙॻʹొ͞Ε͍ͯΔ ˔एऀݴ༿ͱରԠ͢Δඪ४ޠͷ QPTJUJWFOFHBUJWFOFVUSBMͷ༁ Ұக͢Δ߹ɺ
Ұக͠ͳ͍߹͋Δ एऀݴ༿͔Βඪ४ޠม͢Δͱ ɹײੑ͕มԽ͢Δ एऀݴ༿QPTJUJWFඪ४ޠOFHBUJWF͕ 若者言葉と対応する標準語の感性比較
俗語らしさの計算 ˔ޠͷಛʢ/Pd/P·ͰͷಛྔʣΛϕΫτϧͰදݱ ଏޠͱඪ४ޠͷํͰදಛྔΛநग़ɺྨࣅΛٻΊΔ ˔ଏޠΒ͠͞ͷείΞ4D XJ ɹ͕ᮢҎ্ͳΒग़ྗީิ͔Βআ֎ 文字列から抽出する表層特徴量
感性類似度に基づく候補抽出 ײੑධՁରͷछྨΛײੑධՁϕΫτϧͱ͢Δɻ ΞϯέʔτऔಘࡁΈͷएऀݴ༿ͷ֓೦ϕΫτϧʹ͓͚Δ֤࣍ݩͷ ؔ࿈ΛٻΊɺײੑධՁॏΈߦྻΛٻΊΔɻ ͦͯ͠ɺײੑධՁϕΫτϧͷಋग़Λߦ͏ɻ ೖྗ͞Εͨएऀݴ༿͔Βਪఆ͞ΕͨײੑධՁϕΫτϧͱɺม
ީิͱͯ͠ಘΒΕͨ୯ޠͷײੑධՁϕΫτϧͷײੑྨࣅΛܭࢉ ͢Δɻ ͜ͷ݁Ռͱඪ४ޠΒ͠͞ͷείΞʢ4D XJ º ʣΛֻ͚߹Θͤ ͨͰɺมީิΛॱҐ͚͢Δɻ
若者言葉の標準語への変換候補 Ұͭͷएऀݴ༿ʹ̏ޠͷඪ४ޠީิ͕ਖ਼ղީิͱͯ͠༩ ͞ΕΔɻ 若者言葉と対応する標準語の例
実験結果 ˔ϕʔεϥΠϯख๏ ඪ४ޠΒ͠͞ͷείΞܭࢉٴͼײੑྨࣅͷܭࢉ͠ͳ͍ ֓೦ϕΫτϧͷྨࣅͷΈͰͷஅ ˔ධՁํ๏ .33 .FBO3FDJQSPDBM3BOL
ͷฏۉ ݕࡧ݁Ռͷ͏ͪɺਖ਼ղͱͳΔ୯ޠ͕/ݸग़ྗ͞Εͨ߹ɺ ͦͷ୯ޠͷग़ྗॱҐ3J ͷٯͷ૯Λਖ਼ղ୯ޠͰׂͬͨ
実験結果 .33 ඪ४ޠͷਖ਼ղީิΛ࣋ͭଏޠʹରͯ͠ܭࢉ ʢඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦϯάख๏ʣ .33 ΞϯέʔτʹΑΓਖ਼ղީิΛܾఆͨ͠ଏޠʹରͯ͠ܭࢉ ʢϕʔεϥΠϯख๏ʣ
˔.33 ͕.33 ΑΓ͍ ෆཁͳޠΛϑΟϧλϦϯάͰআڈ ɹ͢Δ͜ͱ͕Ͱ͖͍ͯΔɻ MRR平均の比較
実験結果 ఏҊख๏Ͱɺਖ਼ղҎ֎ͷྨࣅޠީิΛϑΟϧλϦϯά͢Δ ͜ͱͰɺਖ਼ղީิͷॱҐΛߴ͘อ͍ͯͯΔɻ 変換候補の例
実験結果 ײੑྨࣅɺ֓೦ϕΫτϧͷ࣍ݩ͕গͳ͍࣌ʹɺͦΕΛΧόʔ͢Δ ޮՌ͕େ͖͍ɻ ඪ४ޠΒ͠͞ͷείΞʹΑΔϑΟϧλϦϯάͰɺਖ਼ղΛ͢͜ͱ͕ Ͱ͖ͳ͍߹͕͋Δɻ 感性類似度のみを適用した場合の比較 標準語らしさのスコアによるフィルタリングのみを適 用した場合の比較
まとめ ˔ඪ४ޠΒ͠͞ͷείΞٴͼײੑྨࣅʹجͮ͘ϑΟϧλϦ ϯάʹΑΓɺਖ਼ղީิͷมॱҐΛߴ͘Ͱ͖Δɻ ˔ඪ४ޠΒ͠͞ͷείΞͷܭࢉํ๏ͷվળʹΑΓɺϑΟϧλ Ϧϯάͷਫ਼Λ্ͤ͞Δඞཁ͕͋Δɻ