Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NLP2015-大会報告会
Search
MIKAMI-YUKI
March 23, 2015
Education
0
52
NLP2015-大会報告会
MIKAMI-YUKI
March 23, 2015
Tweet
Share
More Decks by MIKAMI-YUKI
See All by MIKAMI-YUKI
2016年_年次大会_発表資料
mikamiy
0
130
文献紹介_10_意味的類似性と多義解消を用いた文書検索手法
mikamiy
0
330
文献紹介_9_コーパスに基づく動詞の多義解消
mikamiy
0
120
文献紹介_8_単語単位による日本語言語モデルの検討
mikamiy
0
91
文献紹介_7_自動獲得した未知語の読み・文脈情報による仮名漢字変換
mikamiy
0
98
文献紹介_6_複数の言語的特徴を用いた日本語述部の同義判定
mikamiy
0
100
文献紹介_5_マイクロブログにおける感情・コミュニケーション・動作タイプの推定に基づく顔文字の推薦
mikamiy
0
130
文献紹介_4_結合価パターンを用いた仮名漢字変換候補の選択
mikamiy
0
400
文献紹介_3_絵本のテキストを対象とした形態素解析
mikamiy
1
420
Other Decks in Education
See All in Education
自己紹介 / who-am-i
yasulab
PRO
3
5.4k
Tutorial: Foundations of Blind Source Separation and Its Advances in Spatial Self-Supervised Learning
yoshipon
1
150
Avoin jakaminen ja Creative Commons -lisenssit
matleenalaakso
0
1.9k
2025年度春学期 統計学 第15回 分布についての仮説を検証する ー 仮説検定(2) (2025. 7. 17)
akiraasano
PRO
0
100
みんなのコード 2024年度活動報告書/ 2025年度活動計画書
codeforeveryone
0
290
大学院進学について(2025年度版)
imash
0
120
附属科学技術高等学校の概要|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
130
核燃料政策を問う─英国の決断と日本
hide2kano
0
180
新卒研修に仕掛ける 学びのサイクル / Implementing Learning Cycles in New Graduate Training
takashi_toyosaki
1
220
Ch1_-_Partie_1.pdf
bernhardsvt
0
200
中間活動報告会 人材育成WG・技術サブWG / 20250808-oidfj-eduWG-techSWG
oidfj
0
630
2025年度春学期 統計学 第13回 不確かな測定の不確かさを測る ー 不偏分散とt分布 (2025. 7. 3)
akiraasano
PRO
0
120
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
580
Practical Orchestrator
shlominoach
190
11k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.4k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
187
55k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
How to train your dragon (web standard)
notwaldorf
96
6.2k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Fireside Chat
paigeccino
39
3.6k
Transcript
長岡技術科学大学 三上侑城 2015年3月23日 年次大会報告会 自然言語処理研究室 1
特に気になった発表 B1-4:文節機能部の確率的書き換えによるキャラクタ性変換 B4-4:高次脳機能障害スクリーニング調査支援ツールの開発 2
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 近年、ユーザの意図に応じて応答を返す対話型エージェントが普及して きている。 エージェントを会話相手とする際に、何らかの人物像(キャラクタ設定) を与えることで、より人間らしく、親しみやすいものとなる。 しかし、キャラクタ毎に人手で発話データを作成するのはコストがかかる。
そこで、特定のキャラクタらしさを持った発話の自動生成を目指している。 3
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 4 処理の流れ
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 5 キャラクタによる書き換え例 元文: 駅の傍に美味しいお寿司があります。
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 6 置き換えの規則例
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 結果 違和感のある出力を10%程度に抑えつつ、80%以上の正解率で、 キャラクタを判断可能な付与を行なうことができている。 7
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 高次脳障害患者の障害度や回復度をはかるために、スクリーニング検査 というものが行われる。 スクリーニング検査は脳を使う問題を出題し、それに答えられるかを見て 症状を判断するもの。 その中でも「三単語復唱」という、3つの単語を覚える問題がある。
しかしこの3つの単語は、ほぼ変えられずに長い間使用され続けており、 被験者がこの単語を暗記してしまい、正確な症状の判断ができない問 題がある。 厳格な決まりがあり、勝手にこの単語を変更することが一般的に許されて いない。 そこで、厳格な決まりを守りつつ、単語を作成できるものを作成することを 試みている。 8
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 3単語の生成ルール ・性別、年代に関係なくよく知られていること。 ・短い音数であること。 ・単語間の連想性、相似性が低いこと。 このルールより、童話や童謡から名詞を取り出して使うことにした。
取り出した名詞をカテゴリ別に分類。 「食べ物」,「乗り物」,「植物」,「動物」,「建築物」,「日用品」, 「スポーツ」,「空想物」 任意のカテゴリから一つずつ単語を選び、3つを選出する。 9
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 問題点1 例として「猫・こたつ・みかん」という組み合わせができてしまった時に、連 想が非常に容易にできてしまう。 解決策 ・連想語辞書(renso)による判定 単語の連想語を検索し、選ばれた残り2つが含まれないことを確認す
る。これを3単語全てのペアで行ない、問題ないものだけをクリアとする。 問題点2 例として「ハチ・柿・臼」という組み合わせができてしまった時に、さるかに 合戦として容易に記憶できてしまう。 解決策 ・共起率による連想性の判定を用いる。対象のコーパスには単語抽出で 利用した、童話・童謡を使用する。2つの単語が同じ物語・歌の中に含 まれた時には、候補から破棄する。 10
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 問題点3 例として「自動車・馬・刺身」という組み合わせができてしまった時に、馬 は乗り物でもあり、食べ物でもあるので、連想できてしまう。 解決策 ・単語間の類似度判定を行う。 単語間の類似度判定を行い、ある程度類似度が高いものがある場合
には、破棄する。 問題点4 例として「やかん・図鑑・ようかん」という組み合わせができてしまった時に、 全て最後が「かん」で終わるため覚えやすくなってしまう。 解決策 ・3つの単語全ての始音、終音が異なるもののみクリアし、同じ物がある 場合には破棄する。 11
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 結果 300組の3単語を出力した結果、96.7%が実際の検査で使用可 能であるという高評価を得た。 12
見たもの(17日) B1:対話 B1-1:地方議会会議録に含まれる地域課題を論題とした ディベート型対話システムの提案 B1-2:雑談対話システムにおける単語分散表現を用いた 話題展開手法 B1-3:ユーザ情報抽出のための自己開示文の人物属性分類
B1-4:文節機能部の確率的書き換えによるキャラクタ性変換 B1-5:雑談対話データへの複数人でのタグ付与における 曖昧タグの評価値の推定 13
見たもの(17日) A2:情報抽出(1) A2-1:ブートストラップ法を用いたTwitter からの不具合文抽出 A2-2:推理小説の難易度評価のための犯人推定 A2-3:ブログページからのウェブサイト情報・作成者情報の抽出
A2-4:言語横断手法による日本語時間的順序関係推定 14
見たもの(18日) B3:評判・感情解析 B3-1:文脈を考慮した観点に基づく意見ツイートクラスタリング B3-2:意見文の対象読者を限定する条件の抽出 B3-3:Word2Vecを用いた顔文字の感情分類 B3-4:うつ傾向推定に向けた抗うつ剤服用の投稿を起点とした
Twitter解析の初期検討 B3-5:顔文字のパーツの種類と表情の強弱に着目した 顔文字表情推定 15
見たもの(18日) B4:情報抽出(2) B4-1:動画サービスにおける外国動画に付与されたタグの分析 B4-2:中間言語との Dice 係数ベクトルを用いた対訳抽出 B4-3:時間情報を用いた文書への自動タグ付与モデルに関する検討
B4-4:高次脳機能障害スクリーニング検査支援ツールの開発 16
見たもの(19日) C5:機械学習(2) C5-1:単語のベクトル表現による文脈に応じた単語の同義語拡張 C5-2:辞書と文脈情報を用いた対義語モデルの学習 C5-3:語順と共起を考慮したニューラル言語モデルによる英文穴埋め C5-4:隠れ状態を用いたホテルレビューのレーティング予測
17
見たもの(19日) B6:テキストマイニング B6-1:Improving Churn Prediction with Voice of the
Customer B6-2:大量のつぶやきから日本酒の美味しい店を発掘する: 知識源としてのマイクロブログ活用の試み B6-3:識別子中の自然言語使用に基づくプログラム 実装技術解析に関する調査 B6-4:Computationalizing a Toulmin Model for Argumentation Generation B6-5:発達心理学の観点から見た絵本レビュー中の 子供の反応の分析 18
見たもの(19日) E7:要約 E7-1:分散表現を用いたヤフー知恵袋の要約 E7-2:木刈込みに基づく文書要約のためのZDDを用いた 動的計画法 E7-3:施設配置問題に基づく同一料理のレシピ集合 からの基本手順の抽出
E7-4:テレビ番組をより楽しむための実時間ツイート選択システム E7-5:文書の重要箇所抽出及び重み付け要約課題の 解決方策についての分析 19
見たもの(17日) P1:ポスター(1) P1-6:英語学習者コーパスのための句構造アノテーション P1-11:テキスト分類のための単語分割 P1-14:事象間の接続関係に基づく時間的順序関係推定 P1-18:SignWriting表記の手話文を対象とした簡単な
アメリカ手話-日本手話翻訳の検討 P1-20:法令対訳コーパスからの複単語表現抽出 P1-27:マイクロブログに対する文境界推定および係り受け解析 20
見たもの(17日) P2:ポスター(2) P2-19:方言コーパスに基づく発話者の地域推定 P2-22:風邪に罹ったのは誰か? --- 疾患・症状を保有する主体の推定 P2-24:キーワードの自動拡張に基づくイベント言及ツイートの収集
P2-25:インフルエンザ流行検出のための事実性解析 21
見たもの(18日) P3:ポスター(3) P3-3:文のカテゴリと極性の度合いの推定を行う 評判分析システムの研究 P3-9:機械翻訳の活用を見据えた文書構造と言語表現の対応づけ ―自治体手続き型文書を対象とした予備的報告― P3-10:多言語リアルタイム会話における日本語動詞語尾崩れの検出
P3-18:GAによる機械加工メモの自動要約に関する予備検討 P3-23:確率的トピックモデルを用いた評判文書における 意外な評価視点の発見とそれに基づく情報推薦 P3-27:高専関連報道記事を活用した活動情報の獲得と分析 22
見たもの(19日) P4:ポスター(4) P4-10:分散表現を用いた動詞・フレーズの含意関係認識 P4-14:絵本レビューにおける子供の反応記述検出のための 特徴的表現の分析 P4-19:表層的な統語素性を用いたチャンキングによる 対訳フレーズの抽出
P4-21:日本語人名辞書を用いた中国語文書からの人名抽出 P4-26:既存小説に依存しない小説の自動生成に関する一考察 23