Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NLP2015-大会報告会
Search
MIKAMI-YUKI
March 23, 2015
Education
0
51
NLP2015-大会報告会
MIKAMI-YUKI
March 23, 2015
Tweet
Share
More Decks by MIKAMI-YUKI
See All by MIKAMI-YUKI
2016年_年次大会_発表資料
mikamiy
0
120
文献紹介_10_意味的類似性と多義解消を用いた文書検索手法
mikamiy
0
290
文献紹介_9_コーパスに基づく動詞の多義解消
mikamiy
0
110
文献紹介_8_単語単位による日本語言語モデルの検討
mikamiy
0
83
文献紹介_7_自動獲得した未知語の読み・文脈情報による仮名漢字変換
mikamiy
0
90
文献紹介_6_複数の言語的特徴を用いた日本語述部の同義判定
mikamiy
0
99
文献紹介_5_マイクロブログにおける感情・コミュニケーション・動作タイプの推定に基づく顔文字の推薦
mikamiy
0
120
文献紹介_4_結合価パターンを用いた仮名漢字変換候補の選択
mikamiy
0
390
文献紹介_3_絵本のテキストを対象とした形態素解析
mikamiy
1
410
Other Decks in Education
See All in Education
Image compression
hachama
0
410
5 Things Every L&D Pro Should Steal from Marketing
tmiket
0
160
Use Cases and Course Review - Lecture 8 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
890
The Prison Industrial Complex by Billy Dee
oripsolob
0
750
プログラミング基礎#4(名古屋造形大学)
yusk1450
PRO
0
130
Mathematics used in cryptography around us
herumi
2
770
【みんなのコード】文科省生成AIガイドラインVer.2.0 入門編
codeforeveryone
0
110
Juvenile in Justice
oripsolob
0
360
Tips for the Presentation - Lecture 2 - Advanced Topics in Big Data (4023256FNR)
signer
PRO
0
220
Поступай в ТОГУ 2025
pnuslide
0
21k
CV_1_Introduction
hachama
0
170
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
250
Featured
See All Featured
Code Reviewing Like a Champion
maltzj
521
39k
The Cult of Friendly URLs
andyhume
78
6.2k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.5k
Designing on Purpose - Digital PM Summit 2013
jponch
117
7.1k
Rebuilding a faster, lazier Slack
samanthasiow
80
8.9k
Gamification - CAS2011
davidbonilla
80
5.2k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.3k
A Tale of Four Properties
chriscoyier
158
23k
Side Projects
sachag
452
42k
Docker and Python
trallard
44
3.3k
Transcript
長岡技術科学大学 三上侑城 2015年3月23日 年次大会報告会 自然言語処理研究室 1
特に気になった発表 B1-4:文節機能部の確率的書き換えによるキャラクタ性変換 B4-4:高次脳機能障害スクリーニング調査支援ツールの開発 2
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 近年、ユーザの意図に応じて応答を返す対話型エージェントが普及して きている。 エージェントを会話相手とする際に、何らかの人物像(キャラクタ設定) を与えることで、より人間らしく、親しみやすいものとなる。 しかし、キャラクタ毎に人手で発話データを作成するのはコストがかかる。
そこで、特定のキャラクタらしさを持った発話の自動生成を目指している。 3
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 4 処理の流れ
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 5 キャラクタによる書き換え例 元文: 駅の傍に美味しいお寿司があります。
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 6 置き換えの規則例
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 結果 違和感のある出力を10%程度に抑えつつ、80%以上の正解率で、 キャラクタを判断可能な付与を行なうことができている。 7
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 高次脳障害患者の障害度や回復度をはかるために、スクリーニング検査 というものが行われる。 スクリーニング検査は脳を使う問題を出題し、それに答えられるかを見て 症状を判断するもの。 その中でも「三単語復唱」という、3つの単語を覚える問題がある。
しかしこの3つの単語は、ほぼ変えられずに長い間使用され続けており、 被験者がこの単語を暗記してしまい、正確な症状の判断ができない問 題がある。 厳格な決まりがあり、勝手にこの単語を変更することが一般的に許されて いない。 そこで、厳格な決まりを守りつつ、単語を作成できるものを作成することを 試みている。 8
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 3単語の生成ルール ・性別、年代に関係なくよく知られていること。 ・短い音数であること。 ・単語間の連想性、相似性が低いこと。 このルールより、童話や童謡から名詞を取り出して使うことにした。
取り出した名詞をカテゴリ別に分類。 「食べ物」,「乗り物」,「植物」,「動物」,「建築物」,「日用品」, 「スポーツ」,「空想物」 任意のカテゴリから一つずつ単語を選び、3つを選出する。 9
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 問題点1 例として「猫・こたつ・みかん」という組み合わせができてしまった時に、連 想が非常に容易にできてしまう。 解決策 ・連想語辞書(renso)による判定 単語の連想語を検索し、選ばれた残り2つが含まれないことを確認す
る。これを3単語全てのペアで行ない、問題ないものだけをクリアとする。 問題点2 例として「ハチ・柿・臼」という組み合わせができてしまった時に、さるかに 合戦として容易に記憶できてしまう。 解決策 ・共起率による連想性の判定を用いる。対象のコーパスには単語抽出で 利用した、童話・童謡を使用する。2つの単語が同じ物語・歌の中に含 まれた時には、候補から破棄する。 10
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 問題点3 例として「自動車・馬・刺身」という組み合わせができてしまった時に、馬 は乗り物でもあり、食べ物でもあるので、連想できてしまう。 解決策 ・単語間の類似度判定を行う。 単語間の類似度判定を行い、ある程度類似度が高いものがある場合
には、破棄する。 問題点4 例として「やかん・図鑑・ようかん」という組み合わせができてしまった時に、 全て最後が「かん」で終わるため覚えやすくなってしまう。 解決策 ・3つの単語全ての始音、終音が異なるもののみクリアし、同じ物がある 場合には破棄する。 11
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 結果 300組の3単語を出力した結果、96.7%が実際の検査で使用可 能であるという高評価を得た。 12
見たもの(17日) B1:対話 B1-1:地方議会会議録に含まれる地域課題を論題とした ディベート型対話システムの提案 B1-2:雑談対話システムにおける単語分散表現を用いた 話題展開手法 B1-3:ユーザ情報抽出のための自己開示文の人物属性分類
B1-4:文節機能部の確率的書き換えによるキャラクタ性変換 B1-5:雑談対話データへの複数人でのタグ付与における 曖昧タグの評価値の推定 13
見たもの(17日) A2:情報抽出(1) A2-1:ブートストラップ法を用いたTwitter からの不具合文抽出 A2-2:推理小説の難易度評価のための犯人推定 A2-3:ブログページからのウェブサイト情報・作成者情報の抽出
A2-4:言語横断手法による日本語時間的順序関係推定 14
見たもの(18日) B3:評判・感情解析 B3-1:文脈を考慮した観点に基づく意見ツイートクラスタリング B3-2:意見文の対象読者を限定する条件の抽出 B3-3:Word2Vecを用いた顔文字の感情分類 B3-4:うつ傾向推定に向けた抗うつ剤服用の投稿を起点とした
Twitter解析の初期検討 B3-5:顔文字のパーツの種類と表情の強弱に着目した 顔文字表情推定 15
見たもの(18日) B4:情報抽出(2) B4-1:動画サービスにおける外国動画に付与されたタグの分析 B4-2:中間言語との Dice 係数ベクトルを用いた対訳抽出 B4-3:時間情報を用いた文書への自動タグ付与モデルに関する検討
B4-4:高次脳機能障害スクリーニング検査支援ツールの開発 16
見たもの(19日) C5:機械学習(2) C5-1:単語のベクトル表現による文脈に応じた単語の同義語拡張 C5-2:辞書と文脈情報を用いた対義語モデルの学習 C5-3:語順と共起を考慮したニューラル言語モデルによる英文穴埋め C5-4:隠れ状態を用いたホテルレビューのレーティング予測
17
見たもの(19日) B6:テキストマイニング B6-1:Improving Churn Prediction with Voice of the
Customer B6-2:大量のつぶやきから日本酒の美味しい店を発掘する: 知識源としてのマイクロブログ活用の試み B6-3:識別子中の自然言語使用に基づくプログラム 実装技術解析に関する調査 B6-4:Computationalizing a Toulmin Model for Argumentation Generation B6-5:発達心理学の観点から見た絵本レビュー中の 子供の反応の分析 18
見たもの(19日) E7:要約 E7-1:分散表現を用いたヤフー知恵袋の要約 E7-2:木刈込みに基づく文書要約のためのZDDを用いた 動的計画法 E7-3:施設配置問題に基づく同一料理のレシピ集合 からの基本手順の抽出
E7-4:テレビ番組をより楽しむための実時間ツイート選択システム E7-5:文書の重要箇所抽出及び重み付け要約課題の 解決方策についての分析 19
見たもの(17日) P1:ポスター(1) P1-6:英語学習者コーパスのための句構造アノテーション P1-11:テキスト分類のための単語分割 P1-14:事象間の接続関係に基づく時間的順序関係推定 P1-18:SignWriting表記の手話文を対象とした簡単な
アメリカ手話-日本手話翻訳の検討 P1-20:法令対訳コーパスからの複単語表現抽出 P1-27:マイクロブログに対する文境界推定および係り受け解析 20
見たもの(17日) P2:ポスター(2) P2-19:方言コーパスに基づく発話者の地域推定 P2-22:風邪に罹ったのは誰か? --- 疾患・症状を保有する主体の推定 P2-24:キーワードの自動拡張に基づくイベント言及ツイートの収集
P2-25:インフルエンザ流行検出のための事実性解析 21
見たもの(18日) P3:ポスター(3) P3-3:文のカテゴリと極性の度合いの推定を行う 評判分析システムの研究 P3-9:機械翻訳の活用を見据えた文書構造と言語表現の対応づけ ―自治体手続き型文書を対象とした予備的報告― P3-10:多言語リアルタイム会話における日本語動詞語尾崩れの検出
P3-18:GAによる機械加工メモの自動要約に関する予備検討 P3-23:確率的トピックモデルを用いた評判文書における 意外な評価視点の発見とそれに基づく情報推薦 P3-27:高専関連報道記事を活用した活動情報の獲得と分析 22
見たもの(19日) P4:ポスター(4) P4-10:分散表現を用いた動詞・フレーズの含意関係認識 P4-14:絵本レビューにおける子供の反応記述検出のための 特徴的表現の分析 P4-19:表層的な統語素性を用いたチャンキングによる 対訳フレーズの抽出
P4-21:日本語人名辞書を用いた中国語文書からの人名抽出 P4-26:既存小説に依存しない小説の自動生成に関する一考察 23