Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NLP2015-大会報告会
Search
MIKAMI-YUKI
March 23, 2015
Education
0
51
NLP2015-大会報告会
MIKAMI-YUKI
March 23, 2015
Tweet
Share
More Decks by MIKAMI-YUKI
See All by MIKAMI-YUKI
2016年_年次大会_発表資料
mikamiy
0
120
文献紹介_10_意味的類似性と多義解消を用いた文書検索手法
mikamiy
0
280
文献紹介_9_コーパスに基づく動詞の多義解消
mikamiy
0
110
文献紹介_8_単語単位による日本語言語モデルの検討
mikamiy
0
82
文献紹介_7_自動獲得した未知語の読み・文脈情報による仮名漢字変換
mikamiy
0
88
文献紹介_6_複数の言語的特徴を用いた日本語述部の同義判定
mikamiy
0
97
文献紹介_5_マイクロブログにおける感情・コミュニケーション・動作タイプの推定に基づく顔文字の推薦
mikamiy
0
120
文献紹介_4_結合価パターンを用いた仮名漢字変換候補の選択
mikamiy
0
390
文献紹介_3_絵本のテキストを対象とした形態素解析
mikamiy
1
410
Other Decks in Education
See All in Education
Medicare 101 for 2025
robinlee
PRO
0
310
Da Necessidade da Devoção à Virgem Santíssima
cm_manaus
0
100
Repaso electricidade e electrónica
irocho
0
210
地図を活用した関西シビックテック事例紹介
barsaka2
0
100
Kindleストアで本を探すことの善悪 #Izumo Developers' Guild 第1回 LT大会
totodo713
0
150
Stratégie de marketing digital - les fondamentaux
martine
0
140
自分にあった読書方法を探索するワークショップ / Reading Catalog Workshop
aki_moon
0
200
TP5_-_UV.pdf
bernhardsvt
0
120
"数学" をプログラミングしてもらう際に気をつけていること / Key Considerations When Programming "Mathematics"
guvalif
0
610
お仕事図鑑pitchトーク
tetsuyaooooo
0
2.3k
Казармы и гарнизоны
pnuslide
0
140
Sähköiset kyselyt, kokeet ja arviointi
matleenalaakso
1
17k
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
427
64k
Imperfection Machines: The Place of Print at Facebook
scottboms
266
13k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
95
17k
Statistics for Hackers
jakevdp
796
220k
Fashionably flexible responsive web design (full day workshop)
malarkey
405
65k
Embracing the Ebb and Flow
colly
84
4.5k
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5k
Designing Experiences People Love
moore
138
23k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.4k
The Cost Of JavaScript in 2023
addyosmani
45
7k
Transcript
長岡技術科学大学 三上侑城 2015年3月23日 年次大会報告会 自然言語処理研究室 1
特に気になった発表 B1-4:文節機能部の確率的書き換えによるキャラクタ性変換 B4-4:高次脳機能障害スクリーニング調査支援ツールの開発 2
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 近年、ユーザの意図に応じて応答を返す対話型エージェントが普及して きている。 エージェントを会話相手とする際に、何らかの人物像(キャラクタ設定) を与えることで、より人間らしく、親しみやすいものとなる。 しかし、キャラクタ毎に人手で発話データを作成するのはコストがかかる。
そこで、特定のキャラクタらしさを持った発話の自動生成を目指している。 3
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 4 処理の流れ
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 5 キャラクタによる書き換え例 元文: 駅の傍に美味しいお寿司があります。
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 6 置き換えの規則例
B1-4: 文節機能部の確率的書き換えによるキャラクタ性変換 結果 違和感のある出力を10%程度に抑えつつ、80%以上の正解率で、 キャラクタを判断可能な付与を行なうことができている。 7
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 高次脳障害患者の障害度や回復度をはかるために、スクリーニング検査 というものが行われる。 スクリーニング検査は脳を使う問題を出題し、それに答えられるかを見て 症状を判断するもの。 その中でも「三単語復唱」という、3つの単語を覚える問題がある。
しかしこの3つの単語は、ほぼ変えられずに長い間使用され続けており、 被験者がこの単語を暗記してしまい、正確な症状の判断ができない問 題がある。 厳格な決まりがあり、勝手にこの単語を変更することが一般的に許されて いない。 そこで、厳格な決まりを守りつつ、単語を作成できるものを作成することを 試みている。 8
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 3単語の生成ルール ・性別、年代に関係なくよく知られていること。 ・短い音数であること。 ・単語間の連想性、相似性が低いこと。 このルールより、童話や童謡から名詞を取り出して使うことにした。
取り出した名詞をカテゴリ別に分類。 「食べ物」,「乗り物」,「植物」,「動物」,「建築物」,「日用品」, 「スポーツ」,「空想物」 任意のカテゴリから一つずつ単語を選び、3つを選出する。 9
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 問題点1 例として「猫・こたつ・みかん」という組み合わせができてしまった時に、連 想が非常に容易にできてしまう。 解決策 ・連想語辞書(renso)による判定 単語の連想語を検索し、選ばれた残り2つが含まれないことを確認す
る。これを3単語全てのペアで行ない、問題ないものだけをクリアとする。 問題点2 例として「ハチ・柿・臼」という組み合わせができてしまった時に、さるかに 合戦として容易に記憶できてしまう。 解決策 ・共起率による連想性の判定を用いる。対象のコーパスには単語抽出で 利用した、童話・童謡を使用する。2つの単語が同じ物語・歌の中に含 まれた時には、候補から破棄する。 10
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 問題点3 例として「自動車・馬・刺身」という組み合わせができてしまった時に、馬 は乗り物でもあり、食べ物でもあるので、連想できてしまう。 解決策 ・単語間の類似度判定を行う。 単語間の類似度判定を行い、ある程度類似度が高いものがある場合
には、破棄する。 問題点4 例として「やかん・図鑑・ようかん」という組み合わせができてしまった時に、 全て最後が「かん」で終わるため覚えやすくなってしまう。 解決策 ・3つの単語全ての始音、終音が異なるもののみクリアし、同じ物がある 場合には破棄する。 11
B4-4 高次脳機能障害スクリーニング調査支援ツールの開発 結果 300組の3単語を出力した結果、96.7%が実際の検査で使用可 能であるという高評価を得た。 12
見たもの(17日) B1:対話 B1-1:地方議会会議録に含まれる地域課題を論題とした ディベート型対話システムの提案 B1-2:雑談対話システムにおける単語分散表現を用いた 話題展開手法 B1-3:ユーザ情報抽出のための自己開示文の人物属性分類
B1-4:文節機能部の確率的書き換えによるキャラクタ性変換 B1-5:雑談対話データへの複数人でのタグ付与における 曖昧タグの評価値の推定 13
見たもの(17日) A2:情報抽出(1) A2-1:ブートストラップ法を用いたTwitter からの不具合文抽出 A2-2:推理小説の難易度評価のための犯人推定 A2-3:ブログページからのウェブサイト情報・作成者情報の抽出
A2-4:言語横断手法による日本語時間的順序関係推定 14
見たもの(18日) B3:評判・感情解析 B3-1:文脈を考慮した観点に基づく意見ツイートクラスタリング B3-2:意見文の対象読者を限定する条件の抽出 B3-3:Word2Vecを用いた顔文字の感情分類 B3-4:うつ傾向推定に向けた抗うつ剤服用の投稿を起点とした
Twitter解析の初期検討 B3-5:顔文字のパーツの種類と表情の強弱に着目した 顔文字表情推定 15
見たもの(18日) B4:情報抽出(2) B4-1:動画サービスにおける外国動画に付与されたタグの分析 B4-2:中間言語との Dice 係数ベクトルを用いた対訳抽出 B4-3:時間情報を用いた文書への自動タグ付与モデルに関する検討
B4-4:高次脳機能障害スクリーニング検査支援ツールの開発 16
見たもの(19日) C5:機械学習(2) C5-1:単語のベクトル表現による文脈に応じた単語の同義語拡張 C5-2:辞書と文脈情報を用いた対義語モデルの学習 C5-3:語順と共起を考慮したニューラル言語モデルによる英文穴埋め C5-4:隠れ状態を用いたホテルレビューのレーティング予測
17
見たもの(19日) B6:テキストマイニング B6-1:Improving Churn Prediction with Voice of the
Customer B6-2:大量のつぶやきから日本酒の美味しい店を発掘する: 知識源としてのマイクロブログ活用の試み B6-3:識別子中の自然言語使用に基づくプログラム 実装技術解析に関する調査 B6-4:Computationalizing a Toulmin Model for Argumentation Generation B6-5:発達心理学の観点から見た絵本レビュー中の 子供の反応の分析 18
見たもの(19日) E7:要約 E7-1:分散表現を用いたヤフー知恵袋の要約 E7-2:木刈込みに基づく文書要約のためのZDDを用いた 動的計画法 E7-3:施設配置問題に基づく同一料理のレシピ集合 からの基本手順の抽出
E7-4:テレビ番組をより楽しむための実時間ツイート選択システム E7-5:文書の重要箇所抽出及び重み付け要約課題の 解決方策についての分析 19
見たもの(17日) P1:ポスター(1) P1-6:英語学習者コーパスのための句構造アノテーション P1-11:テキスト分類のための単語分割 P1-14:事象間の接続関係に基づく時間的順序関係推定 P1-18:SignWriting表記の手話文を対象とした簡単な
アメリカ手話-日本手話翻訳の検討 P1-20:法令対訳コーパスからの複単語表現抽出 P1-27:マイクロブログに対する文境界推定および係り受け解析 20
見たもの(17日) P2:ポスター(2) P2-19:方言コーパスに基づく発話者の地域推定 P2-22:風邪に罹ったのは誰か? --- 疾患・症状を保有する主体の推定 P2-24:キーワードの自動拡張に基づくイベント言及ツイートの収集
P2-25:インフルエンザ流行検出のための事実性解析 21
見たもの(18日) P3:ポスター(3) P3-3:文のカテゴリと極性の度合いの推定を行う 評判分析システムの研究 P3-9:機械翻訳の活用を見据えた文書構造と言語表現の対応づけ ―自治体手続き型文書を対象とした予備的報告― P3-10:多言語リアルタイム会話における日本語動詞語尾崩れの検出
P3-18:GAによる機械加工メモの自動要約に関する予備検討 P3-23:確率的トピックモデルを用いた評判文書における 意外な評価視点の発見とそれに基づく情報推薦 P3-27:高専関連報道記事を活用した活動情報の獲得と分析 22
見たもの(19日) P4:ポスター(4) P4-10:分散表現を用いた動詞・フレーズの含意関係認識 P4-14:絵本レビューにおける子供の反応記述検出のための 特徴的表現の分析 P4-19:表層的な統語素性を用いたチャンキングによる 対訳フレーズの抽出
P4-21:日本語人名辞書を用いた中国語文書からの人名抽出 P4-26:既存小説に依存しない小説の自動生成に関する一考察 23