2019/03/19 長岡技術科学大学 自然言語処理研究室 学部4年 守谷 歩
言語処理学会第25回年次大会報告2019/03/19長岡技術科学大学 自然言語処理研究室学部4年 守谷 歩1
View Slide
講演で気になったもの⚫A 1-1 日本語から英語への文脈翻訳テストの提案⚫B 2-1 文章と絵からの感情認識手法の開発⚫A 4-7 A preliminary study on estimating word imageability labelsusing Web image data mining⚫B 5-1 ありがちでない歌詞生成に向けた曲調と歌詞の関係に基づくベクトル空間モデル2
講演 気になった点⚫機械翻訳では、文脈を考慮した機械翻訳がメインに語られていた気がした。その中でも「A1-1日本語から英語への文脈翻訳テストの提案」は文脈考慮の機械翻訳のテストセットを作ったといった発表でかなり有用性があると感じた。⚫マルチモーダルといった分野では画像の情報を用いて機械翻訳の精度を上げることがメインとして話されていた。画像の情報を用いてもBLEUといった評価尺度ではあまり変化がない(少量の上昇)が、この考え方によって訂正される問題は人間にとって大きな問題であると感じたため有用性を感じた。3
招待講演で気になった点⚫社会脳科学と自然言語処理⚫特定の個人に対して集中して感情、性格分析を行うといった発想が言語処理でなく、社会脳科学といった分野での考え方らしい⚫性格分析や感情分析の結果としては単語情報が一番の重要なデータであるとの結論だったため、今後の言語処理で発展できる分野ではないか⚫探求と共同を通じた子供たちの「深い学び」⚫京都大学2018年英語の問題のような文章問題の生成は、今後児童教育といった面で需要が出るテーマ⚫導入問題を作るにあたって、直観的に簡単かつ話し合いやアイディア出し合いが出せる容易な問題の生成は重要4
ポスターで気になったもの⚫P 2-2 単語分散表現に基づいた誤差によるニューラル機械翻訳の学習⚫P 2-11 クエリ・出力長を考慮可能な文書要約モデル⚫P 3-20 BERTを用いた機械翻訳の自動評価⚫P 3-36 自動発話に頑健な機械翻訳の検討⚫P 4-8 負の語彙制約に基づくニューラル言い換え生成⚫P 5-10 機械翻訳に対する文間文脈を考慮した評価と分析⚫P 5-22 事前学習した単語分散表現を利用したマルチモーダル機械翻訳⚫P 6-13 文学作品における教師なし話者推定⚫P 7-4 擬ユークリッド空間への単語埋め込み⚫P 7-21 教師なし英日ニューラル機械翻訳の検討と文の潜在表現の分析⚫P 8-4 知識グラフ埋め込みのための二値化CP分解⚫P 8-8 画像/言語同時埋め込みベクトル空間の構築に向けた埋め込み粒度の比較検討5
ポスターで特に気になったもの⚫P 3-20 BERTを用いた機械翻訳の自動評価⚫P 4-8 負の語彙制約に基づくニューラル言い換え生成⚫P 5-22 事前学習した単語分散表現を利用したマルチモーダル機械翻訳⚫P 7-4 擬ユークリッド空間への単語埋め込み⚫P 7-21 教師なし英日ニューラル機械翻訳の検討と文の潜在表現の分析⚫P 8-4 知識グラフ埋め込みのための二値化CP分解6
事前学習した単語分散表現を利用したマルチモーダル機械翻訳⚫マルチモーダル機械翻訳といった、言語情報以外の情報も用いて機械翻訳を行う手法についての発表⚫これまでのマルチモーダル機械翻訳では画像特徴量や外部リソースを利用していた。⚫画像特徴量を機械翻訳に組み込む方法は一定の性能改善のみで確立された手法がなかった⚫外部リソースを利用する方法は、対訳コーパスに画像データを付与するといったものが盛んにおこなわれていた。⚫事前学習された単語分散表現をそのまま、利用することでその性能をよくしたといった発表7
ポスター 所感⚫詳しく説明するポスターよりも、声の大きさや姿勢といった点で人が集まっているといった感じを受けた⚫わかりやすく説明しているポスターは事前の発表練習をしているような印象を受けた8
招待論文で気になったもの⚫平易なコーパスを用いないテキスト平易化⚫生成された、生コーパスを用いてリーダビリティ、文間類似度によって生成された疑似パラレルコーパスで、学習したモデル大規模コーパスを用いて学習するモデルと同等の性能を示したという点でとても興味深く感じた。⚫名詞句の情報の状態と読み時間について⚫言語情報の処理を読み手の目で文字を追う時間(読み時間)といった概念で考えることで、人間、主に読者がどこに重要視して文を理解しているのかといった考えが面白く感じた。9
スポンサーイブニングについて⚫企業の方と話し合いをすることでどのように言語処理の技術が使われているのかということについて、具体的に知ることができた。⚫また、企業が今後の言語処理の展開についてどのように考えているのかを聞くことで、企業が求めているニーズを感じることができた。⚫スポンサーイブニングの時間が結構少なく感じ、すべての企業を回ることはできなかった。10
その他年次大会の所感⚫ニューラル翻訳モデルに関しての研究が多く感じた。また、ニューラル翻訳でも特に現状起こっている問題に対しての解決といった面に重きが充てられている感じがした。⚫BERTといった技術にかかる時間を考慮してか、機械学習の時間短縮に関する発表が一定数あると感じた。⚫自分の聴講したものの限りでは、モデルに機能を追加したなどといったイメージが大きく感じた。11