Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
言語処理年次大会報告
Search
Ayumu
March 19, 2019
Technology
0
72
言語処理年次大会報告
2019/03/19
長岡技術科学大学 自然言語処理研究室
学部4年 守谷 歩
Ayumu
March 19, 2019
Tweet
Share
More Decks by Ayumu
See All by Ayumu
B3ゼミ_03_28_マルチモーダル学習_.pdf
ayumum
0
140
マルチモーダル学習
ayumum
0
120
B3ゼミ 自然言語処理におけるCNN
ayumum
0
84
ニューラルネット4
ayumum
0
95
文献紹介「二値符号予測と誤り訂正を用いたニューラル翻訳モデル」
ayumum
0
130
ニューラルネット3 誤差伝搬法,CNN,word2vec
ayumum
0
160
ニューラルネット実践
ayumum
0
97
文献紹介[Zero-Shot Dialog Generation with Cross-Domain Latent Action]
ayumum
0
150
パーセプトロンとニューラルネット1
ayumum
0
100
Other Decks in Technology
See All in Technology
ここが嬉しいABAC ここが辛いよABAC #再解説+補足編
masahirokawahara
1
270
データベース02: データベースの概念
trycycle
0
150
Databricks における 『MLOps』
databricksjapan
2
170
Janus
bkuhlmann
1
490
障害対応をちょっとずつよくしていくための 演習の作りかた
heleeen
0
130
反実仮想機械学習とは何か
usaito
PRO
11
4.3k
元インフラエンジニアに成る / Human Resources to Human Relations
bobtani
4
900
非同期推論システムによるコスト削減と信頼性向上
koki_nishihara
0
220
ServiceNow Knowledge Learning Rise up
manarobot
0
210
GraphQL 成熟度モデルの紹介と、プロダクトに当てはめた事例 / GraphQL maturity model
mh4gf
7
1.3k
コンテナセキュリティの基本と脅威への対策
kyohmizu
3
750
EMとして2023年度に頑張ったこと / What we did well in FY2023 as a EM
pauli
1
160
Featured
See All Featured
Teambox: Starting and Learning
jrom
128
8.4k
Infographics Made Easy
chrislema
238
18k
The Language of Interfaces
destraynor
151
23k
What's in a price? How to price your products and services
michaelherold
237
11k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
18
6.9k
[RailsConf 2023] Rails as a piece of cake
palkan
23
3.9k
Faster Mobile Websites
deanohume
299
30k
How to name files
jennybc
65
93k
10 Git Anti Patterns You Should be Aware of
lemiorhan
648
58k
Raft: Consensus for Rubyists
vanstee
132
6.3k
The Art of Programming - Codeland 2020
erikaheidi
42
12k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
241
1.2M
Transcript
言語処理学会 第25回年次大会報告 2019/03/19 長岡技術科学大学 自然言語処理研究室 学部4年 守谷 歩 1
講演で気になったもの ⚫A 1-1 日本語から英語への文脈翻訳テストの提案 ⚫B 2-1 文章と絵からの感情認識手法の開発 ⚫A 4-7 A
preliminary study on estimating word imageability labels using Web image data mining ⚫B 5-1 ありがちでない歌詞生成に向けた曲調と歌詞の関係に基づ くベクトル空間モデル 2
講演 気になった点 ⚫機械翻訳では、文脈を考慮した機械翻訳がメインに語られていた 気がした。その中でも「A1-1日本語から英語への文脈翻訳テストの 提案」は文脈考慮の機械翻訳のテストセットを作ったといった発表 でかなり有用性があると感じた。 ⚫マルチモーダルといった分野では画像の情報を用いて機械翻訳 の精度を上げることがメインとして話されていた。画像の情報を用 いてもBLEUといった評価尺度ではあまり変化がない(少量の上昇) が、この考え方によって訂正される問題は人間にとって大きな問題
であると感じたため有用性を感じた。 3
招待講演で気になった点 ⚫社会脳科学と自然言語処理 ⚫特定の個人に対して集中して感情、性格分析を行うといった発想が言 語処理でなく、社会脳科学といった分野での考え方らしい ⚫性格分析や感情分析の結果としては単語情報が一番の重要なデータ であるとの結論だったため、今後の言語処理で発展できる分野ではな いか ⚫探求と共同を通じた子供たちの「深い学び」 ⚫京都大学2018年英語の問題のような文章問題の生成は、今後児童 教育といった面で需要が出るテーマ
⚫導入問題を作るにあたって、直観的に簡単かつ話し合いやアイディア 出し合いが出せる容易な問題の生成は重要 4
ポスターで気になったもの ⚫P 2-2 単語分散表現に基づいた誤差による ニューラル機械翻訳の学習 ⚫P 2-11 クエリ・出力長を考慮可能な文書要約 モデル ⚫P
3-20 BERTを用いた機械翻訳の自動評価 ⚫P 3-36 自動発話に頑健な機械翻訳の検討 ⚫P 4-8 負の語彙制約に基づくニューラル言い 換え生成 ⚫P 5-10 機械翻訳に対する文間文脈を考慮し た評価と分析 ⚫P 5-22 事前学習した単語分散表現を利用した マルチモーダル機械翻訳 ⚫P 6-13 文学作品における教師なし話者推定 ⚫P 7-4 擬ユークリッド空間への単語埋め込み ⚫P 7-21 教師なし英日ニューラル機械翻訳の検 討と文の潜在表現の分析 ⚫P 8-4 知識グラフ埋め込みのための二値化CP 分解 ⚫P 8-8 画像/言語同時埋め込みベクトル空間の 構築に向けた埋め込み粒度の比較検討 5
ポスターで特に気になったもの ⚫P 3-20 BERTを用いた機械翻訳の自動評価 ⚫P 4-8 負の語彙制約に基づくニューラル言い換え生成 ⚫P 5-22 事前学習した単語分散表現を利用したマルチモーダル機
械翻訳 ⚫P 7-4 擬ユークリッド空間への単語埋め込み ⚫P 7-21 教師なし英日ニューラル機械翻訳の検討と文の潜在表現 の分析 ⚫P 8-4 知識グラフ埋め込みのための二値化CP分解 6
事前学習した単語分散表現を利用した マルチモーダル機械翻訳 ⚫マルチモーダル機械翻訳といった、言語情報以外の情報も用いて 機械翻訳を行う手法についての発表 ⚫これまでのマルチモーダル機械翻訳では画像特徴量や外部リ ソースを利用していた。 ⚫画像特徴量を機械翻訳に組み込む方法は一定の性能改善のみ で確立された手法がなかった ⚫外部リソースを利用する方法は、対訳コーパスに画像データを付 与するといったものが盛んにおこなわれていた。
⚫事前学習された単語分散表現をそのまま、利用することでその性 能をよくしたといった発表 7
ポスター 所感 ⚫詳しく説明するポスターよりも、声の大きさや姿勢といった点で人 が集まっているといった感じを受けた ⚫わかりやすく説明しているポスターは事前の発表練習をしている ような印象を受けた 8
招待論文で気になったもの ⚫平易なコーパスを用いないテキスト平易化 ⚫生成された、生コーパスを用いてリーダビリティ、文間類似度によって 生成された疑似パラレルコーパスで、学習したモデル大規模コーパス を用いて学習するモデルと同等の性能を示したという点でとても興味 深く感じた。 ⚫名詞句の情報の状態と読み時間について ⚫言語情報の処理を読み手の目で文字を追う時間(読み時間)といった 概念で考えることで、人間、主に読者がどこに重要視して文を理解して いるのかといった考えが面白く感じた。
9
スポンサーイブニングについて ⚫企業の方と話し合いをすることでどのように言語処理の技術が使 われているのかということについて、具体的に知ることができた。 ⚫また、企業が今後の言語処理の展開についてどのように考えてい るのかを聞くことで、企業が求めているニーズを感じることができた。 ⚫スポンサーイブニングの時間が結構少なく感じ、すべての企業を 回ることはできなかった。 10
その他年次大会の所感 ⚫ニューラル翻訳モデルに関しての研究が多く感じた。また、ニュー ラル翻訳でも特に現状起こっている問題に対しての解決といった面 に重きが充てられている感じがした。 ⚫BERTといった技術にかかる時間を考慮してか、機械学習の時間短 縮に関する発表が一定数あると感じた。 ⚫自分の聴講したものの限りでは、モデルに機能を追加したなどと いったイメージが大きく感じた。 11