Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150120 発表資料
Search
Yuta
January 21, 2015
Education
0
150
20150120 発表資料
Yuta
January 21, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
160
NLP2016 報告
sudo
0
180
NLP2016 発表スライド
sudo
0
200
20160218 文献紹介
sudo
0
220
20150909 発表資料
sudo
0
140
20150820 文献紹介
sudo
0
170
20150708 文献紹介
sudo
0
150
20150610 文献紹介
sudo
0
170
20150512 文献紹介
sudo
0
180
Other Decks in Education
See All in Education
WordPressを教える人のための視点と考え方
crebowinfo
0
240
SUMMER SCHOOL 2024
pnuslide
0
150
Multimodal Interaction - Lecture 3 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.1k
View Manipulation and Reduction - Lecture 9 - Information Visualisation (4019538FNR)
signer
PRO
1
1.4k
第1回全国商業高校Webアプリコンテスト総括
asial_corp
0
410
Tangible, Embedded and Embodied Interaction - Lecture 9 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.2k
論文の読み方 / How to survey
kaityo256
PRO
177
120k
week2@tcue2024
nonxxxizm
0
820
MySmartSTEAM2324
cbtlibrary
0
130
4 занятие. Разбор бизнес-моделей и метод красной нити #ideaNN 9.02.2024.
karlov
0
230
Switches
irocho
0
190
LTをすべき100の理由
eltociear
1
290
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
356
18k
Practical Orchestrator
shlominoach
183
9.7k
Infographics Made Easy
chrislema
238
18k
Web development in the modern age
philhawksworth
203
10k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
19
6.9k
The Art of Programming - Codeland 2020
erikaheidi
43
12k
The Brand Is Dead. Long Live the Brand.
mthomps
49
29k
How to Ace a Technical Interview
jacobian
273
22k
Large-scale JavaScript Application Architecture
addyosmani
504
110k
Web Components: a chance to create the future
zenorocha
306
41k
Art, The Web, and Tiny UX
lynnandtonic
290
19k
It's Worth the Effort
3n
180
27k
Transcript
機械翻訳 自然言語処理研究室 B3 須戸悠太 1
機械翻訳とは • コンピュータで、ある言語の文を他の言語の文 に翻訳する技術。 • 入力となる言語→源言語 • 出力となる言語→目標言語 2
機械翻訳とは • 身近な機械翻訳 ▫ Google 翻訳 ▫ エキサイト 翻訳 ▫
Yahoo!翻訳 などの翻訳サイト 3
機械翻訳方式 4 目的言語の 構文構造 源言語の 構文構造 目的言語の テキスト 源言語の テキスト
目的言語の 意味構造 源言語の 意味構造 中間言語 意味的トランスファ方式 構文的トランスファ方式 単語直接方式
単語直接方式 • 源言語の文を形態素解析、対訳辞書などを用い て単語列を目標言語の単語列に変換する。 • 文法が類似する言語間では有効。 • 例 ▫ 英)
President Lincoln was a good lawyer. ▫ 仏) Président Lincoln était un bon avocat. (リンカーン大統領は良い弁護士でした。) 5
トランスファ方式 ステップ1:解析 • 源言語の文に対し形態素、構文/意味解析を行う ステップ2:変換 • 得られた構文/意味構造を目標言語の構文/意味 構造に変換 ステップ3:生成 •
目標言語の構文/意味構造から文を生成する。 6
トランスファ方式 ステップ2-a:語彙的トランスファ • 対訳辞書を用いて、言語間の各単語について適 切な単語を選択する。 ステップ2-b:構造的トランスファ • 変換規則により構造の変換を行う。 7
トランスファ方式 例:”I take a picture.”→「私は写真を撮る」 • 文構造(この変換規則を用意) ▫ 英語 :主語+動詞+目的語
▫ 日本語:主語+目的語+動詞 • 対訳辞書を通して日本語に変換 • 訳語選択は選択制限や、周辺の単語との共起な どの情報を用いて行う。 8
トランスファ方式 利点 • 源言語と目標言語の間の構文/意味構造上の相違 など扱える。 欠点 • 言語のペアごとに変換規則が必要 ▫ 例:nカ国語に相互に翻訳を行うとn(n-1)個のシス
テムが必要 9
中間言語方式 • トランスファ方式よりも深い意味解析を行い、 特定の言語に依存しない表現(中間言語)を得 ることで目的の文を生成する方式。 • 各言語についての解析・生成モジュールの開発 をすれば良い。 • 中間言語=人工言語であり、設計が困難。
10
用例に基づく機械翻訳(EBMT) • 源言語と目標言語の文がペアになった用例を大 量にデータとして蓄積。 • 用例の中で入力文と源言語の文が最も類似する 用例を選び、それを元に翻訳を行う。 11
用例に基づく機械翻訳(EBMT) • 用例のデータの例 He takes a photo. →彼は写真を撮る。 Ann took
an apple. →アンはりんごを食べた。 Tom took a bus. →トムはバスに乗った。 例:”I take a picture.”→1番目の用例と最も類似 • 対応する目標言語の文を基に翻訳する。 12