Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150120 発表資料
Search
Yuta
January 21, 2015
Education
0
160
20150120 発表資料
Yuta
January 21, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
170
NLP2016 報告
sudo
0
190
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
260
20150909 発表資料
sudo
0
140
20150820 文献紹介
sudo
0
190
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
190
20150512 文献紹介
sudo
0
180
Other Decks in Education
See All in Education
データで見る赤ちゃんの成長
syuchimu
0
270
CHARMS-HP-Banner
weltraumreisende
0
770
技術勉強会 〜 OAuth & OIDC 入門編 / 20250528 OAuth and OIDC
oidfj
5
1.8k
みんなのコードD&I推進レポート2025 テクノロジー分野のジェンダーギャップとその取り組みについて
codeforeveryone
0
210
H5P-työkalut
matleenalaakso
4
40k
小学校女性教員向け プログラミング教育研修プログラム「SteP」の実践と課題
codeforeveryone
0
110
Портфолио - Шынар Ауелбекова
shynar
0
110
日本の情報系社会人院生のリアル -JAIST 修士編-
yurikomium
1
120
登壇未経験者のための登壇戦略~LTは設計が9割!!!~
masakiokuda
3
670
Présentation_1ère_Spé_2025.pdf
bernhardsvt
0
220
AIの時代こそ、考える知的学習術
yum3
2
200
EVOLUCIÓN DE LAS NEUROCIENCIAS EN LOS CONTEXTOS ORGANIZACIONALES
jvpcubias
0
150
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Unsuck your backbone
ammeep
671
58k
The Invisible Side of Design
smashingmag
301
51k
How to train your dragon (web standard)
notwaldorf
96
6.2k
Designing for humans not robots
tammielis
253
25k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
810
The Pragmatic Product Professional
lauravandoore
36
6.9k
Building Applications with DynamoDB
mza
96
6.6k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.1k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
358
30k
A Tale of Four Properties
chriscoyier
160
23k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.6k
Transcript
機械翻訳 自然言語処理研究室 B3 須戸悠太 1
機械翻訳とは • コンピュータで、ある言語の文を他の言語の文 に翻訳する技術。 • 入力となる言語→源言語 • 出力となる言語→目標言語 2
機械翻訳とは • 身近な機械翻訳 ▫ Google 翻訳 ▫ エキサイト 翻訳 ▫
Yahoo!翻訳 などの翻訳サイト 3
機械翻訳方式 4 目的言語の 構文構造 源言語の 構文構造 目的言語の テキスト 源言語の テキスト
目的言語の 意味構造 源言語の 意味構造 中間言語 意味的トランスファ方式 構文的トランスファ方式 単語直接方式
単語直接方式 • 源言語の文を形態素解析、対訳辞書などを用い て単語列を目標言語の単語列に変換する。 • 文法が類似する言語間では有効。 • 例 ▫ 英)
President Lincoln was a good lawyer. ▫ 仏) Président Lincoln était un bon avocat. (リンカーン大統領は良い弁護士でした。) 5
トランスファ方式 ステップ1:解析 • 源言語の文に対し形態素、構文/意味解析を行う ステップ2:変換 • 得られた構文/意味構造を目標言語の構文/意味 構造に変換 ステップ3:生成 •
目標言語の構文/意味構造から文を生成する。 6
トランスファ方式 ステップ2-a:語彙的トランスファ • 対訳辞書を用いて、言語間の各単語について適 切な単語を選択する。 ステップ2-b:構造的トランスファ • 変換規則により構造の変換を行う。 7
トランスファ方式 例:”I take a picture.”→「私は写真を撮る」 • 文構造(この変換規則を用意) ▫ 英語 :主語+動詞+目的語
▫ 日本語:主語+目的語+動詞 • 対訳辞書を通して日本語に変換 • 訳語選択は選択制限や、周辺の単語との共起な どの情報を用いて行う。 8
トランスファ方式 利点 • 源言語と目標言語の間の構文/意味構造上の相違 など扱える。 欠点 • 言語のペアごとに変換規則が必要 ▫ 例:nカ国語に相互に翻訳を行うとn(n-1)個のシス
テムが必要 9
中間言語方式 • トランスファ方式よりも深い意味解析を行い、 特定の言語に依存しない表現(中間言語)を得 ることで目的の文を生成する方式。 • 各言語についての解析・生成モジュールの開発 をすれば良い。 • 中間言語=人工言語であり、設計が困難。
10
用例に基づく機械翻訳(EBMT) • 源言語と目標言語の文がペアになった用例を大 量にデータとして蓄積。 • 用例の中で入力文と源言語の文が最も類似する 用例を選び、それを元に翻訳を行う。 11
用例に基づく機械翻訳(EBMT) • 用例のデータの例 He takes a photo. →彼は写真を撮る。 Ann took
an apple. →アンはりんごを食べた。 Tom took a bus. →トムはバスに乗った。 例:”I take a picture.”→1番目の用例と最も類似 • 対応する目標言語の文を基に翻訳する。 12