Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
作文支援とコーパス
Search
katsutan
February 09, 2017
Technology
0
96
作文支援とコーパス
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表3
katsutan
February 09, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
180
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
160
Simple task-specific bilingual word embeddings
katsutan
0
180
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
200
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
150
Improving Word Embeddings Using Kernel PCA
katsutan
0
180
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
240
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
220
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
250
Other Decks in Technology
See All in Technology
DevOpsメトリクスとアウトカムの接続にトライ!開発プロセスを通して計測できるメトリクスの活用方法
ham0215
2
240
Postman v10リリース後を振り返る / Looking back at Postman v10 after release
yokawasa
1
160
Reducing Cross-Zone Egress at Spotify with Custom gRPC Load Balancing Recap
koh_naga
0
200
コードを書く隙間を見つけて生きていく技術/Findy 思考の現在地
fujiwara3
27
5.9k
複雑な構成要素を持つUIとの向き合い方 〜新・支出グラフでの実例〜 / B43 TECH TALK
nakamuuu
0
140
ゼロから始めるVue.jsコミュニティ貢献 / first-vuejs-community-contribution-link-and-motivation
lmi
1
120
20240416_devopsdaystokyo
kzkmaeda
1
220
FrontDoorとWebAppsを組み合わせた際のリダイレクト処理の注意点
kenichirokimura
1
510
GraphQL 成熟度モデルの紹介と、プロダクトに当てはめた事例 / GraphQL maturity model
mh4gf
7
1.3k
リテール金融(キャッシュレス・ネット銀行・ネット証券)の競争環境と経済圏
8maki
0
860
自己改善からチームを動かす! 「セルフエンジニアリングマネージャー」のすゝめ
shoota
6
430
プロンプトエンジニアリングでがんばらない-Agentic Workflow へ-近藤憲児
kenjikondobai
2
140
Featured
See All Featured
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
25
2.3k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
34
8.9k
Optimizing for Happiness
mojombo
370
69k
Designing the Hi-DPI Web
ddemaree
276
33k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
14
1.6k
Fontdeck: Realign not Redesign
paulrobertlloyd
76
4.9k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3k
Testing 201, or: Great Expectations
jmmastey
28
6.3k
Mobile First: as difficult as doing things right
swwweet
216
8.6k
Become a Pro
speakerdeck
PRO
11
4.5k
How to train your dragon (web standard)
notwaldorf
73
5.2k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
155
14k
Transcript
作文支援とコーパス 長岡技術科学大学 学部3年 自然言語処理研究室 勝田 哲弘 1 2017/2/9
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 2
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 コンピュータ
3
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 4
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ 難しくない 5
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない 6
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない ↓ 日本語でメールを書くのは難しくない。
7
データ駆動型学習(Data Driven Learning) • コンピュータを教師として考えるのではなく、 インフォーマントに近いものと位置付ける。 ▫ 学習者が言語データを観察し学習する。 • 学習者が作文過程で表記法、文法、語彙選択な
どを観察するための支援ツール 「なつめ」 「現代日本語書き言葉均衡コーパス(BCCWJ)」を 利用したシステム 8
コーパスの利用 • レジスタ ▫ 目的、状況や書き言葉、話し言葉などのジャンル ごとにみられる語彙、文法の変異をいう。 実験の測定値と理論値を比較すると 話し言葉: ちゃんと値が合っている。 論文の書き言葉:良好な値を示している。
9
コーパスの利用 • 共起表現 ▫ 語と語がある関係の下で同時に出現すること。 [形容詞+名詞] {美味しい/温かい/熱い}ご飯 • 特に、高い確率で出現する共起表現をコロケー ション(collocation)と呼ぶ。
10
問題点 • 学習者にある程度のレベルを要求する。 • 使い分けをするにはジャンルによってコーパス を分類するのが有効であるが、コーパスの構築 には、 大量で正確なアノテーションが必要になる。 11
参考文献 • 「コーパスと日本語教育」 第5章 砂川有里子[編] 朝倉書店 12