Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
作文支援とコーパス
Search
katsutan
February 09, 2017
Technology
0
97
作文支援とコーパス
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表3
katsutan
February 09, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
210
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
190
Simple task-specific bilingual word embeddings
katsutan
0
200
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
230
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
190
Improving Word Embeddings Using Kernel PCA
katsutan
0
200
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
290
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
250
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
270
Other Decks in Technology
See All in Technology
QAはソフトウェアエンジニアリングを学んで実践するのが大事なの
ymty
1
240
Grafana MCP serverでなんかし隊 / Try Grafana MCP server
kohbis
0
310
Devin(Deep) Wiki/Searchの活用で変わる開発の世界観/devin-wiki-search-impact
tomoki10
0
210
ハッカー視点で学ぶサイバー攻撃と防御の基本
nomizone
3
1.4k
What's new in OpenShift 4.19
redhatlivestreaming
1
150
New Cache Hierarchy for Container Images and OCI Artifacts in Kubernetes Clusters using Containerd / KubeCon + CloudNativeCon Japan
pfn
PRO
0
130
データ戦略部門 紹介資料
sansan33
PRO
1
3.2k
Cloud Native Scalability for Internal Developer Platforms
hhiroshell
2
240
Whats_new_in_Podman_and_CRI-O_2025-06
orimanabu
3
160
バクラクのモノレポにおける AI Coding のための環境整備と {Roo,Claude} Code活用事例 / AI Coding in Bakuraku's Monorepo: Environment Setup & Case Studies with {Roo, Claude} Code
upamune
8
5.5k
kubellが挑むBPaaSにおける、人とAIエージェントによるサービス開発の最前線と技術展望
kubell_hr
0
160
Nonaka Sensei
kawaguti
PRO
3
560
Featured
See All Featured
Fireside Chat
paigeccino
37
3.5k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.3k
Rails Girls Zürich Keynote
gr2m
94
14k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.8k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
106
19k
Practical Orchestrator
shlominoach
188
11k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
How to train your dragon (web standard)
notwaldorf
92
6.1k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.3k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
770
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
120
Transcript
作文支援とコーパス 長岡技術科学大学 学部3年 自然言語処理研究室 勝田 哲弘 1 2017/2/9
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 2
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 コンピュータ
3
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 4
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ 難しくない 5
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない 6
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない ↓ 日本語でメールを書くのは難しくない。
7
データ駆動型学習(Data Driven Learning) • コンピュータを教師として考えるのではなく、 インフォーマントに近いものと位置付ける。 ▫ 学習者が言語データを観察し学習する。 • 学習者が作文過程で表記法、文法、語彙選択な
どを観察するための支援ツール 「なつめ」 「現代日本語書き言葉均衡コーパス(BCCWJ)」を 利用したシステム 8
コーパスの利用 • レジスタ ▫ 目的、状況や書き言葉、話し言葉などのジャンル ごとにみられる語彙、文法の変異をいう。 実験の測定値と理論値を比較すると 話し言葉: ちゃんと値が合っている。 論文の書き言葉:良好な値を示している。
9
コーパスの利用 • 共起表現 ▫ 語と語がある関係の下で同時に出現すること。 [形容詞+名詞] {美味しい/温かい/熱い}ご飯 • 特に、高い確率で出現する共起表現をコロケー ション(collocation)と呼ぶ。
10
問題点 • 学習者にある程度のレベルを要求する。 • 使い分けをするにはジャンルによってコーパス を分類するのが有効であるが、コーパスの構築 には、 大量で正確なアノテーションが必要になる。 11
参考文献 • 「コーパスと日本語教育」 第5章 砂川有里子[編] 朝倉書店 12