Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
作文支援とコーパス
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
katsutan
February 09, 2017
Technology
0
110
作文支援とコーパス
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表3
katsutan
February 09, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
240
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
220
Simple task-specific bilingual word embeddings
katsutan
0
210
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
270
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
220
Improving Word Embeddings Using Kernel PCA
katsutan
0
230
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
320
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
270
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
300
Other Decks in Technology
See All in Technology
PMとしての意思決定とAI活用状況について
lycorptech_jp
PRO
0
120
AI時代のSaaSとETL
shoe116
1
140
複数クラスタ運用と検索の高度化:ビズリーチにおけるElastic活用事例 / ElasticON Tokyo2026
visional_engineering_and_design
0
150
JAWS DAYS 2026 楽しく学ぼう!ストレージ 入門
yoshiki0705
2
180
今のWordPress の制作手法ってなにがあんねん?(改) / What’s the Deal with WordPress Development These Days?
tbshiki
0
450
アーキテクチャモダナイゼーションを実現する組織
satohjohn
1
820
Lambda Web AdapterでLambdaをWEBフレームワーク利用する
sahou909
0
130
最強のAIエージェントを諦めたら品質が上がった話 / how quality improved after giving up on the strongest AI agent
kt2mikan
0
180
プラットフォームエンジニアリングはAI時代の開発者をどう救うのか
jacopen
2
950
Abuse report だけじゃない。AWS から緊急連絡が来る状況とは?昨今の攻撃や被害の事例の紹介と備えておきたい考え方について
kazzpapa3
1
680
Scrumは歪む — 組織設計の原理原則
dashi
0
170
DevOpsエージェントで実現する!! AWS Well-Architected(W-A) を実現するシステム設計 / 20260307 Masaki Okuda
shift_evolve
PRO
3
760
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
6k
Git: the NoSQL Database
bkeepers
PRO
432
66k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
350
My Coaching Mixtape
mlcsv
0
71
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
480
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
The Limits of Empathy - UXLibs8
cassininazir
1
260
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
220
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
230
Transcript
作文支援とコーパス 長岡技術科学大学 学部3年 自然言語処理研究室 勝田 哲弘 1 2017/2/9
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 2
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 コンピュータ
3
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 4
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ 難しくない 5
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない 6
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない ↓ 日本語でメールを書くのは難しくない。
7
データ駆動型学習(Data Driven Learning) • コンピュータを教師として考えるのではなく、 インフォーマントに近いものと位置付ける。 ▫ 学習者が言語データを観察し学習する。 • 学習者が作文過程で表記法、文法、語彙選択な
どを観察するための支援ツール 「なつめ」 「現代日本語書き言葉均衡コーパス(BCCWJ)」を 利用したシステム 8
コーパスの利用 • レジスタ ▫ 目的、状況や書き言葉、話し言葉などのジャンル ごとにみられる語彙、文法の変異をいう。 実験の測定値と理論値を比較すると 話し言葉: ちゃんと値が合っている。 論文の書き言葉:良好な値を示している。
9
コーパスの利用 • 共起表現 ▫ 語と語がある関係の下で同時に出現すること。 [形容詞+名詞] {美味しい/温かい/熱い}ご飯 • 特に、高い確率で出現する共起表現をコロケー ション(collocation)と呼ぶ。
10
問題点 • 学習者にある程度のレベルを要求する。 • 使い分けをするにはジャンルによってコーパス を分類するのが有効であるが、コーパスの構築 には、 大量で正確なアノテーションが必要になる。 11
参考文献 • 「コーパスと日本語教育」 第5章 砂川有里子[編] 朝倉書店 12