Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
作文支援とコーパス
Search
katsutan
February 09, 2017
Technology
110
0
Share
作文支援とコーパス
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表3
katsutan
February 09, 2017
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
250
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
220
Simple task-specific bilingual word embeddings
katsutan
0
220
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
270
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
220
Improving Word Embeddings Using Kernel PCA
katsutan
0
240
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
330
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
280
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
310
Other Decks in Technology
See All in Technology
世界の中心でApp Runnerを叫ぶ FINAL
tsukuboshi
0
230
フロントエンドの相手が変わった - AIが加わったWebの新しいインターフェース設計
azukiazusa1
31
10k
(きっとたぶん)人材育成や教育のような何かの話
sejima
0
570
ハーネスエンジニアリングをやりすぎた話 ~そのハーネスは解体された~
gotalab555
5
2k
拝啓、あの夏の僕へ〜あなたも知っているApp Runnerの世界〜
news_it_enj
0
210
Agent Skillsで実現する記憶領域の運用とその後
yamadashy
1
190
データ定義の混乱と戦う 〜 管理会計と財務会計 〜
wonohe
0
220
[Oracle TechNight#99] 生成AI時代のAI/ML入門 ~ AIとオラクルデータベースの関係 (後半)
oracle4engineer
PRO
3
220
AI時代の品質はテストプロセスの作り直し #scrumniigata
kyonmm
PRO
4
1.3k
小説執筆のハーネスエンジニアリング
yoshitetsu
0
910
需要創出(Chatwork)×供給(BPaaS) フライホイールとMoat 実行能力の最適配置とAI戦略
kubell_hr
0
1.9k
Oracle Cloud Infrastructure:2026年4月度サービス・アップデート
oracle4engineer
PRO
0
320
Featured
See All Featured
WENDY [Excerpt]
tessaabrams
10
37k
The Spectacular Lies of Maps
axbom
PRO
1
730
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
280
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
170
Paper Plane (Part 1)
katiecoart
PRO
0
7k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
250
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
350
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Amusing Abliteration
ianozsvald
1
160
Are puppies a ranking factor?
jonoalderson
1
3.4k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
170
Transcript
作文支援とコーパス 長岡技術科学大学 学部3年 自然言語処理研究室 勝田 哲弘 1 2017/2/9
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 2
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 コンピュータ
3
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 4
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ 難しくない 5
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない 6
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない ↓ 日本語でメールを書くのは難しくない。
7
データ駆動型学習(Data Driven Learning) • コンピュータを教師として考えるのではなく、 インフォーマントに近いものと位置付ける。 ▫ 学習者が言語データを観察し学習する。 • 学習者が作文過程で表記法、文法、語彙選択な
どを観察するための支援ツール 「なつめ」 「現代日本語書き言葉均衡コーパス(BCCWJ)」を 利用したシステム 8
コーパスの利用 • レジスタ ▫ 目的、状況や書き言葉、話し言葉などのジャンル ごとにみられる語彙、文法の変異をいう。 実験の測定値と理論値を比較すると 話し言葉: ちゃんと値が合っている。 論文の書き言葉:良好な値を示している。
9
コーパスの利用 • 共起表現 ▫ 語と語がある関係の下で同時に出現すること。 [形容詞+名詞] {美味しい/温かい/熱い}ご飯 • 特に、高い確率で出現する共起表現をコロケー ション(collocation)と呼ぶ。
10
問題点 • 学習者にある程度のレベルを要求する。 • 使い分けをするにはジャンルによってコーパス を分類するのが有効であるが、コーパスの構築 には、 大量で正確なアノテーションが必要になる。 11
参考文献 • 「コーパスと日本語教育」 第5章 砂川有里子[編] 朝倉書店 12