Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
作文支援とコーパス
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
katsutan
February 09, 2017
Technology
110
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
作文支援とコーパス
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表3
katsutan
February 09, 2017
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
250
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
220
Simple task-specific bilingual word embeddings
katsutan
0
230
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
280
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
230
Improving Word Embeddings Using Kernel PCA
katsutan
0
240
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
340
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
280
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
310
Other Decks in Technology
See All in Technology
Microsoft Build Keynoteふりかえり
tomokusaba
0
120
タクシーアプリ『GO』の実践的データ活用
mot_techtalk
3
190
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
130
自律型AIエージェントは何を破壊するのか
kojira
0
150
RAG を使わないという選択肢
tatsutaka
1
200
プロダクト開発から業務改善コンサルまで。事業全体へ「染み出す」ことで広がるエンジニアの可能性
ham0215
0
110
Agentic Web
dynamis
1
210
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
610
機械学習を「社会実装」するということ 2026年夏版 / Social Implementation of Machine Learning June 2026 Version
moepy_stats
4
1.6k
protovalidate-es を導入してみた
bengo4com
0
170
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
230
Featured
See All Featured
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Code Reviewing Like a Champion
maltzj
528
40k
Bash Introduction
62gerente
615
220k
WENDY [Excerpt]
tessaabrams
11
38k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
470
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
We Are The Robots
honzajavorek
0
240
RailsConf 2023
tenderlove
30
1.5k
Six Lessons from altMBA
skipperchong
29
4.3k
How to make the Groovebox
asonas
2
2.2k
Technical Leadership for Architectural Decision Making
baasie
3
400
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
350
Transcript
作文支援とコーパス 長岡技術科学大学 学部3年 自然言語処理研究室 勝田 哲弘 1 2017/2/9
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 2
コンピュータによる作文支援とは? • 論文を書くとき 論文を書く ↓ 教師 が添削 ⇅ 書き直して再提出 コンピュータ
3
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 4
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ 難しくない 5
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない 6
コンピュータによる作文支援とは? • 例 日本語でメールを作るのは難しいではない。 ↓ ↓ [作成する/書く/送信する] 難しくない ↓ 日本語でメールを書くのは難しくない。
7
データ駆動型学習(Data Driven Learning) • コンピュータを教師として考えるのではなく、 インフォーマントに近いものと位置付ける。 ▫ 学習者が言語データを観察し学習する。 • 学習者が作文過程で表記法、文法、語彙選択な
どを観察するための支援ツール 「なつめ」 「現代日本語書き言葉均衡コーパス(BCCWJ)」を 利用したシステム 8
コーパスの利用 • レジスタ ▫ 目的、状況や書き言葉、話し言葉などのジャンル ごとにみられる語彙、文法の変異をいう。 実験の測定値と理論値を比較すると 話し言葉: ちゃんと値が合っている。 論文の書き言葉:良好な値を示している。
9
コーパスの利用 • 共起表現 ▫ 語と語がある関係の下で同時に出現すること。 [形容詞+名詞] {美味しい/温かい/熱い}ご飯 • 特に、高い確率で出現する共起表現をコロケー ション(collocation)と呼ぶ。
10
問題点 • 学習者にある程度のレベルを要求する。 • 使い分けをするにはジャンルによってコーパス を分類するのが有効であるが、コーパスの構築 には、 大量で正確なアノテーションが必要になる。 11
参考文献 • 「コーパスと日本語教育」 第5章 砂川有里子[編] 朝倉書店 12