Amazon Comprehendで始める感情分析
by
Shirota
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
Amazon Comprehend から始める感情分析 AKIBA.AWS ONLINE #09 -AWSを活用した機械学習 編- 2022/08/04(Thu.) Shirota
Slide 2
Slide 2 text
データアナリティクス事業本部機械学習チーム所属 2022年1月入社(3年半ぶり2回目) 高エネルギー宇宙物理学専攻→インフラエンジニア →バーチャルソリューションアーキテクト(AWS) →バーチャルMLエンジニア 最近はGoogle Cloudにお熱 住まいはバーチャル愛知県のバーチャル名古屋市 → Shirota 今日の話し手
Slide 3
Slide 3 text
Amazon Comprehendとは? 今日話すこと 1 2 3 4 そもそも感情分析とは ネガポジ分析のやり方 それぞれの手法の長所・短所
Slide 4
Slide 4 text
Amazon Comprehend とは?
Slide 5
Slide 5 text
Amazon Comprehend とは? 機械学習を使用して、 テキストからインサイトや関係性を発見するための 自然言語処理 (NLP) サービス 引用:https://aws.amazon.com/jp/comprehend/
Slide 6
Slide 6 text
😀?
Slide 7
Slide 7 text
つまりどういうこと?
Slide 8
Slide 8 text
Amazon Comprehend とは? テキスト Amazon Comprehend 色々 できる 機械学習
Slide 9
Slide 9 text
もう少し深掘りしよう
Slide 10
Slide 10 text
Amazon Comprehendで できる色々 カスタム分類 エンティティ認識 カスタムエンティティ 認識 感情分析 エンティティ特化の 感情分析 PII 識別とリダクション キーフレーズ抽出 イベント検出 言語検出 構文解析 トピックモデリング
Slide 11
Slide 11 text
Amazon Comprehendで できる色々 カスタム分類 エンティティ認識 カスタムエンティティ 認識 感情分析 エンティティ特化の 感情分析 手持ちの文章を利用し てカスタムしたラベリ ングでテキストを分類 できる
Slide 12
Slide 12 text
Amazon Comprehendで できる色々 カスタム分類 エンティティ認識 カスタムエンティティ 認識 感情分析 エンティティ特化の 感情分析 文章中のエンティティ (各単語)を識別する 特殊な状況を学習させ たカスタムモデルを作 成・利用した識別もで きる
Slide 13
Slide 13 text
Amazon Comprehendで できる色々 PII 識別とリダクション キーフレーズ抽出 イベント検出 言語検出 構文解析 トピックモデリング PII(個人情報)を識別 してマスクをかけるこ とができる
Slide 14
Slide 14 text
Amazon Comprehendで できる色々 PII 識別とリダクション キーフレーズ抽出 イベント検出 言語検出 構文解析 トピックモデリング 文章内で重要なフレーズ を抽出する 「誰が」「いつ」「どこ で」といった情報を 抽出する
Slide 15
Slide 15 text
Amazon Comprehendで できる色々 PII 識別とリダクション キーフレーズ抽出 イベント検出 言語検出 構文解析 トピックモデリング 何語で書かれた文章かを 分析する 文章を単語サイズに分解 して品詞の識別をする (いわゆる形態素解析)
Slide 16
Slide 16 text
Amazon Comprehendで できる色々 PII 識別とリダクション キーフレーズ抽出 イベント検出 言語検出 構文解析 トピックモデリング 文章内の単語からトピッ クを分類し、S3に配置し ているドキュメントファ イルがどのトピックに関 連したものかを分析する
Slide 17
Slide 17 text
Amazon Comprehendで できる感情分析関連 カスタム分類 エンティティ認識 カスタムエンティティ 認識 感情分析 エンティティ特化の 感情分析 ← New!! (2022.03) PII 識別とリダクション キーフレーズ抽出 イベント検出 言語検出 構文解析 トピックモデリング
Slide 18
Slide 18 text
そもそも感情分析って なんだろう
Slide 19
Slide 19 text
感情分析 とは? 自然言語処理を用いて 自然言語(人間が使っている言葉)を コンピュータで処理できるようにし、 そこから感情を分析すること
Slide 20
Slide 20 text
感情分析 とは? 今日は雨が降っていて いまいち元気が出ない
Slide 21
Slide 21 text
感情分析 とは?
Slide 22
Slide 22 text
感情分析 とは? 今日は雨が降っていて いまいち元気が出ない
Slide 23
Slide 23 text
これは ネガポジ分析
Slide 24
Slide 24 text
ネガポジ分析やってみたい!
Slide 25
Slide 25 text
それ、機械学習無くても できるんですよ
Slide 26
Slide 26 text
No content
Slide 27
Slide 27 text
ネガポジ分析の手法 極性辞書を使う ディープラーニングを用いる
Slide 28
Slide 28 text
ネガポジ分析の手法 極性辞書を使う(機械学習不要) ディープラーニングを用いる
Slide 29
Slide 29 text
極性辞書とは 単語に極性情報を付与している辞書 ネガティブ・ポジティブを -1(ネガティブ)〜 +1(ポジティブ)に 振り分けた数値を極性値と呼ぶ
Slide 30
Slide 30 text
極性辞書を使う メリット・デメリット 既に用意されたものを使えるので学習コストが低く、 それなりの結果が得られる Pythonで使えるライブラリ「oseti」があったり 柔軟性が低い 辞書のカスタムが大変 カスタムのためには学習コストも生じる
Slide 31
Slide 31 text
ネガポジ分析の手法 極性辞書を使う(機械学習不要) ディープラーニングを用いる
Slide 32
Slide 32 text
ディープラーニングを用いて ネガポジ分析をする 文章と極性情報のラベルが揃った 教師データを用意してディープラーニングを行い 作成したモデルでネガポジ分析を行う
Slide 33
Slide 33 text
ディープラーニングを使う メリット・デメリット 柔軟性が高い モデル学習を進めることによって利用する環境に 合ったモデルが育っていく モデルを育てるまでが大変 モデルに利用するための教師データの用意 ディープラーニングそのものの学習コスト
Slide 34
Slide 34 text
本音 極性辞書を使う ディープラーニングを用いる 準備が少なくて、柔軟性もありそうな ディープラーニングを用いたやつが使いたい……
Slide 35
Slide 35 text
そこでComprehendですよ
Slide 36
Slide 36 text
「手っ取り早くやってみた」は ブログで!
Slide 37
Slide 37 text
Amazon Comprehendは 初めてのネガポジ分析挑戦に おすすめ!
Slide 38
Slide 38 text
ご清聴ありがとう ございました!