Upgrade to Pro — share decks privately, control downloads, hide ads and more …

大規模言語モデル入門_第一章

Masayuki Komai
December 18, 2023
430

 大規模言語モデル入門_第一章

- 発表者のTwitterアカウント: https://twitter.com/rindybell
- OpenDataLab: https://opendatalab.connpass.com/
- シンプルフォーム株式会社: https://www.simpleform.co.jp/

Masayuki Komai

December 18, 2023
Tweet

Transcript

  1. はじめまして … 自己紹介をさせてください • 駒井雅之 • 32歳(1991年 4月24日誕) • 2016年4月

    NTTデータに入社 • 2021年7月 シンプルフォーム社に入社 • 趣味は筋トレ、脱出ゲーム、 カレー作り、ボードゲーム等 アジャンタ石窟(インド)にて
  2. 前書き • 大規模言語モデルが注目を集めている • 大規模言語モデルの「技術面」に興味を持つ方向けの入門書 ◦ word2vec~ChatGPTに至るまで、系統立てて説明 ◦ 本書の後半ではtransformers(ライブラリ)を用いて、自 然言語処理モデルを開発する方法を学ぶ

    • 想定読者はエンジニア、学生、研究者 ◦ (残念ながら)機械学習もしくはプログラミングの1冊目 の本としては推奨できない • https://github.com/ghmagazine/llm-book にてソースを公開
  3. 1.1 transformersを使って自然言語処理を解いてみよう キーワード 自然言語処理とtransformers • 自然言語処理 ◦ 人間が使用する言語をコンピュータで扱う学問 ◦ 近年、NNベースの大規模言語モデルが標準的に

    • 大規模言語モデルを扱うライブラリの一つがtransformers ◦ 注意:transformersというライブラリ名 ◦ アルゴリズムとしてのtransformerは後半で登場 注意事項 ライブラリ名はtransformers、モデル名はTransformerと記す
  4. 1.1 transformersを使って自然言語処理を解いてみよう 問題設定 本書にて記される 自然言語処理の問題設定 • 文書分類 • 自然言語推論 •

    意味的類似度計算 • 固有表現認識 • 要約生成 本書はGoogle Colaboratory (Colab)上で動作するコードも提供
  5. 1.1 transformersを使って自然言語処理を解いてみよう その他 自然言語処理の 主要な問題設定としては以下がある • 本書で扱う自然言語処理の問題設定 ◦ 質問応答 …

    質問に対してコンピュータが回答 • 本書では扱わない自然言語処理の問題設定 ◦ 機械翻訳 … 原言語のテキストを目的言語に翻訳 ◦ 対話システム … コンピュータと人間とで対話 ◦ 形態素解析 … 形態素(意味を持つ最小単位)に文を分割 ◦ 構文解析 … 文の構造を解析、係り受け解析など。 ◦ 共参照解析 … 名詞句が同一のものを指しているか判断
  6. • 語彙V={w1,w2, …, wn}が与えられ、|V|×Dの行列X, Uを用意 する。中央単語wtが与えられ、周辺単語wcの確率は: 1.3 単語埋め込みとニューラルネットワークの基礎 word2vecの 概説

    埋込ベクトルを用いて周辺単語を予測 予測確率を最大化 • 上記の計算式の元、次の目的関数を最大化する。pは窓幅。 ベクトル次元D、窓幅な どはハイパーパラメータ と呼ぶ 計算コストの削減のた め、負例サンプリングを することがある
  7. 1.4 大規模言語モデルとは 大規模言語 モデル 事前学習した大規模な ニューラルネット言語モデル • word2vec以降、文脈を考慮した単語埋め込みが登場したり、 機械翻訳の分野でTransformerという優れたモデルが登場 •

    事前学習した大規模なニューラルネットワークを「大規模言 語モデル」や「事前学習済み言語モデル(PLM)」と呼ぶ • PLM+ファインチューニング、 PLM+プロンプトによる解法が増えつつある