生成AI講座

自己紹介 uたそ (ゆうたそ | ゆーたそ) 執行役員 CCO @ Ms.Engineer 自律ロボット,
機械学習, HMI LowCode開発基盤 FW, In-mem KVS, SearchEngine, RemoteConfig

話すこと • 人工知能の概要と位置付け • 統計的手法から現在の生成AIブームまでの流れ • ニューラルネットワークの基礎的な知識 • LLMとニューラルネットワークの関係性 •
機械学習モデルの課題感

話さないこと • 物理レイヤー(非ノイマン型コンピュータ)の話 • 簡単じゃない数学の話 • 機械学習モデルの作り方 • 自然言語以外のモデルの話

知能とは何か？

知的な機械に聞いてみた ChatGPT: 「知能」とは、情報を理解し、問題を解決し、学習する能力を指します。これには、論理的思考、理解、自己認識、学習、感情的知識、推論、計画、創造性、問題解決などが含まれます。知能は人間だけでなく、動物やコンピュータプログラム（人工知能）にも見られる特性です。 Bard: 知能とは、環境に適応し、問題解決をめざして思考を行うなどの知的機能の総称です。知能の定義は、心理学、認知科学、哲学など、さまざまな分野で長年にわ
たって議論されてきました。現在のところ、統一的な定義は存在せず、さまざまな側面から知能を捉える考え方が存在します。

チューリングテスト • チューリングテストとは、特定のタスクに対して機械のふるまいが人間と同等であるか、またはそれと区別がつかない程度かを確かめるためのテストです。 ※人間が知的ふるまいをしているという前提に立っています。 -> 現在の機械学習モデルの性能評価も、タスクに対するパフォーマンスで計測されることが多いです。

機械学習手法の歴史

統計的推論 ①回帰 • 気温とアイスの売上個数のデータがあります。 • このデータから未知の気温の売上を予測できますか？売上気温

統計的推論 ①回帰 • データの傾向を知るために、とりあえず直線を引いてみます。 • 関数が得られたのでこれによって推論ができるように！！売上気温 𝑦
= 𝑎𝑥 + 𝑏

統計的推論 ②分類 (識別) • 「みかん」と「はっさく」の直径・質量に関するデータがあります。 • 直径と質量が与えられた未知のデータはどちらか予測できますか？質
量直径みかんはっさく？

統計的推論 ②分類 (識別) • 未知の値の近傍を探索すると割と筋の良い推論になりそう => KNN法 y x ？
未知の値の属性を推定するために近傍の奇数個の属性を参照するみかんはっさく

統計的推論 ②分類 (識別) • 綺麗な境界線を引ければ簡単に分類できそう単純な直線 => 線形分類器 ↑以外 =>
非線形分類器 y x ？みかんはっさく

統計的推論のまとめ • 既存のデータ群から目的に応じた “関数” を作成するアプローチが主流。 • 比較的小さなモデルなので、コンピューティングリソースの消費が少ない(計算量などは考慮したい) •
スモールデータとの相性は非常によいので、現場でよく使われる。

ニューラルネットワーク

これは何の写真ですか？ https://www.irasutoya.com/2014/02/blog-post_10.html

人間はスゴイ！！ • 今までの経験から、初めて見聞きする対象でもある程度の識別ができる。 • はじめて歩く地面でも転ばない。 => 人間を模した知的なモデルを作ろう！ => ニューラルネットワーク

ニューロンとは • 脳の神経細胞 • 別の神経細胞から刺激を受け取り、しきい値を超えると「発火」して別の神経細胞に出力します。 https://ja.wikipedia.org/wiki/シグモイド関数

ニューロンのモデル化 • 各ニューロンからの入力値に重要度を掛け合わせます。(重み付け) • 重み付けされた入力を加算します。 • バイアスの加算(bの部分) • これらの加算された値を先ほどのシ
グモイド関数のような活性化関数に入力として与えます。 𝜒1 𝜒2 𝑦1 𝑤1 𝑤2 𝑦1 = 𝑤1 𝑥1 + 𝑤2 𝑥2 + 𝑏 活性化関数によって非線形の性質を獲得し複雑な関数を表現できるようになりました！！

ニューロンをもっと深く • 先ほどのニューロンをさらに深い階層構造にすることでより複雑な関数表現が可能になりました。 => DeepNeuralNetwork 入力層
出力層隠れ層(中間層) 省略してますが、隣り合った層の全ノードと結合します。(全結合層)

NNは関数入力層出力層隠れ層(中間層) 猫: 0.82 犬: 0.07 ワニ: 0.003

ニューラルネットワークまとめ • NNはヒトの脳の神経回路を模した機械学習モデル。 • NNも統計的推論と同様に関数としてふるまう。 • 重み・バイアス・活性化関数によって複雑な関数表現を獲得。 • 学習方法や固定的なニューロン構成など、実際にヒトの学習過程とは異なるプロセスだという指摘もある。
• また、処理負荷が高いことも課題。(ヒトの脳は約20W)

大規模言語モデル

ヒトが文章を理解する工程(想像) 「私は夕飯にステーキを食べたかったです。」自分のこと話すんだな自分の夕飯にステーキのことを
話すんだな自分の夕飯につての話か自分の夕飯にステーキを食べたかったのか、つづきはあるのかな？あ、終わった。夕飯にステーキが食べたかった話をしたんだな。

自然言語理解のモデル化入力 1 入力 2 入力 t 出力 1 出力
2 出力 t 𝑥1 𝑥2 𝑥t 𝑦1 𝑦2 𝑦t ℎt ℎ2 ℎ1 ℎ0 意味などの状態を保持するベクトル

(例) 文書分類入力 1 入力 2 入力 t 出力 t
𝑥1 𝑥2 𝑥t 𝑦t ℎt ℎ2 ℎ1 ℎ0 今日の天気はです。天気予報の記事全ての入力を受け取ってから、文書の分類結果を利用する

(例)機械翻訳入力 1 入力 2 入力 t 𝑥1 𝑥2 𝑥t
ℎt ℎ2 ℎ1 ℎ0 ℎ1 ℎ2 出力 1 出力 2 出力 n 私は夕飯にです。 I 𝑦1 𝑦2 wanted dinner. 𝑦n 全ての入力から得た意味空間ベクトルを出力側に渡す。【重要】このような入力と出力に分離しているアーキテクチャをエンコーダ・デコーダーモデルと呼びます。

Transformer アーキテクチャ • BERT や GPT などのベースになったアーキテクチャを Transformer と言
います。 • 元々は機械翻訳モデルとして利用が想定されていたそうです。 ※Attention Is All You Need.

GPT-n GPT(Generative Pre-trained Transformer) みなさんご存じ「ChatGPT」など対話システムや文章の生成器として活用されています。 Pre-tarained & Fine-tunung という新しいパラダイムを作った。
特徴①: 1つのモデルで多様なタスクに対応できるようになった。特徴②: 専門モデルを作成するための必要学習データ量が減った。

GPT-n の学習方法次単語予測メリット - 自然な文章の流れをモデルが学習できる。 - 単語の意味表現をモデルが獲得できる。 - ラベル付きの学習データが不要。
私はカレーを？？？

BERT(バート | ベルト) BERT (Bidirectional Encoder Representations from Transformers) BERT
は様々な自然言語系のタスクで高精度のパフォーマンスを発揮したモデルです。 Google のセマンティック検索でも利用されていたり、かなり普及しています。特徴①: 単語の意味表現を獲得。 => テキストマイニング。固有表現抽出特徴②: 文脈の理解。 => 文書分類。

BERTの学習方法 ①マスク&推論 ②次文章予測私はカレーを食べたい。 [MASK] 私はカレーを食べたい。
私はカレーを食べたい。 [MASK] 私はカレーを食べたい。スーパーでカレー粉を購入した。私はカレーを食べたい。私は昨年イギリスに留学した。

基盤モデル • 事前学習とファインチューニング • 言語の基礎を理解した汎用的なモデルを構築 • 専門的なデータを追加で学習させて専門的なモデルを構築 • メリット •
マシンリソースの節約 • スモールデータの活用 • OSSの基盤モデルがあるので使ってみてください。(rinnaなど)

AGIに向けて(個人的な意見) • 前提として、基盤モデルはドンドン賢くなる。 • チューニングは以前より軽量とはいえ、依然高コスト。 => チューニングよりもプロンプトエンジニアリング ※個人的意見です。 ※GPTs も同じマインドな気がします。
※後半でやる LangChain もそのためのツールです。

生成モデルの課題感 • ライセンス • 学習データ、ソースコード、モデル、生成物の著作権・ライセンス • バイアス • 学習データの偏り、学習データ品質の劣化。 •
非倫理的利用 • フェイクニュース • ウィルスソフトや兵器利用など • 技術的課題 • エネルギー消費、説明可能性。

質疑応答

生成AI講座

生成AI講座

uTaso

More Decks by uTaso

Featured

Transcript

自己紹介 uたそ (ゆうたそ | ゆーたそ) 執行役員 CCO @ Ms.Engineer 自律ロボット,

話すこと • 人工知能の概要と位置付け • 統計的手法から現在の生成AIブームまでの流れ • ニューラルネットワークの基礎的な知識 • LLMとニューラルネットワークの関係性 •

話さないこと • 物理レイヤー(非ノイマン型コンピュータ)の話 • 簡単じゃない数学の話 • 機械学習モデルの作り方 • 自然言語以外のモデルの話

知能とは何か？

機械学習手法の歴史

統計的推論 ①回帰 • 気温とアイスの売上個数のデータがあります。 • このデータから未知の気温の売上を予測できますか？売上気温

統計的推論 ①回帰 • データの傾向を知るために、とりあえず直線を引いてみます。 • 関数が得られたのでこれによって推論ができるように！！売上気温 𝑦

統計的推論 ②分類 (識別) • 「みかん」と「はっさく」の直径・質量に関するデータがあります。 • 直径と質量が与えられた未知のデータはどちらか予測できますか？質

統計的推論 ②分類 (識別) • 未知の値の近傍を探索すると割と筋の良い推論になりそう => KNN法 y x ？

統計的推論 ②分類 (識別) • 綺麗な境界線を引ければ簡単に分類できそう単純な直線 => 線形分類器 ↑以外 =>

統計的推論のまとめ • 既存のデータ群から目的に応じた “関数” を作成するアプローチが主流。 • 比較的小さなモデルなので、コンピューティングリソースの消費が少ない(計算量などは考慮したい) •

ニューラルネットワーク

これは何の写真ですか？ https://www.irasutoya.com/2014/02/blog-post_10.html

人間はスゴイ！！ • 今までの経験から、初めて見聞きする対象でもある程度の識別ができる。 • はじめて歩く地面でも転ばない。 => 人間を模した知的なモデルを作ろう！ => ニューラルネットワーク

ニューロンとは • 脳の神経細胞 • 別の神経細胞から刺激を受け取り、しきい値を超えると「発火」して別の神経細胞に出力します。 https://ja.wikipedia.org/wiki/シグモイド関数

ニューロンのモデル化 • 各ニューロンからの入力値に重要度を掛け合わせます。(重み付け) • 重み付けされた入力を加算します。 • バイアスの加算(bの部分) • これらの加算された値を先ほどのシ

ニューロンをもっと深く • 先ほどのニューロンをさらに深い階層構造にすることでより複雑な関数表現が可能になりました。 => DeepNeuralNetwork 入力層

NNは関数入力層出力層隠れ層(中間層) 猫: 0.82 犬: 0.07 ワニ: 0.003

大規模言語モデル

ヒトが文章を理解する工程(想像) 「私は夕飯にステーキを食べたかったです。」自分のこと話すんだな自分の夕飯にステーキのことを

自然言語理解のモデル化入力 1 入力 2 入力 t 出力 1 出力

(例) 文書分類入力 1 入力 2 入力 t 出力 t

(例)機械翻訳入力 1 入力 2 入力 t 𝑥1 𝑥2 𝑥t

Transformer アーキテクチャ • BERT や GPT などのベースになったアーキテクチャを Transformer と言

GPT-n GPT(Generative Pre-trained Transformer) みなさんご存じ「ChatGPT」など対話システムや文章の生成器として活用されています。 Pre-tarained & Fine-tunung という新しいパラダイムを作った。

GPT-n の学習方法次単語予測メリット - 自然な文章の流れをモデルが学習できる。 - 単語の意味表現をモデルが獲得できる。 - ラベル付きの学習データが不要。

BERT(バート | ベルト) BERT (Bidirectional Encoder Representations from Transformers) BERT

BERTの学習方法 ①マスク&推論 ②次文章予測私はカレーを食べたい。 [MASK] 私はカレーを食べたい。

基盤モデル • 事前学習とファインチューニング • 言語の基礎を理解した汎用的なモデルを構築 • 専門的なデータを追加で学習させて専門的なモデルを構築 • メリット •

生成モデルの課題感 • ライセンス • 学習データ、ソースコード、モデル、生成物の著作権・ライセンス • バイアス • 学習データの偏り、学習データ品質の劣化。 •

質疑応答