Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIを活用した事例の現状と今後の予想

 AIを活用した事例の現状と今後の予想

Do&Do. 株式会社代表取締役、ab3株式会社取締役の菊池佑太と申します。
https://corp.doando.club/
https://corp.ab3.vision/

2023.04.26にAIを活用した事例の現状と今後の予想というタイトルで勉強会を実施しました。モデルが構築され、利用するフェーズとプロセスの仕組みの説明を多めにして、それを理解した上で事例の現状と今後の予想の流れを発表しました。

資料に関する質問などは下記のTwitter DMで伺っております。
https://twitter.com/yutakikuchi_

菊池佑太

April 27, 2023
Tweet

More Decks by 菊池佑太

Other Decks in Technology

Transcript

  1. 今日のスライドの中にはいろんな言葉が出てきます AI マシンラーニング(機械学習) Generative AI アルゴリズム モデル 学習データ 推論(実行)データ ディープラーニング(深層学習)

    Fine-tuning それぞれの、言葉の定義を知りましょう。 AIに関係するシステム全体や アルゴリズムの総称 モデルに対して新しいタスクへの適用 の微調整機構 学習データとアルゴリズムによって構 築生成され、実行フェーズで推論デー タに対して出力結果を出すもの アルゴリズムの一つの手法区分。 学習データから特徴を学び 新たなデータを予測 マシンラーニング(機械学習)の 一つの手法区分であり、多層のニューラルネット ワーク構造を利用して、複雑な予測のタスクの 実行を可能とする手法 アルゴリズムの一つの手法区分。 ディープラーニングの一つの手法区分 で生成タスクを担う 学習データを活用してモデルを 構築・生成するための手順や ロジック モデルに対して入力するデータ。これ をもとにモデルが内部で処理した結果 を出力する アルゴリズムを適用するとモデルが生 成されるための元データ
  2. ※本資料を用いた勉強会は 60分の予定です。 ※資料はWebにも公開してあります。 ※内容は分かりやすさを求めているため、 学術的な正しさは保証していません。 目次 • アルゴリズムの歴史と基本的なAIの仕組み : 20分

    • 今までのAIの事例紹介 : 7分 • 話題になっているGenerative AIとはどんなものか : 10分 • Generative AIの事例紹介 ~動画編~ : 7分 • 今後AIの発展によって我々の仕事はどのように変わるか : 10分
  3. ディープラーニング内に位置するGenerative AI ディープラーニング Generative AI ディープラーニングのアルゴリズム詳細例 • 畳み込みニューラルネットワーク (Convolutional Neural

    Network, CNN) • リカレントニューラルネットワーク (Recurrent Neural Network, RNN) • 長短期記憶ネットワーク (Long Short-Term Memory, LSTM) Generative AIのアルゴリズム詳細例 • 敵対的生成ネットワーク (Generative Adversarial Network, GAN) • 自己符号化器 (Autoencoder, AE) • Transfomer 最近話題になっているGenerative AI・生成系AIはディープラーニングのカ テゴリ内に位置する一つの区分になります。
  4. アルゴリズムで生成された「モデル」の代表的な使用目的 • 分類タスク ◦ 特定の実行データをいくつかのクラスに分類する ▪ 実行例) 与えた画像に写っているのは犬か猫かを分類してください。 • 回帰タスク

    ◦ 特定の実行データに関する連続値を予測する ▪ 実行例) 過去データの傾向から、自分の住んでいる土地が10年後に何円価格変動するかを教えて下さい。 • 生成タスク ◦ 特定の実行データから、テキストや画像など新しいデータを生成する ▪ 実行例) 10年後の新宿駅の様子を予想して、油絵風にスケッチしてください。 ※モデルの使用目的として上以外に、クラスタリング (最初に分類クラスが定義されないので、分類とは異なる )や次元圧縮 などでも利用されます。 ※2021年頃から生成タスクを実行するモデルの精度が飛躍的に向上し、注目されています。 ChatGPTやMidjorneyに代表されるようにテキ スト生成や画像生成されたものが人が作ったのか、 AIが作ったのかが判別も難しいほどになっています。
  5. モデルには学習・実行するフェーズとプロセスがある 学習データ アルゴリズム モデル モデル インタフェース 推論(実行) データ ① 学習フェーズ

    ② 実行フェーズ AIモデル開発者 AIモデル利用者 ※ここでは運用フェーズの話はしません。 ※本資料を読んでいる方の多くは AIモデル利用者にあたると思います。 ※ご自身がAIを話す上で、学習するフェーズの話なのか、実行するフェーズの話なのかを意識するようにしましょう。 運用フェーズへ モデルの更新など モデルを構築 入力 入力データのインプットと結 果の取得 構築されたモデルを 実行できる環境に置く
  6. モデルの学習フェーズを強引に料理の物と過程に例えると 学習データ (具材) アルゴリズム (レシピ) モデル (料理) ① 学習フェーズ AIモデル開発者

    (シェフ) モデルの Fine-tuning (後味付け) ※現在、AI利用者もAIモデル開発者が実施していたプロセスの全部もしくは一部 が実行可能なようにツールや環境の整備が進む。 (後でも触れる)
  7. ChatGPTで学習・実行フェーズとプロセスを考える 学習データ (ネット上のデー タ) アルゴリズム (Transformer) モデル (GPT) モデル (GPT)

    インタフェース (ChatGPT) 推論(実行) データ (依頼文) ① 学習フェーズ ② 実行フェーズ OpenAIモデル開発者 AIモデル利用者 運用フェーズへ モデルの更新など モデルを構築 入力 入力データのインプットと結 果の取得 構築されたモデルを 実行できる環境に置く
  8. モデルの出力結果に過ちが生じるポイント 学習データ アルゴリズム モデル ① 学習フェーズ AIモデル開発者 運用フェーズへ モデルの更新など モデルを構築

    学習データ ・学習データに間違ったものが含まれている ・学習データのカバー範囲が狭い(偏り、広さ) ・同じ正解を示す学習データ量の深度が低い(深さ) アルゴリズム・モデル ・アルゴリズムの単純なバグ ・ハズレの値を過剰に学習してしまう ・最適な内部パラメータを間違ってしまう これらの誤りを運用フェーズの中で、データの部分と アルゴリズムの部分を繰り返し修正し、新しいモデルを作っていく
  9. 複雑になっていく著作権問題 学習データ (ネット上のデー タ) アルゴリズム (Transformer) モデル (GPT) モデル (GPT)

    インタフェース (ChatGPT) 推論(実行) データ (依頼文) ① 学習フェーズ ② 実行フェーズ 運用フェーズへ モデルの更新など モデルを構築 入力 入力データのインプットと結 果の取得 構築されたモデルを 実行できる環境に置く ※ 国によって著作権の法律が全く異なるので、注意が必要です。また現状は不明確な点が多いです。 ※ 日本の著作権法の第 30条の記載内容など、既に課題となっているケースがあります。 参考 : https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_01.pdf ※ 各論点とケースに応じて、法律の専門家の意見を聞く必要があります。 論点① ネット上の学習データに著作権が 含まれていた場合はどうなるのか? 論点④ モデルの出力結果が既に著作権がある 内容と類似していた場合はどうなるのか? 論点② 特定企業が持つデータだけで学習したモデルの著 作権はどうなるのか? 論点③ 推論(実行)データに著作権が含まれて いる場合、そのデータも学習に使われ るのか?
  10. y = f(x) x: 実行データを与える y: 出力データを出す f: 関数 これがモデル

    モデルを簡略的に説明すると ※f(x)の式は中学校で習った axのような一次関数より、 かなり複雑なものになります。
  11. y = f(x) x: 実行データを与える y: 出力データを出す f: 関数 これが分類モデル

    分類モデルを他の例で説明すると 例) 下記の画像を入力 出力例) 与えたられた画像は猫です
  12. y = f(x) x: 実行データを与える y: 出力データを出す f: 関数 これが生成モデル

    生成モデルを簡略的に説明すると 例) ロボットのスケッチ画像を生成し てください。
  13. 今日のスライドの中にはいろんな言葉が出てきました AI マシンラーニング(機械学習) Generative AI アルゴリズム モデル 学習データ 推論(実行)データ ディープラーニング(深層学習)

    Fine-tuning それぞれの、言葉の定義を知りましょう。 AIに関係するシステム全体や アルゴリズムの総称 モデルに対して新しいタスクへの適用 の微調整機構 学習データとアルゴリズムによって構 築生成され、実行フェーズで推論デー タに対して出力結果を出すもの アルゴリズムの一つの手法区分。 学習データから特徴を学び 新たなデータを予測 マシンラーニング(機械学習)の 一つの手法区分であり、多層のニューラルネット ワーク構造を利用して、複雑な予測のタスクの 実行を可能とする手法 アルゴリズムの一つの手法区分。 ディープラーニングの一つの手法区分 で生成タスクを担う 学習データを活用してモデルを構築・ 生成するための手順や ロジック モデルに対して入力するデータ。これ をもとにモデルが内部で処理した結果 を出力する アルゴリズムを適用するとモデルが生 成されるための元データ
  14. 出力結果の適用内容により、過ちのリスクと複雑性が異なる 過ちによるリスクが低い 過ちによるリスクが高い • 一ヶ月後の天気を推定し、旅先での旅行プランを考える • ECサイト訪問者の趣味嗜好を推定し、最適な商品を推薦する • 迷惑メールを推定し、迷惑メールフォルダに対象メールを入れる •

    カーナビ上で渋滞を予測し、渋滞にならない新ルートを提案する • 1家庭に対する過去の使用電力から、 1年間の使用電力量を予測する • 製造物の異常品をAIだけで自動的に分類する • レントゲン写真から病気と箇所を AIだけで自動的に検知する • 信号や対象物を検知し、車を全て自動運転で制御する • 膨大な金額を対象とした自動取引による投資を行う • 人の顔などを利用した、セキュリティ認証システムを構築する モデルの同じ出力結果でも「何に適用するか」で過ちによるリスクが異なります。ここで言うリスクが高いという状態は、 リスクを受ける対象範囲・金額・人の命や心理的ダメージの大きさなどの組み合わせによって決まるものを示します。 リスクが低いタスクは既に多くの成功事例があり、サービスへの自動的な組み込みも進んでいます。一方、過ちのリス クが高い複雑なタスクについては、日々技術のアップデートが成されているものの、まだ研究段階のものも多く、人に よる最終確認などのプロセスが必須になります。
  15. 2023年現在の画像生成 prompt > an astronaut riding a horse on mars

    artstation, hd, dramatic lighting, detailed ・高解像度での出力 ・複数要素の組み合わせを正しく表現 ・影の付き方など、自然な表現 引用 : https://replicate.com/stability-ai/stable-diffusion/examples
  16. AIを活用するか、しないかの差 世間の議論 個人間の差 法人や組織間の差 国の差 vs 人 AI 活用する人 活用しない人

    AIを活用することで大幅な生産性向上が 期待できることを前提とした話 活用できる人数に従って 個人・組織・国などの 単位で生産能力の差が拡大 活用する法人・組織 活用しない 法人・組織 積極活用 できる国 積極活用 できない国
  17. それぞれの立場での出力結果の正しさを評価 AIを活用した個人 AI AI + 手作業での成果 指示 出力 反映 報告説明

    評価 AIを活用した個人 を評価する上司 AIの出力、またそれを利用した個人の成果出力が 正しいかどうかの判断ができること。 仕事の評価が成果至上主義に基づくのだとすると、 重要なのはAIが作ったかどうかではなく、 AIが出力した結果を個人が正誤を判断し、利活用出来るかどうか。 AIの活用で時間コストを縮小し、個人の成果とする。 引用 : https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text OpenAIが提供しているAIが書いたテキストの判定器。 AIで作られたかどうかの判定が本当に必要なのか?
  18. プロセス自動化、インタフェースの自動生成 学習データ アルゴリズム モデル モデル インタフェース 推論(実行) データ ① 学習フェーズ

    ② 実行フェーズ 運用フェーズへ モデルの更新など モデルを構築 入力 入力データのインプットと結 果の取得 構築されたモデルを 実行できる環境に置く 様々なモデル構築、管理ツールの登場により、アルゴリズムの仕様に合わせた学習データ が準備できれば、モデル生成からモデルの利用環境構築まで、テンプレートに沿って、多く のタスクを自動的に実行が可能。 (AutoML) インタフェースは Generative AIでアプリごと生成し、モデルとの接続のロジックも準備 個人・自社しか保有しない 知識の学習データを準備できる かがポイント AutoML化
  19. モデルの学習フェーズを強引に料理の物と過程に例えると 学習データ (具材) アルゴリズム (レシピ) モデル (料理) ① 学習フェーズ AIモデル開発者

    (シェフ) モデルのFine チューニング (後味付け) OpenAIやGoogleが用意したpre-trainedモデルに対して Fineチューニングの味付けだけを自社でやる
  20. 巨人が作ったpre-trainedモデルをFine-tuning 学習データ アルゴリズム モデル (pre-trained) 自社用モデル インタフェース 推論(実行) データ ①

    学習フェーズ ② 実行フェーズ AIモデル開発者 AIモデル利用者 運用フェーズへ モデルの更新など モデルを構築 入力 入力データのインプットと結 果の取得 Fine- tuning Fineチューニングの機能を利用して巨人が作ったモデルに対して自分たちの味を付けたカスタマイズを行 い、個人および自社用モデルとして利用 入力する学習データ フォーマットは基本共通
  21. GPTモデルの学習データFine-tuningのデータ例 GPTモデル (pre-trained) Fine- tuning 自社用モデル GPTモデルはChatGPTの後ろにある言語モデル。質問や命令を投げかけると、答えを返して くれる。質問や命令、それに対する答えのセットが学習、 Fine-tuningのデータとなるため、そ のセットを用意してあげるだけ。

    引用 : https://platform.openai.com/docs/guides/fine-tuning 上のデータフォーマットは JSONLの指定となるが、 おおよそのイメージとしては xlsxのQA対応表のようなもの。 ※Fine-tuningができるpre-trainedモデルは限定されます。
  22. OpenAIのAPI経由でのデータポリシー 引用 : https://openai.com/policies/api-data-usage-policies By default, OpenAI will not use

    data submitted by customers via our API to train OpenAI models or improve OpenAI’s service offering. Data submitted by the user for fine-tuning will only be used to fine-tune the customer's model. However, OpenAI will allow users to opt-in to share their data to improve model performance. Sharing your data will ensure that future iterations of the model improve for your use cases. Data submitted to the API prior to March 1, 2023 (the effective date of this change) may have been used for improvements if the customer had not previously opted out of sharing data. 2023年3月1日以降のAPIを経由して入力したデータは学 習に使われることは無い。またFine-tuningのデータも同 様。ただし、opt-inすることでOpenAIに利用を許可するこ とができる。 2023年3月1より前のデータについてはopt-outをしていな い場合、改善のためのデータとして利用された可能性が ある。 ※ただし、WebのChatGPTインタフェースを利用したデータについては学習に利用される可能性があ る。データポリシーについては各社提供の内容を理解してから利用する必要がある。
  23. 次に何をやったら良いのか GPTモデル (pre-trained) Fine- tuning 自社専用モデル モデルに解かせたい目的を定めつつ、自社にしか無いデータを活用して Fine-tuningを行い、 自社専用のモデルを作る。必要とするデータセットは質問に対する期待回答の QA表を用意

    し、ChatGPTを活用してJSONL形式に変換。もしくは ChatGPTに変換用のプログラムを生成 してもらう。 引用 : https://platform.openai.com/docs/guides/fine-tuning 社内メンバー 専用モデルを 利用
  24. Doの「トレ活」とは トレーニング参加 参加後 ・健康データの記録 ・アンケートへ回答 ・次回イベント予約 健康DXの推進として、弊社は「 Do」という法人向け・個人向けのサービスを展開しております。「 Do」を通して、フィットネス参加者の方々には「 トレ活」を

    体験いただきます。「トレ活」とは、トレーニングをしながら自身が健康になり、社会貢献につながる活動をすることです。個人の健康管理への意識が低 いという課題に対して、 「可能な限り安価に参加」 、更には「募金活動などの社会貢献」 を動機づけとして実施中です。 法人企業の場合には社内サーク ルと連動させるなどの利用方法も考えられます。 交通費程度の謝礼および 参加特典をお渡し ※金額上限あり ※謝礼は雑所得扱い 謝礼の一部を寄付して、 社会貢献 ※第一弾として赤い羽根共同 募金への寄附を実施中
  25. Do 法人様向けの健康改善プラン ① 社員の食事改善 ② 社員の日常の運動改善 ③ 社内サークルイベントで の運動実施 記録された健康データから日々の食事・運動、定期的な運動の見直しを行い、それぞれの改善を実施していきます。法人会員様のオフィスに

    Doのヘル シー弁当を設置し、食事の改善を行います。また出勤中に運動を伴った移動をすると交通費の代わりに謝礼が貰えるプログラムや、定期的な社内運動 サークルなどで汗を流し、体調管理だけでなくメンタルコントロールもデータを基に行っていきます。