Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成系AIで自データを扱うには
Search
OHNO
November 11, 2023
230
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
生成系AIで自データを扱うには
OHNO
November 11, 2023
More Decks by OHNO
See All by OHNO
自社データを生成AIに活用
planeta
0
100
外観検査の難しさ
planeta
0
540
儲かるPython
planeta
0
250
画像処理ライブラリOpenCVの使い方0910
planeta
0
1.5k
Pythonによる工業用カメラ画像取得事例
planeta
0
1.5k
画像処理ライブラリOpenCVの使い方
planeta
0
1.1k
SONYのNNC
planeta
0
630
機械学習による動作認識
planeta
0
780
画像類似度計算
planeta
0
2.1k
Featured
See All Featured
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
65
55k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
150
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
600
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Building an army of robots
kneath
306
46k
Context Engineering - Making Every Token Count
addyosmani
9
940
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.4k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
The Art of Programming - Codeland 2020
erikaheidi
57
14k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
4k
Transcript
生成系AIで自前データを扱うには (自前のPCで動かしてみた) 大野 宏 Python機械学習勉強会 in 新潟 #18
生成AIを自社のベテラン社員並みに マイナーな事に答えられない全能人工知能より、自社のベテラン社員並み に何でも答えてくれる生成AIが欲しい ⇒ つまらないことを聞いても怒られな い、何回同じことを聞いても答えてくれる ・参照用テキストを質問につける:業務マニュアルのデータベースを構築し、 質問内容に関する部分を取り出しChatGPTへ渡す(LangChain、LlamaIndex (内部でLangChainを利用))、データは学習に利用されない ・AzureやAWSでもサービスを提供
・ファインチューニング:独自データで一部を再学習 ・自社のPCに生成AIを構築し、べテラン社員にしたい
ローカルPCに生成AIを作る ・Huggingface Transformers:自然言語処理用の深層学習フレームワーク テキスト分類、質問応答、要約、テキスト生成などが可能 ・質問応答 「コンテキスト」(ひとまとまりの文章)と「質問」から、コンテキスト内に含ま れる「応答」を出力するタスク ・コンテキスト「日曜日に友達と古町に遊びに行きました。」 質問「どこに遊びに行った?」 応答「古町」
手順 ・事前学習モデルとして「東北大学 乾研究室の日本語BERTモデル」を使用 ・質問応答のデータセットでファインチューニング 「運転ドメインQAデータセット」の「文章読解QAデータセット」を利用 (京都大学 言語メディア研究室が公開)
結果 「コンテキスト」 元寇は、日本の鎌倉時代中期に、モンゴル帝国および南宋と高麗によって2度 にわたり行われた対日本侵攻である。蒙古襲来等とも呼ばれる。1度目を文永 の役、2度目を弘安の役という。 「質問」 元寇で、日本はどの国から攻めまれましたか。 「応答」 モンゴル帝国および南宋と高麗
大規模言語モデル ・GPT-2(2019年):パラメータ数15億 ・GPT-3(2020年):パラメータ数1750億 ・サイバーエージェント Calm2-7b(CyberAgentLM2-7B) 70億 ・rinna japanese-gpt-neox-3.6b-instruction-ppo 36億
Calm2-7bに質問してみた Q:AIによって私達の暮らしはどのように変わりますか。 A:1. 効率性の向上:AIは、データ分析、自動化された意思決定、プロセスの自動化を通じて、仕事の処理速度 を劇的に向上させることができます。これにより、生産性が向上し、より多くの業務をより短時間で完了できるよ うになります。 2. 新しいビジネスモデル:AIは、新しいビジネスモデルの構築や既存のモデルの改善に役立つ可能性がありま す。例えば、顧客の好みや需要に合わせて商品やサービスを提供する「カスタマージャーニー管理」や、AIを活 用した「自動化された接客」などです。
3. 病気の予防:AIは、病気の予防や特定に役立つ可能性があります。たとえば、健康状態を監視・検査するウェ アラブルデバイスや、病気のリスクを予測するアルゴリズムなどがあります。 4. 安全性とセキュリティの向上:AIは、様々なシステムやデバイスの安全性やセキュリティを向上させるために使 用できます。例えば、自動運転車の安全性向上や、顔認識技術を使用したセキュリティシステムの改善などが 挙げられます。 5. 人間の能力の拡張:AIは、人間の能力を高めることもできます。例えば、AIを搭載したロボットが、人間が作業 できない危険な環境や状況で活動する「人間拡張」が挙げられます。 これらは、AIが日常生活に与える影響のほんの一部です。AIの用途は今後も拡大し、社会や産業に影響を与え ていくでしょう。
まとめ ・ローカルPCに生成AIを構築してみた ・独自情報を入れて回答できるようにしたい ・(株)サイバーエージェントのopen-calm-7bはローカルPCでも動作可能 GeForce RTX 3060(12GB)で動作可能 https://qiita.com/yasusun/items/6418f5558ea9993b725b 一方で ・有料ではあるが独自情報に回答できるサービスあり(LangChainなど)
・テキストだけでなく画像や音声も扱えるようになりつつある