Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Difyで立ち向かう! 画像で分岐するワークフロー
Search
APC_鈴木健太
December 16, 2024
0
450
Difyで立ち向かう! 画像で分岐するワークフロー
APC_鈴木健太
December 16, 2024
Tweet
Share
Featured
See All Featured
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
830
Done Done
chrislema
185
16k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
Being A Developer After 40
akosma
90
590k
Code Reviewing Like a Champion
maltzj
525
40k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Site-Speed That Sticks
csswizardry
10
800
Visualization
eitanlees
147
16k
Unsuck your backbone
ammeep
671
58k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
Transcript
1 Difyで⽴ち向かう! 画像で分岐するワークフロー
自己紹介 2 所属: 株式会社エーピーコミュニケーションズ 名前: 鈴木 健太 普段の仕事: 生成AIアプリ/ワークフロー開発 趣味:
ストリートファイター6 (豪鬼使い)
お客様からよく受ける相談 「生成AIに画像を入れて使えるんでしょ? うちでもやってみたいんだよね。」 「テキストじゃなくて、画像・図面・グラフ でRAGやりたいんだけど、方法ってある?」 今日の話題
お客様からよく受ける相談 「生成AIに画像を入れて使えるんでしょ? うちでもやってみたいんだよね。」 「テキストじゃなくて、画像・図面・グラフ でRAGやりたいんだけど、方法ってある?」 今日の話題 Difyで立ち向かいました
アジェンダ 1.Difyってなに? 2.なんでDify? 3.作ったきっかけ 4.課題となったポイント 5.Difyで立ち向かう 6.まとめ
Difyってなに? 6 LangGenius, Inc.によって開発されたノーコードでLLMアプリを開発できる 生成AIプラットフォーム。 プログラミングの知識がなくてもAIアプリを簡単に作成でき、テキスト、 画像、音声など多様なデータ形式にも対応、複数のAIモデルを組み合わせて 利用できる。 オープンソースで提供されており、Freeプランなら無料で使えるため誰でも 使いやすいのが特徴。
なんで Dify? 7
なんで Dify? 8 最初に使ってたけど少し 分かりづらい、、、
なんで Dify? 9 簡単!分かりやすい!
作ったきっかけ お客様からよく受ける相談 「生成AIに画像を入れて使えるんでしょ? うちでもやってみたいんだよね。」 「テキストじゃなくて、画像・図面・グラフ でRAGやりたいんだけど、方法ってある?」
作った時のポイント(課題) 11 ・入力場所は1つにすること ・写真、図面、グラフなど複数の種類に対応 すること
実際に処理したもの 12
Difyで立ち向かう - 今回作ったもの - 13
Difyで立ち向かう - 処理フローの概要 - 14 1.画像とプロンプトを⼊⼒ 2.画像の種類を分類 3.分岐を設定 4.分岐に応じた回答を⽣成
Difyで立ち向かう - 処理フローの概要 - 1.画像とプロンプトを⼊⼒ 2.画像の種類を分類 3.分岐を設定 4.分岐に応じた回答を⽣成
Difyで立ち向かう –1.画像とプロンプトを入力 - ファイルアップロード 機能で画像を入力
17 1.画像とプロンプトを⼊⼒ 2.画像の種類を分類 3.分岐を設定 4.分岐に応じた回答を⽣成 Difyで立ち向かう - 処理フローの概要 -
Difyで立ち向かう –2.画像の種類を分類 - LLMを画像分類器と して利用
Difyで立ち向かう - 処理フローの概要 - 19 1.画像とプロンプトを⼊⼒ 2.画像の種類を分類 3.分岐を設定 4.分岐に応じた回答を⽣成
Difyで立ち向かう -3.分岐を設定 - 条件一致で分岐を設定
21 1.画像とプロンプトを⼊⼒ 2.画像の種類を分類 3.分岐を設定 4.分岐に応じた回答を⽣成 Difyで立ち向かう - 処理フローの概要 -
Difyで立ち向かう -4.分岐に応じた回答を生成 - 「グラフ」専用 のLLMを用意
Difyで立ち向かう - 今回作ったもの (再掲) - 23
Difyで立ち向かう - 実際の動作 (1/3) -
Difyで立ち向かう - 実際の動作 (2/3) -
Difyで立ち向かう - 実際の動作 (3/3) -
まとめ 27 ‧思った以上に柔軟に使えて⽤途が広い ‧使いやすく、技術者でないお客様にも喜ばれる ‧中国出⾝の⽅が開発者にいるサービスのためセキュア に厳しいお客様への導⼊提案はなかなか難しい 現在は jinbaflow などにも挑戦してます!